MARFT es una caja de herramientas de código abierto para ajuste fino de agentes múltiples en aprendizaje por refuerzo (RL) para flujos de trabajo de IA colaborativa y optimización de modelos de lenguaje.
Tongui Agent proporciona una arquitectura modular para crear agentes de IA que puedan mantener el estado de la conversación, aprovechar herramientas externas y coordinar múltiples sub-agentes. Los desarrolladores configuran los backends LLM, definen acciones personalizadas y ajustan módulos de memoria para almacenar el contexto. El marco incluye un SDK, CLI y hooks middleware para observabilidad, facilitando su integración en aplicaciones web o Node.js. Los LLM soportados incluyen OpenAI, Azure OpenAI y modelos de código abierto.
DataEnvGym proporciona una colección de entornos modulares y personalizables construidos sobre la API Gym para facilitar la investigación en aprendizaje por refuerzo en dominios impulsados por datos. Los investigadores y ingenieros pueden seleccionar entre tareas integradas como limpieza de datos, ingeniería de características, programación por lotes y análisis en streaming. El marco soporta una integración perfecta con bibliotecas RL populares, métricas de evaluación estandarizadas y herramientas de registro para seguir el rendimiento de los agentes. Los usuarios pueden extender o combinar entornos para modelar pipelines de datos complejos y evaluar algoritmos bajo restricciones realistas.