MARFT ist ein Open-Source-Toolkit für Multi-Agenten-Reinforcement-Learning (RL) zur Feinabstimmung für kollaborative KI-Workflows und Optimierung von Sprachmodellen.
Tongui Agent stellt eine modulare Architektur bereit, mit der KI-Agenten erstellt werden können, die Gesprächszustände aufrechterhalten, externe Tools nutzen und mehrere Sub-Agenten koordinieren. Entwickler konfigurieren LLM-Backends, definieren benutzerdefinierte Aktionen und hängen Speicher-Module an, um den Kontext zu speichern. Das Framework umfasst ein SDK, CLI und Middleware-Hooks für Beobachtbarkeit, um die Integration in Web- oder Node.js-Anwendungen zu erleichtern. Unterstützte LLMs sind OpenAI, Azure OpenAI und Open-Source-Modelle.
DataEnvGym liefert eine Sammlung modularer, anpassbarer Umgebungen, die auf der Gym-API basieren und die Forschung im Bereich Verstärkendes Lernen in datengetriebenen Domänen erleichtern. Forscher und Ingenieure können aus integrierten Aufgaben wie Datenreinigung, Feature-Engineering, Batch-Planung und Streaming-Analytics wählen. Das Framework unterstützt nahtlose Integration mit beliebten RL-Bibliotheken, standardisierte Benchmarking-Metriken und Logging-Tools zur Verfolgung der Leistung der Agenten. Benutzer können Umgebungen erweitern oder kombinieren, um komplexe Datenpipelines zu modellieren und Algorithmen unter realistischen Bedingungen zu evaluieren.