Dieses Repository stellt eine vollständige Suite von Multi-Agenten-Verstärkungslernalgorithmen bereit, einschließlich MADDPG, DDPG, PPO und mehr, integriert mit Standardbenchmarks wie der Multi-Agent Particle Environment und OpenAI Gym. Es bietet anpassbare Environment-Wraps, konfigurierbare Trainingsskripte, Echtzeit-Logging und Leistungsbewertungsmetriken. Benutzer können Algorithmen leicht erweitern, an individuelle Aufgaben anpassen und Politiken in kooperativen und adversären Umgebungen mit minimalem Aufwand vergleichen.
MultiAgent-ReinforcementLearning Hauptfunktionen
Implementierungen von MADDPG, DDPG, PPO
Environment-Wraps für Multi-Agent Particle und Gym
Eine Open-Source-Python-Framework, das die Gestaltung, das Training und die Bewertung von kooperativen und wettbewerbsorientierten Multi-Agenten-Verstärkungslernen-Systemen ermöglicht.
MultiAgentSystems wurde entwickelt, um den Prozess des Aufbaus und der Bewertung von Multi-Agenten-Verstärkungslern-Anwendungen (MARL) zu vereinfachen. Die Plattform umfasst Implementierungen modernster Algorithmen wie MADDPG, QMIX, VDN sowie zentrale Schulung mit dezentraler Ausführung. Es bietet modulare Umgebungs-Wrapper, die mit OpenAI Gym kompatibel sind, Kommunikationsprotokolle für die Interaktion von Agenten sowie Protokollierungsfunktionen zur Verfolgung von Metriken wie Belohnungsformung und Konvergenzraten. Forscher können Agentenarchitekturen anpassen, Hyperparameter abstimmen und Szenarien wie kooperative Navigation, Ressourcenallokation und Adversarial-Spiele simulieren. Mit integrierter Unterstützung für PyTorch, GPU-Beschleunigung und TensorBoard-Integration beschleunigt MultiAgentSystems Experimente und Benchmarking in kollaborativen und wettbewerbsorientierten Multi-Agenten-Bereichen.
AutoDRIVE Cooperative MARL ist ein auf GitHub gehostetes Framework, das den AutoDRIVE-Stadtverkehrssimulator mit anpassbaren Multi-Agenten-Verstärkendem Lernen-Algorithmen kombiniert. Es beinhaltet Trainingsskripte, Umwelt-Wrapper, Bewertungsmessungen und Visualisierungstools zur Entwicklung und Benchmarking kooperativer Fahrstrategien. Nutzer können Beobachtungsräume der Agenten, Belohnungsfunktionen und Traininghyperparameter konfigurieren. Das Repository unterstützt modulare Erweiterungen, die benutzerdefinierte Aufgaben, Curriculum-Learning und Leistungsüberwachung für die Forschung zur Koordination autonomer Fahrzeuge ermöglichen.