CityLearn bietet eine modulare Simulationsplattform für die Energieforschung mittels Verstärkungslernen. Benutzer können mehrzonenfähige Gebäudepakete, HVAC-Systeme, Speichereinheiten und erneuerbare Energiequellen definieren und RL-Agenten gegen Demand-Response-Ereignisse trainieren. Die Umgebung liefert Zustandsbeobachtungen wie Temperaturen, Lastprofile und Energiepreise, während Aktionen Setpoints und Speichersteuerung übernehmen. Eine flexible Belohnungs-API ermöglicht benutzerdefinierte Metriken—wie Kosteneinsparungen oder Emissionsreduktionen—and Logging-Tools unterstützen die Leistungsanalyse. CityLearn ist ideal für Benchmarking, Curriculum-Learning und die Entwicklung neuer Steuerungskonzepte in einem reproduzierbaren Forschungsrahmen.
CityLearn Hauptfunktionen
Konfigurierbare Multi-Zonen-Gebäude- und Mikrogrid-Simulation
Demand-Response-Ereignismodellierung
Anpassbare Belohnungsfunktion-API
Baseline-Agentenimplementierungen
Detaillierte Log- und Analysewerkzeuge
Verwaltung von Szenarien und Datensätzen
CityLearn Vor- und Nachteile
Nachteile
Primär auf Training und Simulation fokussiert, möglicherweise ist eine Integration mit tatsächlicher Robotik-Hardware für den Einsatz erforderlich.
Abhängig von der Verfügbarkeit qualitativ hochwertiger Datensätze für das Training realistischer Navigationspolitiken.
Keine Preis- oder kommerzielle Supportinformationen verfügbar.
Vorteile
Ermöglicht Training in großen, stadtausmaßigen, realen Umgebungen mit extremen Umweltveränderungen.
Verwendet kompakte bimodale Bilddarstellungen für probeeffizientes Lernen, wodurch die Trainingszeit im Vergleich zu Rohbildmethoden erheblich reduziert wird.
Unterstützt Generalisierung über Tag/Nacht- und Saisonübergänge hinweg, was die Robustheit der Navigationspolitiken verbessert.
Open Source mit öffentlich zugänglichem Code und Datensätzen.
JADE-DR-VPP ist ein Open-Source-Java-Framework, das ein Multi-Agenten-System für die Laststeuerung in virtuellen Kraftwerken (VPP) implementiert. Jeder Agent repräsentiert eine flexible Last- oder Erzeugungseinheit, die über JADE-Nachrichten kommuniziert. Das System orchestriert Laststeuerungsereignisse, plant Lastanpassungen und aggregiert Ressourcen, um Netzsignale zu erfüllen. Benutzer können das Verhalten der Agenten konfigurieren, Simulationen in großem Maßstab durchführen und Leistungsmetriken für Energiemanagementstrategien analysieren.