Открытая среда обучения с подкреплением с открытым исходным кодом для оптимизации управления энергопотреблением в зданиях, контроля микросетей и стратегий реагирования на спрос.
CityLearn предоставляет модульную платформу моделирования для исследований в области управления энергией с использованием обучения с подкреплением. Пользователи могут определить многозональные группы зданий, настроить системы HVAC, аккумуляторы и возобновляемые источники энергии, затем обучать агентов RL на основе событий реагирования на спрос. Среда отображает наблюдения состояния, такие как температуры, профили нагрузки и цены энергии, в то время как действия управляют установками и диспетчеризацией хранения. Гибкий API наград позволяет использовать индивидуальные метрики — такие как экономия затрат или сокращение выбросов — а инструменты ведения журналов поддерживают анализ эффективности. CityLearn идеально подходит для сравнения алгоритмов, обучения по учебной программе и разработки новых стратегий управления в воспроизводимой исследовательской среде.
Основные функции CityLearn
Настраиваемое моделирование групп зданий и микросетей
Моделирование событий реагирования на спроса
Настраиваемый API функции награды
Реализации базовых агентов
Подробные инструменты логирования и анализа
Управление сценариями и наборами данных
Плюсы и минусы CityLearn
Минусы
В первую очередь ориентирован на обучение и симуляцию, может потребоваться интеграция с реальным робототехническим оборудованием для развертывания.
Зависит от доступности высококачественных наборов данных для обучения реалистичной навигационной политики.
Информация о ценах или коммерческой поддержке отсутствует.
Плюсы
Обеспечивает обучение в больших реальных городских условиях с экстремальными изменениями окружающей среды.
Использует компактные бимодальные изображения для эффективного обучения на выборках, значительно сокращая время обучения по сравнению с методами обработки исходных изображений.
Поддерживает обобщение в переходах день/ночь и сезонов, повышая устойчивость навигационной политики.
Открытый исходный код с общедоступными кодами и наборами данных.