Открытая среда обучения с подкреплением с открытым исходным кодом для оптимизации управления энергопотреблением в зданиях, контроля микросетей и стратегий реагирования на спрос.
CityLearn предоставляет модульную платформу моделирования для исследований в области управления энергией с использованием обучения с подкреплением. Пользователи могут определить многозональные группы зданий, настроить системы HVAC, аккумуляторы и возобновляемые источники энергии, затем обучать агентов RL на основе событий реагирования на спрос. Среда отображает наблюдения состояния, такие как температуры, профили нагрузки и цены энергии, в то время как действия управляют установками и диспетчеризацией хранения. Гибкий API наград позволяет использовать индивидуальные метрики — такие как экономия затрат или сокращение выбросов — а инструменты ведения журналов поддерживают анализ эффективности. CityLearn идеально подходит для сравнения алгоритмов, обучения по учебной программе и разработки новых стратегий управления в воспроизводимой исследовательской среде.
Основные функции CityLearn
Настраиваемое моделирование групп зданий и микросетей
Моделирование событий реагирования на спроса
Настраиваемый API функции награды
Реализации базовых агентов
Подробные инструменты логирования и анализа
Управление сценариями и наборами данных
Плюсы и минусы CityLearn
Минусы
В первую очередь ориентирован на обучение и симуляцию, может потребоваться интеграция с реальным робототехническим оборудованием для развертывания.
Зависит от доступности высококачественных наборов данных для обучения реалистичной навигационной политики.
Информация о ценах или коммерческой поддержке отсутствует.
Плюсы
Обеспечивает обучение в больших реальных городских условиях с экстремальными изменениями окружающей среды.
Использует компактные бимодальные изображения для эффективного обучения на выборках, значительно сокращая время обучения по сравнению с методами обработки исходных изображений.
Поддерживает обобщение в переходах день/ночь и сезонов, повышая устойчивость навигационной политики.
Открытый исходный код с общедоступными кодами и наборами данных.
LLM Arena — это универсальная платформа, созданная для сравнения различных крупных языковых моделей. Пользователи могут проводить детальные оценки на основе производственных метрик, пользовательского опыта и общей эффективности. Платформа предоставляет захватывающие визуализации, подчеркивающие сильные и слабые стороны, что позволяет пользователям принимать обоснованные решения для своих AI-потребностей. Поощряя сообщество сравнений, она поддерживает совместные усилия в понимании AI-технологий, в конечном итоге стремясь продвинуть область искусственного интеллекта.
Реализация Multi-Agent Deep Deterministic Policy Gradient на базе Keras для кооперативного и соревновательного многопроAgentного обучения с подкреплением.
MADDPG-Keras обеспечивает полный каркас для исследований в области обучения с подкреплением с несколькими агентами, реализуя алгоритм MADDPG в Keras. Поддерживаются непрерывные пространства действий, несколько агентов и стандартные среды OpenAI Gym. Исследователи и разработчики могут настраивать архитектуры нейронных сетей, гиперпараметры обучения и функции вознаграждения, после чего запускать эксперименты с встроенным логированием и контрольными точками для ускорения обучения политик и оценки производительности.