CityLearn proporciona una plataforma de simulación modular para la investigación en gestión energética usando aprendizaje por refuerzo. Los usuarios pueden definir agrupaciones de edificios multi-zona, configurar sistemas HVAC, unidades de almacenamiento y fuentes renovables, y luego entrenar agentes RL frente a eventos de respuesta a la demanda. El entorno expone observaciones de estado como temperaturas, perfiles de carga y precios de energía, mientras que las acciones controlan puntos de consigna y despachos de almacenamiento. Una API de recompensas flexible permite métricas personalizadas, como ahorros en costos o reducción de emisiones, y las utilidades de registro soportan análisis de rendimiento. CityLearn es ideal para benchmarking, aprendizaje por currículo y desarrollo de nuevas estrategias de control en un marco de investigación reproducible.