RxAgent-Zoo utiliza programación reactiva con RxPY para simplificar el desarrollo y la experimentación con agentes modulares de aprendizaje por refuerzo.
En su núcleo, RxAgent-Zoo es un framework RL reactivo que trata eventos de datos de entornos, buffers de repetición y bucles de entrenamiento como flujos observables. Los usuarios pueden encadenar operadores para preprocesar observaciones, actualizar redes y registrar métricas de manera asíncrona. La biblioteca ofrece soporte para entornos paralelos, planificadores configurables y la integración con los estándares de Gym y Atari. Una API de plug-and-play permite cambiar componentes de agentes sin problemas, facilitando la investigación reproducible, la experimentación rápida y flujos de trabajo de entrenamiento escalables.
Vanilla Agents es un marco liviano basado en PyTorch que proporciona implementaciones modulares y extensibles de agentes de aprendizaje por refuerzo fundamentales. Soporta algoritmos como DQN, Double DQN, PPO y A2C, con envoltorios de entorno en plug-in compatibles con OpenAI Gym. Los usuarios pueden configurar hiperparámetros, registrar métricas de entrenamiento, guardar puntos de control y visualizar curvas de aprendizaje. La base de código está organizada para la claridad, siendo ideal para prototipado de investigación, uso educativo y benchmarking de nuevas ideas en RL.