Un entorno de OpenAI Gym basado en Python que ofrece mundos de cuadrícula multicámara personalizables para la investigación sobre navegación y exploración de agentes de aprendizaje por refuerzo.
gym-multigrid ofrece una serie de entornos en cuadrícula personalizables diseñados para tareas de navegación y exploración en múltiples habitaciones en aprendizaje por refuerzo. Cada entorno consiste en habitaciones interconectadas pobladas de objetos, llaves, puertas y obstáculos. Los usuarios pueden ajustar programáticamente el tamaño de la cuadrícula, las configuraciones de las habitaciones y la colocación de objetos. La biblioteca soporta modos de observación completa o parcial, ofreciendo representaciones del estado en RGB o matriz. Las acciones incluyen movimiento, interacción con objetos y manipulación de puertas. Al integrarlo como entorno de Gym, los investigadores pueden aprovechar cualquier agente compatible con Gym para entrenar y evaluar algoritmos en tareas como rompecabezas de llaves y puertas, recuperación de objetos y planificación jerárquica. El diseño modular y las dependencias mínimas de gym-multigrid lo hacen ideal para evaluar nuevas estrategias de IA.
NavGround Learning proporciona una caja de herramientas completa para desarrollar y evaluar agentes de aprendizaje por refuerzo en tareas de navegación. Soporta simulaciones multi-agente, modelado de colisiones, y sensores y actuadores personalizables. Los usuarios pueden elegir entre plantillas de políticas predefinidas o implementar arquitecturas personalizadas, entrenar con algoritmos RL de última generación y visualizar métricas de rendimiento. Su integración con OpenAI Gym y Stable Baselines3 simplifica la gestión de experimentos, mientras que las herramientas de registro y visualización integradas permiten un análisis profundo del comportamiento del agente y la dinámica de entrenamiento.
Marco de trabajo de código abierto basado en PyTorch que implementa la arquitectura CommNet para el aprendizaje por refuerzo multiagente con comunicación entre agentes que permite decisiones colaborativas.
CommNet es una biblioteca orientada a la investigación que implementa la arquitectura CommNet, permitiendo que múltiples agentes compartan estados ocultos en cada paso temporal y aprendan a coordinar acciones en entornos cooperativos. Incluye definiciones de modelos en PyTorch, scripts de entrenamiento y evaluación, envoltorios para entornos OpenAI Gym y utilidades para personalizar canales de comunicación, conteo de agentes y profundidades de red. Investigadores y desarrolladores pueden usar CommNet para prototipar y evaluar estrategias de comunicación entre agentes en tareas de navegación, persecución-salvación y recolección de recursos.