Un marco de código abierto basado en múltiples agentes con aprendizaje por refuerzo para el control cooperativo de vehículos autónomos en escenarios de tráfico.
AutoDRIVE Cooperative MARL es un marco de código abierto diseñado para entrenar y desplegar políticas de aprendizaje por refuerzo multiactores cooperativos para tareas de conducción autónoma. Se integra con simuladores realistas para modelar escenarios de tráfico como intersecciones, formación de convoy en autopistas y escenarios de fusión. El marco implementa entrenamiento centralizado con ejecución descentralizada, permitiendo que los vehículos aprendan políticas compartidas que maximicen la eficiencia y seguridad del tráfico global. Los usuarios pueden configurar parámetros del entorno, escoger algoritmos MARL de referencia, visualizar el progreso del entrenamiento y evaluar la coordinación de los agentes.
Características principales de AutoDRIVE Cooperative MARL
Entrenamiento centralizado con ejecución descentralizada
El entorno de búsqueda cooperativa proporciona un entorno de aprendizaje por refuerzo multiagente flexible y compatible con gym, diseñado para tareas de búsqueda cooperativa en espacios en cuadrícula discretos y continuos. Los agentes operan bajo observabilidad parcial y pueden compartir información basándose en topologías de comunicación personalizables. El marco soporta escenarios predefinidos como búsqueda y rescate, seguimiento de objetivos dinámicos y mapeo colaborativo, con API para definir entornos personalizados y estructuras de recompensa. Se integra a la perfección con bibliotecas RL populares como Stable Baselines3 y Ray RLlib, incluye utilidades de registro para análisis de rendimiento y herramientas de visualización integradas para monitoreo en tiempo real. Los investigadores pueden ajustar tamaños de cuadrículas, conteo de agentes, rangos de sensores y mecanismos de compartición de recompensas para evaluar estrategias de coordinación y probar nuevos algoritmos de manera efectiva.
Características principales de Cooperative Search Environment