Una implementación basada en Keras de Multi-Agent Deep Deterministic Policy Gradient para aprendizaje por refuerzo multiagente cooperativo y competitivo.
MADDPG-Keras ofrece un marco completo para la investigación en aprendizaje por refuerzo multiagente al implementar el algoritmo MADDPG en Keras. Admite espacios de acción continuos, múltiples agentes y entornos estándar de OpenAI Gym. Los investigadores y desarrolladores pueden configurar arquitecturas de redes neuronales, hiperparámetros de entrenamiento y funciones de recompensa, luego lanzar experimentos con registros integrados y puntos de control para acelerar el aprendizaje de políticas multiagente y la evaluación comparativa.
Características principales de MADDPG-Keras
Implementación en Keras & TensorFlow de MADDPG
Soporte para espacios de acción continuos
Entornos Gym multiagente configurables
Registro, integración con tensorboard, y puntos de control