Multiagent-Prediction-Reward es un marco orientado a la investigación que integra modelos de predicción y mecanismos de distribución de recompensas para el aprendizaje por refuerzo multi-agente. Incluye envoltorios para entornos, módulos neuronales para prever las acciones de compañeros y lógica de enrutamiento de recompensas personalizable que se adapta al rendimiento de los agentes. El repositorio ofrece archivos de configuración, scripts de ejemplo y paneles de evaluación para ejecutar experimentos en tareas cooperativas. Los usuarios pueden ampliar el código para probar funciones de recompensa novedosas, integrar nuevos entornos y evaluar en comparación con algoritmos RL multi-agente establecidos.