Multiagent-Prediction-Reward é uma estrutura orientada à pesquisa que integra modelos de previsão e mecanismos de distribuição de recompensas para aprendizado por reforço multiagente. Inclui wrappers de ambiente, módulos neurais para previsão de ações dos pares, e lógica de roteamento de recompensas personalizável que se adapta ao desempenho do agente. O repositório fornece arquivos de configuração, scripts de exemplo e painéis de avaliação para rodar experimentos em tarefas cooperativas. Usuários podem estender o código para testar novas funções de recompensa, integrar novos ambientes e comparar com algoritmos RL multiagente estabelecidos.