MARL-DPP implementa aprendizado por reforço multiagente com diversidade via Processos de Pontos Determinantes para incentivar políticas coordenadas variadas.
MARL-DPP é uma estrutura de código aberto que permite aprendizado por reforço multiagente (MARL) com diversidade garantida através de Processos de Pontos Determinantes (DPP). Abordagens tradicionais de MARL frequentemente sofrem de convergência de políticas para comportamentos semelhantes; MARL-DPP aborda isso incorporando medidas baseadas em DPP para encorajar os agentes a manter distribuições de ações diversas. O kit de ferramentas fornece código modular para incorporar DPP nos objetivos de treinamento, amostragem de políticas e gerenciamento de exploração. Inclui integração pronta para uso com ambientes padrão do OpenAI Gym e do Ambiente de Partículas Multiagente (MPE), além de utilitários para gerenciamento de hiperparâmetros, registro e visualização de métricas de diversidade. Pesquisadores podem avaliar o impacto de restrições de diversidade em tarefas cooperativas, alocação de recursos e jogos competitivos. O design extensível suporta ambientes personalizados e algoritmos avançados, facilitando a exploração de variantes do MARL-DPP.
O que é Reinforcement Learning Agents for PettingZoo Games?
Agentes de Aprendizado por Reforço para Jogos PettingZoo é uma biblioteca de código Python que entrega algoritmos prontos de DQN, PPO e A2C para aprendizado por reforço multiagente nos ambientes PettingZoo. Possui scripts padronizados de treinamento e avaliação, hiperparâmetros configuráveis, registro integrado no TensorBoard e suporte tanto para jogos competitivos quanto cooperativos. Pesquisadores e desenvolvedores podem clonar o repositório, ajustar os parâmetros do ambiente e do algoritmo, executar sessões de treinamento e visualizar métricas para avaliar e iterar rapidamente suas experiências em RL multiagente.
Recursos Principais do Reinforcement Learning Agents for PettingZoo Games