Algorithmus-Benchmarking

  • Estrutura PyTorch de código aberto para sistemas multiagentes aprenderem e analisarem protocolos de comunicação emergentes em tarefas cooperativas de aprendizagem por reforço.
    0
    0
    O que é Emergent Communication in Agents?
    Comunicação Emergente em Agentes é uma estrutura de PyTorch de código aberto projetada para pesquisadores explorarem como sistemas multiagentes desenvolvem seus próprios protocolos de comunicação. A biblioteca oferece implementações flexíveis de tarefas de aprendizagem por reforço cooperativa, incluindo jogos referenciais, jogos de combinação e desafios de identificação de objetos. Os usuários definem arquiteturas de agentes falantes e ouvintes, especificam propriedades do canal de mensagem como tamanho do vocabulário e comprimento da sequência, e selecionam estratégias de treinamento como gradientes de política ou aprendizagem supervisionada. A estrutura inclui scripts ponta a ponta para executar experimentos, analisar eficiência de comunicação e visualizar línguas emergentes. Seu design modular permite fácil extensão com novos ambientes de jogo ou funções de perda personalizadas. Pesquisadores podem reproduzir estudos publicados, avaliar novos algoritmos e explorar a composicionalidade e semântica das línguas emergentes dos agentes.
    Recursos Principais do Emergent Communication in Agents
    • Implementações de jogos referenciais e de combinação
    • Arquiteturas de agentes falantes e ouvintes configuráveis
    • Canais de mensagem personalizáveis (vocabulário, comprimento)
    • Suporte para gradientes de política e aprendizagem supervisionada
    • Scripts de treinamento e avaliação de ponta a ponta
    • Ferramentas de visualização de línguas emergentes
    • Design modular para adicionar novos ambientes
  • Um ambiente RL que simula múltiplos agentes mineradores cooperativos e competitivos coletando recursos em um mundo baseado em grade para aprendizado multiagente.
    0
    0
    O que é Multi-Agent Miners?
    Multi-Agent Miners oferece um ambiente de mundo em grade onde múltiplos agentes mineradores autônomos navegam, cavando e coletando recursos enquanto interagem entre si. Suporta tamanhos de mapa configuráveis, contagem de agentes e estruturas de recompensa, permitindo criar cenários competitivos ou cooperativos. O framework integra-se com bibliotecas populares de RL via PettingZoo, fornecendo APIs padronizadas para funções de reset, passo e renderização. Modos de visualização e suporte à registro ajudam na análise de comportamentos e resultados, tornando-o ideal para pesquisa, educação e avaliação de algoritmos em aprendizado por reforço multiagente.
  • Um ambiente de aprendizado por reforço multiagente baseado em Python para tarefas de busca cooperativa com comunicação e recompensas configuráveis.
    0
    0
    O que é Cooperative Search Environment?
    O Ambiente de Busca Cooperativa fornece um ambiente de aprendizado por reforço multiagente flexível e compatível com gym, projetado para tarefas de busca cooperativa tanto em ambientes de grade discreta quanto em espaços contínuos. Os agentes operam sob observabilidade parcial e podem compartilhar informações com base em topologias de comunicação personalizáveis. O framework suporta cenários predefinidos como busca e resgate, rastreamento de alvos dinâmicos e mapeamento colaborativo, com APIs para definir ambientes e estruturas de recompensa personalizadas. Integra-se facilmente com bibliotecas de RL populares como Stable Baselines3 e Ray RLlib, inclui utilitários de registro para análise de desempenho e oferece ferramentas de visualização integradas para monitoramento em tempo real. Pesquisadores podem ajustar tamanhos de grade, contagem de agentes, alcances de sensores e mecanismos de compartilhamento de recompensas para avaliar estratégias de coordenação e testar novos algoritmos de forma eficaz.
Em Destaque