Algorithmus-Benchmarking

  • Cadre PyTorch open-source pour systèmes multi-agent afin d'apprendre et analyser les protocoles de communication émergents dans des tâches d'apprentissage par renforcement coopératif.
    0
    0
    Qu'est-ce que Emergent Communication in Agents ?
    La Communication Émergente chez les Agents est un cadre PyTorch open-source conçu pour les chercheurs explorant comment les systèmes multi-agent développent leurs propres protocoles de communication. La bibliothèque offre des implémentations flexibles de tâches d'apprentissage par renforcement coopératif, y compris des jeux référentiels, des jeux combinatoires et des défis d'identification d'objets. Les utilisateurs définissent des architectures d'agents locuteurs et auditeurs, spécifient les propriétés des canaux de message comme la taille du vocabulaire et la longueur de la séquence, et sélectionnent des stratégies d'entraînement telles que les gradients de politique ou l'apprentissage supervisé. Le cadre comprend des scripts de bout en bout pour exécuter des expériences, analyser l'efficacité de communication et visualiser les langues émergentes. Sa conception modulaire facilite l'extension avec de nouveaux environnements de jeu ou des fonctions de perte personnalisées. Les chercheurs peuvent reproduire des études publiées, benchmarker de nouveaux algorithmes et explorer la compositionnalité et la sémantique des langues d'agents émergents.
    Fonctionnalités principales de Emergent Communication in Agents
    • Implémentations de jeux référentiels et combinatoires
    • Architectures d'agents locuteur-écouteur configurables
    • Canaux de message personnalisables (vocabulaire, longueur)
    • Prise en charge des gradients de politique et de l'apprentissage supervisé
    • Scripts d'entraînement et d’évaluation de bout en bout
    • Outils de visualisation pour les langues émergentes
    • Conception modulaire pour ajouter de nouveaux environnements
  • Une environnement RL simulant plusieurs agents mineurs coopératifs et compétitifs collectant des ressources dans un monde basé sur une grille pour l'apprentissage multi-agent.
    0
    0
    Qu'est-ce que Multi-Agent Miners ?
    Multi-Agent Miners offre un environnement de monde en grille où plusieurs agents mineurs autonomes naviguent, creusent et collectent des ressources tout en interagissant. Il supporte des tailles de carte configurables, le nombre d'agents et des structures de récompenses, permettant aux utilisateurs de créer des scénarios compétitifs ou coopératifs. Le framework s'intègre aux bibliothèques RL populaires via PettingZoo, fournissant des API standardisées pour les fonctions reset, step et render. Les modes de visualisation et le support de journalisation aident à analyser comportements et résultats, idéal pour la recherche, l'éducation et le benchmarking d'algorithmes en apprentissage par renforcement multi-agent.
  • Un environnement d'apprentissage par renforcement multi-agent basé sur Python pour des tâches de recherche coopérative avec communication et récompenses configurables.
    0
    0
    Qu'est-ce que Cooperative Search Environment ?
    L'environnement de recherche coopérative fournit un environnement d'apprentissage par renforcement multi-agent flexible et compatible gym, adapté aux tâches de recherche coopérative dans des espaces en grille discrète et en espace continu. Les agents fonctionnent sous observabilité partielle et peuvent partager des informations en fonction de topologies de communication personnalisables. Le cadre supporte des scénarios prédéfinis tels que recherche et sauvetage, suivi de cibles dynamiques, et cartographie collaborative, avec des API pour définir des environnements et des structures de récompense personnalisés. Il s'intègre parfaitement avec des bibliothèques RL populaires comme Stable Baselines3 et Ray RLlib, inclut des utilitaires de journalisation pour l’analyse des performances, et offre des outils de visualisation en temps réel. Les chercheurs peuvent ajuster la taille de la grille, le nombre d'agents, la portée des capteurs et les mécanismes de partage des récompenses pour évaluer efficacement les stratégies de coordination et benchmarker de nouveaux algorithmes.
Vedettes