Une plateforme PyTorch permettant aux agents d'apprendre des protocoles de communication émergents dans des tâches d'apprentissage par renforcement multi-agent.
Ce dépôt implémente la communication émergente dans l'apprentissage par renforcement multi-agent avec PyTorch. Les utilisateurs peuvent configurer des réseaux neuronaux pour l'émetteur et le récepteur afin de jouer à des jeux référentiels ou à une navigation coopérative, encourageant les agents à développer un canal de communication discret ou continu. Il fournit des scripts pour l'entraînement, l'évaluation et la visualisation des protocoles appris, ainsi que des utilitaires pour la création d'environnements, le codage et le décodage des messages. Les chercheurs peuvent l'étendre avec des tâches personnalisées, modifier les architectures de réseau et analyser l'efficacité des protocoles, favorisant des expérimentations rapides dans la communication d'agents émergents.
Fonctionnalités principales de Learning-to-Communicate-PyTorch
Implémentation du jeu de communication référentielle
Support pour la navigation coopérative
Architectures modulaires de réseaux PyTorch
Canaux de messages discrets et continus
Scripts pour entraînement, évaluation et visualisation
Une implémentation basée sur Keras de Multi-Agent Deep Deterministic Policy Gradient pour l'apprentissage par renforcement multi-agent coopératif et compétitif.
MADDPG-Keras offre un cadre complet pour la recherche en apprentissage par renforcement multi-agent en implémentant l'algorithme MADDPG dans Keras. Il supporte les espaces d'actions continues, plusieurs agents et les environnements standard d'OpenAI Gym. Les chercheurs et développeurs peuvent configurer les architectures de réseaux neuronaux, les hyperparamètres d'entraînement et les fonctions de récompense, puis lancer des expériences avec des journaux intégrés et un enregistrement des modèles pour accélérer l'apprentissage des politiques multi-agent.
L'application Science permet aux utilisateurs d'analyser n'importe quelle affirmation avec des preuves soutenant et s'opposant provenant de recherches scientifiques examinées par des pairs. En utilisant l'IA pour rechercher des articles scientifiques, elle relie directement les utilisateurs aux sources, fournissant une analyse équilibrée de la force des preuves et du consensus scientifique. La plateforme est conçue pour aider les chercheurs à rationaliser leur processus de revue de littérature tout en offrant au grand public accès à des informations basées sur des preuves dans un format accessible.