Outils 協調学習 simples et intuitifs

Explorez des solutions 協調学習 conviviales, conçues pour simplifier vos projets et améliorer vos performances.

協調学習

  • MARL-DPP implémente l'apprentissage par renforcement multi-agent avec diversité via des processus déterminants pour encourager des politiques coordonnées variées.
    0
    0
    Qu'est-ce que MARL-DPP ?
    MARL-DPP est un cadre open-source permettant l'apprentissage par renforcement multi-agent (MARL) avec diversité imposée via des processus déterminants (DPP). Les approches MARL traditionnelles souffrent souvent d'une convergence des politiques vers des comportements similaires ; MARL-DPP y remédie en intégrant des mesures basées sur le DPP pour encourager les agents à conserver des distributions d'actions diversifiées. La boîte à outils fournit un code modulaire pour intégrer le DPP dans les objectifs d'entraînement, l’échantillonnage de politiques et la gestion de l’exploration. Elle inclut une intégration prête à l’emploi avec des environnements standard comme OpenAI Gym et l’environnement multi-agent Particle (MPE), ainsi que des utilitaires pour la gestion des hyperparamètres, la journalisation et la visualisation des métriques de diversité. Les chercheurs peuvent évaluer l’impact des contraintes de diversité sur des tâches coopératives, l’allocation des ressources et les jeux compétitifs. La conception extensible prend en charge des environnements personnalisés et des algorithmes avancés, facilitant l’exploration de nouvelles variantes de MARL-DPP.
    Fonctionnalités principales de MARL-DPP
    • Module de diversité basé sur DPP
    • Intégration avec OpenAI Gym
    • Support pour les environnements MPE
    • Scripts d'entraînement et d’évaluation
    • Visualisation des métriques de diversité
  • Une plateforme open-source d'apprentissage par renforcement multi-agent permettant un contrôle de niveau brut et la coordination dans StarCraft II via PySC2.
    0
    0
    Qu'est-ce que MultiAgent-Systems-StarCraft2-PySC2-Raw ?
    MultiAgent-Systems-StarCraft2-PySC2-Raw fournit un kit complet pour le développement, l'entraînement et l'évaluation de multiples agents IA dans StarCraft II. Il expose des contrôles de bas niveau pour le déplacement d'unités, la visée et les capacités, tout en permettant une conception flexible de récompenses et de scénarios. Les utilisateurs peuvent facilement insérer des architectures neuronales personnalisées, définir des stratégies de coordination en équipe et enregistrer des métriques. Basé sur PySC2, il supporte l'entraînement en parallèle, la création de points de contrôle et la visualisation, ce qui en fait un outil idéal pour faire progresser la recherche en apprentissage par renforcement multi-agent coopératif et adversarial.
Vedettes