Outils algorithmes MARL simples et intuitifs

Explorez des solutions algorithmes MARL conviviales, conçues pour simplifier vos projets et améliorer vos performances.

algorithmes MARL

  • VMAS est un cadre MARL modulaire permettant une simulation et un entraînement de environnements multi-agents accélérés par GPU avec des algorithmes intégrés.
    0
    0
    Qu'est-ce que VMAS ?
    VMAS est une boîte à outils complète pour construire et entraîner des systèmes multi-agents utilisant l'apprentissage par renforcement profond. Il supporte la simulation parallèle sur GPU de centaines d'instances d'environnement, permettant une collecte de données à haut débit et un entraînement évolutif. VMAS inclut des implémentations des algorithmes MARL populaires tels que PPO, MADDPG, QMIX et COMA, avec des interfaces modulaires pour la politique et l'environnement pour une prototypage rapide. Le cadre facilite la formation centralisée avec exécution décentralisée (CTDE), propose une personnalisation du façonnage des récompenses, des espaces d'observation et des hooks de rappel pour la journalisation et la visualisation. Avec sa conception modulaire, VMAS s'intègre parfaitement avec les modèles PyTorch et les environnements externes, ce qui en fait un choix idéal pour la recherche dans les tâches coopératives, compétitives et à motivations mixtes en robotique, gestion du trafic, allocation des ressources et scénarios d'IA de jeux.
  • Un cadre d'apprentissage par renforcement multi-agent open-source pour la conduite autonome coopérative en scénarios de trafic.
    0
    0
    Qu'est-ce que AutoDRIVE Cooperative MARL ?
    AutoDRIVE Cooperative MARL est un cadre open-source conçu pour entraîner et déployer des politiques d'apprentissage par renforcement multi-agent coopératif (MARL) pour des tâches de conduite autonome. Il s'intègre avec des simulateurs réalistes pour modéliser des scénarios de trafic tels que les intersections, le convoi sur autoroute et la fusion. Le cadre implémente une formation centralisée avec une exécution décentralisée, permettant aux véhicules d'apprendre des politiques partagées pour maximiser l'efficacité et la sécurité globales du trafic. Les utilisateurs peuvent configurer les paramètres de l’environnement, choisir parmi des algorithmes MARL de base, visualiser la progression de l'apprentissage et évaluer la coordination des agents.
Vedettes