Outils investigación en aprendizaje automático faciles à utiliser

Sponsorisé par Qoder - Qoder est un assistant de codage propulsé par l'IA qui automatise la planification, le codage et les tests des projets logiciels.



Qoder - Qoder est un assistant de codage propulsé par l'IA qui automatise la planification, le codage et les tests des projets logiciels.





Actualités IA

Connexion

investigación en aprendizaje automático

MultiAgent-Systems-StarCraft2-PySC2-Raw
Une plateforme open-source d'apprentissage par renforcement multi-agent permettant un contrôle de niveau brut et la coordination dans StarCraft II via PySC2.

0


0
Visiter l'IA
Qu'est-ce que MultiAgent-Systems-StarCraft2-PySC2-Raw ?
MultiAgent-Systems-StarCraft2-PySC2-Raw fournit un kit complet pour le développement, l'entraînement et l'évaluation de multiples agents IA dans StarCraft II. Il expose des contrôles de bas niveau pour le déplacement d'unités, la visée et les capacités, tout en permettant une conception flexible de récompenses et de scénarios. Les utilisateurs peuvent facilement insérer des architectures neuronales personnalisées, définir des stratégies de coordination en équipe et enregistrer des métriques. Basé sur PySC2, il supporte l'entraînement en parallèle, la création de points de contrôle et la visualisation, ce qui en fait un outil idéal pour faire progresser la recherche en apprentissage par renforcement multi-agent coopératif et adversarial.
Fonctionnalités principales de MultiAgent-Systems-StarCraft2-PySC2-Raw

Contrôle de niveau brut des unités individuelles via PySC2

Configurations de scénarios multi-agent personnalisables

Façonnage de récompenses flexible et wrappers d'environnement

Journalisation, points de contrôle et visualisation des performances

Pipeline d'entraînement et d'évaluation en parallèle
multiagent_envs
Un cadre Python open-source proposant divers environnements d'apprentissage par renforcement multi-agent pour l'entraînement et le benchmarking d'agents AI.

0


0
Visiter l'IA
Qu'est-ce que multiagent_envs ?
multiagent_envs offre un ensemble modulaire d'environnements basés sur Python adaptés à la recherche et au développement en apprentissage par renforcement multi-agent. Il inclut des scénarios comme la navigation coopérative, la prédation, les dilemmes sociaux et des arènes compétitives. Chaque environnement permet de définir le nombre d'agents, les caractéristiques d'observation, les fonctions de récompense et la dynamique de collision. Le framework s'intègre facilement avec des bibliothèques RL populaires telles que Stable Baselines et RLlib, permettant des boucles d'entraînement vectorisées, une exécution parallèle et une journalisation facile. Les utilisateurs peuvent étendre des scénarios existants ou en créer de nouveaux via une API simple, accélérant l'expérimentation avec des algorithmes comme MADDPG, QMIX et PPO dans un environnement cohérent et reproductible.
Fonctionnalités principales de multiagent_envs
Cooperative Search Environment
Un environnement d'apprentissage par renforcement multi-agent basé sur Python pour des tâches de recherche coopérative avec communication et récompenses configurables.

0


0
Visiter l'IA
Qu'est-ce que Cooperative Search Environment ?
L'environnement de recherche coopérative fournit un environnement d'apprentissage par renforcement multi-agent flexible et compatible gym, adapté aux tâches de recherche coopérative dans des espaces en grille discrète et en espace continu. Les agents fonctionnent sous observabilité partielle et peuvent partager des informations en fonction de topologies de communication personnalisables. Le cadre supporte des scénarios prédéfinis tels que recherche et sauvetage, suivi de cibles dynamiques, et cartographie collaborative, avec des API pour définir des environnements et des structures de récompense personnalisés. Il s'intègre parfaitement avec des bibliothèques RL populaires comme Stable Baselines3 et Ray RLlib, inclut des utilitaires de journalisation pour l’analyse des performances, et offre des outils de visualisation en temps réel. Les chercheurs peuvent ajuster la taille de la grille, le nombre d'agents, la portée des capteurs et les mécanismes de partage des récompenses pour évaluer efficacement les stratégies de coordination et benchmarker de nouveaux algorithmes.
Fonctionnalités principales de Cooperative Search Environment



Vedettes

investigación en aprendizaje automático

MultiAgent-Systems-StarCraft2-PySC2-Raw

multiagent_envs

Cooperative Search Environment