Outils modulare Codebasis simples et intuitifs

Explorez des solutions modulare Codebasis conviviales, conçues pour simplifier vos projets et améliorer vos performances.

modulare Codebasis

  • Implémentation simplifiée de PyTorch d'AlphaStar, permettant l'entraînement d'un agent RL pour StarCraft II avec une architecture réseau modulaire et auto-jeu.
    0
    0
    Qu'est-ce que mini-AlphaStar ?
    mini-AlphaStar démystifie l'architecture complexe d'AlphaStar en proposant un cadre PyTorch accessible et Open Source pour le développement d'IA dans StarCraft II. Il comprend des encodeurs de caractéristiques spatiales pour les entrées écran et minimap, un traitement des caractéristiques non spatiales, des modules de mémoire LSTM, et des réseaux de politique et de valeur séparés pour la sélection d'actions et l'évaluation d'état. En utilisant l'apprentissage par imitation pour démarrer et l'apprentissage par renforcement avec auto-jeu pour l'affinage, il supporte les wrappers d'environnement compatibles avec pysc2, la journalisation via TensorBoard et des hyperparamètres configurables. Les chercheurs et étudiants peuvent générer des jeux de données à partir de parties humaines, entraîner des modèles sur des scénarios personnalisés, évaluer la performance des agents et visualiser les courbes d'apprentissage. La base de code modulaire facilite l'expérimentation avec différentes variantes de réseaux, programmes d'entraînement et configurations multi-agents. Conçu pour l'éducation et le prototypage, et non pour le déploiement en production.
  • Framework open-source basé sur PyTorch implémentant l'architecture CommNet pour l'apprentissage par renforcement multi-agent avec communication inter-agent permettant une prise de décision collaborative.
    0
    0
    Qu'est-ce que CommNet ?
    CommNet est une bibliothèque orientée recherche qui implémente l'architecture CommNet, permettant à plusieurs agents de partager des états cachés à chaque étape et d'apprendre à coordonner leurs actions dans des environnements coopératifs. Elle inclut des définitions de modèles PyTorch, des scripts d'entraînement et d'évaluation, des wrappers d'environnement pour OpenAI Gym et des utilitaires pour personnaliser les canaux de communication, le nombre d'agents et la profondeur du réseau. Chercheurs et développeurs peuvent utiliser CommNet pour prototyper et benchmarker des stratégies de communication inter-agent sur des tâches de navigation, de poursuite–évasion et de collecte de ressources.
Vedettes