modular codebase

mini-AlphaStar
Implémentation simplifiée de PyTorch d'AlphaStar, permettant l'entraînement d'un agent RL pour StarCraft II avec une architecture réseau modulaire et auto-jeu.

0


0
Visiter l'IA
Qu'est-ce que mini-AlphaStar ?
mini-AlphaStar démystifie l'architecture complexe d'AlphaStar en proposant un cadre PyTorch accessible et Open Source pour le développement d'IA dans StarCraft II. Il comprend des encodeurs de caractéristiques spatiales pour les entrées écran et minimap, un traitement des caractéristiques non spatiales, des modules de mémoire LSTM, et des réseaux de politique et de valeur séparés pour la sélection d'actions et l'évaluation d'état. En utilisant l'apprentissage par imitation pour démarrer et l'apprentissage par renforcement avec auto-jeu pour l'affinage, il supporte les wrappers d'environnement compatibles avec pysc2, la journalisation via TensorBoard et des hyperparamètres configurables. Les chercheurs et étudiants peuvent générer des jeux de données à partir de parties humaines, entraîner des modèles sur des scénarios personnalisés, évaluer la performance des agents et visualiser les courbes d'apprentissage. La base de code modulaire facilite l'expérimentation avec différentes variantes de réseaux, programmes d'entraînement et configurations multi-agents. Conçu pour l'éducation et le prototypage, et non pour le déploiement en production.
Fonctionnalités principales de mini-AlphaStar
Multi-Agent DDPG with PyTorch & Unity ML-Agents
Implémente l'apprentissage par renforcement multi-agent DDPG décentralisé utilisant PyTorch et Unity ML-Agents pour la formation collaborative des agents.

0


0
Visiter l'IA
Qu'est-ce que Multi-Agent DDPG with PyTorch & Unity ML-Agents ?
Ce projet open-source offre un cadre complet d'apprentissage par renforcement multi-agent basé sur PyTorch et Unity ML-Agents. Il propose des algorithmes DDPG décentralisés, des wrappers d'environnements et des scripts d'entraînement. Les utilisateurs peuvent configurer les politiques d'agents, les réseaux critiques, les buffers de relecture et les travailleurs d'entraînement parallèles. Les hooks de journalisation permettent la surveillance avec TensorBoard, tandis qu'une architecture modulaire supporte des fonctions de récompense et paramètres d'environnement personnalisés. Le dépôt inclut des scènes Unity d'exemple illustrant des tâches de navigation collaborative, idéal pour étendre et benchmarker des scénarios multi-agent en simulation.
Fonctionnalités principales de Multi-Agent DDPG with PyTorch & Unity ML-Agents
CommNet
Framework open-source basé sur PyTorch implémentant l'architecture CommNet pour l'apprentissage par renforcement multi-agent avec communication inter-agent permettant une prise de décision collaborative.

0


0
Visiter l'IA
Qu'est-ce que CommNet ?
CommNet est une bibliothèque orientée recherche qui implémente l'architecture CommNet, permettant à plusieurs agents de partager des états cachés à chaque étape et d'apprendre à coordonner leurs actions dans des environnements coopératifs. Elle inclut des définitions de modèles PyTorch, des scripts d'entraînement et d'évaluation, des wrappers d'environnement pour OpenAI Gym et des utilitaires pour personnaliser les canaux de communication, le nombre d'agents et la profondeur du réseau. Chercheurs et développeurs peuvent utiliser CommNet pour prototyper et benchmarker des stratégies de communication inter-agent sur des tâches de navigation, de poursuite–évasion et de collecte de ressources.
Fonctionnalités principales de CommNet
Agentic App Template
Le modèle d'application Agentic facilite les applications Next.js avec des agents IA multi-étapes intégrés pour Q&R, génération de texte et récupération de connaissances.

0


0
Visiter l'IA
Qu'est-ce que Agentic App Template ?
Le modèle d'application Agentic est un projet Next.js entièrement configuré qui sert de fondation pour le développement d'applications agentiques pilotées par IA. Il intègre une structure de dossiers modulaire, la gestion des variables d'environnement et des workflows d'agents exemples utilisant les modèles GPT d'OpenAI et des bases de données vectorielles comme Pinecone. Le modèle démontre des modèles clés tels que des chaînes séquentielles multi-étapes, des agents Q&R conversationnels et des endpoints de génération de texte. Les développeurs peuvent facilement personnaliser la logique des chaînes, intégrer des services supplémentaires et déployer sur des plateformes comme Vercel ou Netlify. Avec une prise en charge de TypeScript et une gestion des erreurs intégrée, la scaffolding réduit le temps de configuration initiale et fournit une documentation claire pour de futures extensions.
Fonctionnalités principales de Agentic App Template