Outils estrutura PyTorch simples et intuitifs

Explorez des solutions estrutura PyTorch conviviales, conçues pour simplifier vos projets et améliorer vos performances.

estrutura PyTorch

  • Une plateforme PyTorch permettant aux agents d'apprendre des protocoles de communication émergents dans des tâches d'apprentissage par renforcement multi-agent.
    0
    0
    Qu'est-ce que Learning-to-Communicate-PyTorch ?
    Ce dépôt implémente la communication émergente dans l'apprentissage par renforcement multi-agent avec PyTorch. Les utilisateurs peuvent configurer des réseaux neuronaux pour l'émetteur et le récepteur afin de jouer à des jeux référentiels ou à une navigation coopérative, encourageant les agents à développer un canal de communication discret ou continu. Il fournit des scripts pour l'entraînement, l'évaluation et la visualisation des protocoles appris, ainsi que des utilitaires pour la création d'environnements, le codage et le décodage des messages. Les chercheurs peuvent l'étendre avec des tâches personnalisées, modifier les architectures de réseau et analyser l'efficacité des protocoles, favorisant des expérimentations rapides dans la communication d'agents émergents.
  • Implémente l'apprentissage par renforcement multi-agent DDPG décentralisé utilisant PyTorch et Unity ML-Agents pour la formation collaborative des agents.
    0
    0
    Qu'est-ce que Multi-Agent DDPG with PyTorch & Unity ML-Agents ?
    Ce projet open-source offre un cadre complet d'apprentissage par renforcement multi-agent basé sur PyTorch et Unity ML-Agents. Il propose des algorithmes DDPG décentralisés, des wrappers d'environnements et des scripts d'entraînement. Les utilisateurs peuvent configurer les politiques d'agents, les réseaux critiques, les buffers de relecture et les travailleurs d'entraînement parallèles. Les hooks de journalisation permettent la surveillance avec TensorBoard, tandis qu'une architecture modulaire supporte des fonctions de récompense et paramètres d'environnement personnalisés. Le dépôt inclut des scènes Unity d'exemple illustrant des tâches de navigation collaborative, idéal pour étendre et benchmarker des scénarios multi-agent en simulation.
Vedettes