Outils обертки среды simples et intuitifs

Explorez des solutions обертки среды conviviales, conçues pour simplifier vos projets et améliorer vos performances.

обертки среды

  • Implémente l'apprentissage par renforcement multi-agent DDPG décentralisé utilisant PyTorch et Unity ML-Agents pour la formation collaborative des agents.
    0
    0
    Qu'est-ce que Multi-Agent DDPG with PyTorch & Unity ML-Agents ?
    Ce projet open-source offre un cadre complet d'apprentissage par renforcement multi-agent basé sur PyTorch et Unity ML-Agents. Il propose des algorithmes DDPG décentralisés, des wrappers d'environnements et des scripts d'entraînement. Les utilisateurs peuvent configurer les politiques d'agents, les réseaux critiques, les buffers de relecture et les travailleurs d'entraînement parallèles. Les hooks de journalisation permettent la surveillance avec TensorBoard, tandis qu'une architecture modulaire supporte des fonctions de récompense et paramètres d'environnement personnalisés. Le dépôt inclut des scènes Unity d'exemple illustrant des tâches de navigation collaborative, idéal pour étendre et benchmarker des scénarios multi-agent en simulation.
    Fonctionnalités principales de Multi-Agent DDPG with PyTorch & Unity ML-Agents
    • Implémentation décentralisée de DDPG multi-agent
    • Intégration avec Unity ML-Agents
    • Hyperparamètres et fonctions de récompense personnalisables
    • Journalisation et visualisation avec TensorBoard
    • Scènes Unity d'exemple pour tâches collaboratives
  • Acme est un cadre d'apprentissage par renforcement modulaire offrant des composants d'agents réutilisables et des pipelines d'entraînement distribués efficaces.
    0
    0
    Qu'est-ce que Acme ?
    Acme est un framework basé sur Python qui simplifie le développement et l'évaluation d'agents d'apprentissage par renforcement. Il propose une collection d'implémentations d'agents préconstruites (par exemple, DQN, PPO, SAC), des enveloppes d'environnement, des tampons de répétition et des moteurs d'exécution distribués. Les chercheurs peuvent combiner et ajuster les composants pour prototyper de nouveaux algorithmes, surveiller les métriques d'entraînement avec la journalisation intégrée et exploiter des pipelines distribués évolutifs pour de large experiments. Acme s'intègre avec TensorFlow et JAX, prend en charge des environnements personnalisés via OpenAI Gym interfaces, et inclut des utilitaires pour la sauvegarde, l'évaluation et la configuration des hyperparamètres.
Vedettes