Outils 自訂獎勵函數 simples et intuitifs

Explorez des solutions 自訂獎勵函數 conviviales, conçues pour simplifier vos projets et améliorer vos performances.

自訂獎勵函數

  • Un agent d'apprentissage par renforcement en source ouverte utilisant PPO pour entraîner et jouer à StarCraft II via l'environnement PySC2 de DeepMind.
    0
    0
    Qu'est-ce que StarCraft II Reinforcement Learning Agent ?
    Ce dépôt fournit un cadre complet d'apprentissage par renforcement pour la recherche sur le gameplay de StarCraft II. L'agent principal utilise la Proximal Policy Optimization (PPO) pour apprendre des réseaux de politiques interprétant les données d'observation de l'environnement PySC2 et générant des actions précises dans le jeu. Les développeurs peuvent configurer les couches de réseaux neuronaux, la reformulation des récompenses et les plannings d'entraînement pour optimiser la performance. Le système supporte la collecte d'échantillons en multiprocessing pour plus d'efficacité, des outils de journalisation pour suivre les courbes d'entraînement, et des scripts d'évaluation pour tester les politiques entraînées contre des adversaires scriptés ou IA intégrée. Le code est écrit en Python et utilise TensorFlow pour la définition et l'optimisation des modèles. Les utilisateurs peuvent étendre des composants tels que les fonctions de récompense personnalisées, le pré-traitement des états ou les architectures de réseaux pour répondre à leurs objectifs de recherche spécifiques.
    Fonctionnalités principales de StarCraft II Reinforcement Learning Agent
    • Entraînement de politique basé sur PPO dans l’environnement SC2
    • Intégration avec PySC2 de DeepMind pour la gestion des états/actions
    • Architectures de réseaux neuronaux et récompenses configurables
    • Support multiprocessing pour la collecte parallèle d’échantillons
    • Journalisation et intégration avec TensorBoard
    • Scripts d’évaluation pour le benchmarking des agents
  • Gym-Recsys fournit des environnements OpenAI Gym personnalisables pour une formation évolutive et une évaluation des agents de recommandation par apprentissage par renforcement
    0
    0
    Qu'est-ce que Gym-Recsys ?
    Gym-Recsys est une boîte à outils qui encapsule des tâches de recommandation dans des environnements OpenAI Gym, permettant aux algorithmes d'apprentissage par renforcement d'interagir étape par étape avec des matrices utilisateur-élément simulées. Il fournit des générateurs de comportements utilisateur synthétiques, supporte le chargement de datasets populaires et livre des métriques standard comme Precision@K et NDCG. Les utilisateurs peuvent personnaliser les fonctions de récompense, les modèles utilisateur et les pools d’objets pour expérimenter différentes stratégies de recommandation RL de manière reproductible.
Vedettes