Outils カスタマイズ可能な報酬関数 simples et intuitifs

Explorez des solutions カスタマイズ可能な報酬関数 conviviales, conçues pour simplifier vos projets et améliorer vos performances.

カスタマイズ可能な報酬関数

  • MAPF_G2RL est un cadre Python entraînant des agents d'apprentissage par renforcement profond pour la recherche de chemin multi-agents efficace sur des graphes.
    0
    0
    Qu'est-ce que MAPF_G2RL ?
    MAPF_G2RL est un cadre de recherche open-source qui relie la théorie des graphes et l'apprentissage par renforcement profond pour résoudre le problème de recherche de chemin multi-agents (MAPF). Il encode les nœuds et les arêtes en représentations vectorielles, définit des fonctions de récompense spatiales et sensibles aux collisions, et supporte divers algorithmes RL tels que DQN, PPO et A2C. Le cadre automatise la création de scénarios en générant des graphes aléatoires ou en important des cartes du monde réel, et orchestre des boucles d'entraînement qui optimisent simultanément les politiques pour plusieurs agents. Après apprentissage, les agents sont évalués dans des environnements simulés pour mesurer l'optimalité des chemins, le temps de sortie et les taux de réussite. Sa conception modulaire permet aux chercheurs d'étendre ses composants, d'intégrer de nouvelles techniques MARL et de benchmarker contre des solveurs classiques.
    Fonctionnalités principales de MAPF_G2RL
    • Encodage et prétraitement du graphe
    • Modules de modulation des récompenses personnalisables
    • Support pour les algorithmes DQN, PPO, A2C
    • Générateur de scénarios pour cartes aléatoires et réelles
    • Pipelines d'entraînement et d'évaluation multi-agents
    • Outils de journalisation et de visualisation des performances
  • gym-fx fournit un environnement OpenAI Gym personnalisable pour former et évaluer des agents d'apprentissage par renforcement pour les stratégies de trading Forex.
    0
    0
    Qu'est-ce que gym-fx ?
    gym-fx est une bibliothèque Python open-source qui implémente un environnement de trading Forex simulé utilisant l'interface OpenAI Gym. Elle offre un support pour plusieurs paires de devises, l'intégration de flux de prix historiques, des indicateurs techniques et des fonctions de récompense entièrement personnalisables. En fournissant une API normalisée, gym-fx simplifie le benchmarking et le développement d'algorithmes d'apprentissage par renforcement pour le trading algorithmique. Les utilisateurs peuvent configurer le glissement de marché, les coûts de transaction et les espaces d'observation pour reproduire de près des scénarios de trading en direct, facilitant le développement et l'évaluation de stratégies robustes.
Vedettes