Outils ускорение на GPU simples et intuitifs

Explorez des solutions ускорение на GPU conviviales, conçues pour simplifier vos projets et améliorer vos performances.

ускорение на GPU

  • MAPF_G2RL est un cadre Python entraînant des agents d'apprentissage par renforcement profond pour la recherche de chemin multi-agents efficace sur des graphes.
    0
    0
    Qu'est-ce que MAPF_G2RL ?
    MAPF_G2RL est un cadre de recherche open-source qui relie la théorie des graphes et l'apprentissage par renforcement profond pour résoudre le problème de recherche de chemin multi-agents (MAPF). Il encode les nœuds et les arêtes en représentations vectorielles, définit des fonctions de récompense spatiales et sensibles aux collisions, et supporte divers algorithmes RL tels que DQN, PPO et A2C. Le cadre automatise la création de scénarios en générant des graphes aléatoires ou en important des cartes du monde réel, et orchestre des boucles d'entraînement qui optimisent simultanément les politiques pour plusieurs agents. Après apprentissage, les agents sont évalués dans des environnements simulés pour mesurer l'optimalité des chemins, le temps de sortie et les taux de réussite. Sa conception modulaire permet aux chercheurs d'étendre ses composants, d'intégrer de nouvelles techniques MARL et de benchmarker contre des solveurs classiques.
  • Une implémentation basée sur Keras de Multi-Agent Deep Deterministic Policy Gradient pour l'apprentissage par renforcement multi-agent coopératif et compétitif.
    0
    0
    Qu'est-ce que MADDPG-Keras ?
    MADDPG-Keras offre un cadre complet pour la recherche en apprentissage par renforcement multi-agent en implémentant l'algorithme MADDPG dans Keras. Il supporte les espaces d'actions continues, plusieurs agents et les environnements standard d'OpenAI Gym. Les chercheurs et développeurs peuvent configurer les architectures de réseaux neuronaux, les hyperparamètres d'entraînement et les fonctions de récompense, puis lancer des expériences avec des journaux intégrés et un enregistrement des modèles pour accélérer l'apprentissage des politiques multi-agent.
Vedettes