RxAgent-Zoo utilise la programmation réactive avec RxPY pour simplifier le développement et l'expérimentation d'agents d'apprentissage par renforcement modulaires.
Au cœur, RxAgent-Zoo est un cadre RL réactif qui traite les événements de données provenant des environnements, des buffers de retransmission et des boucles d'entraînement comme des flux observables. Les utilisateurs peuvent enchaîner des opérateurs pour prétraiter les observations, mettre à jour les réseaux et journaliser les métriques de manière asynchrone. La bibliothèque offre une prise en charge des environnements parallèles, des planificateurs configurables et une intégration avec les benchmarks Gym et Atari populaires. Une API plug-and-play permet de remplacer facilement les composants d'agents, facilitant la recherche reproductible, l'expérimentation rapide et les flux de travail d'entraînement évolutifs.
Fonctionnalités principales de RxAgent-Zoo
Flux RL réactifs avec RxPY
Agents préimplémentés : DQN, PPO, A2C, DDPG
Exécution parallèle des environnements
Gestion asynchrone des flux de données
Intégration de la journalisation et de la surveillance intégrées