Heuristiques prioritaires efficaces MAPF (ePH-MAPF) calcule rapidement des chemins multi-agents sans collision dans des environnements complexes en utilisant la recherche incrémentielle et des heuristiques.
ePH-MAPF fournit un pipeline efficace pour calculer des chemins sans collision pour des dizaines à des centaines d'agents sur des cartes basées sur une grille. Il utilise des heuristiques prioritaires, des techniques de recherche incrémentielle et des métriques de coût personnalisables (Manhattan, Euclidéenne) pour équilibrer rapidité et qualité de la solution. Les utilisateurs peuvent choisir parmi différentes fonctions heuristiques, intégrer la bibliothèque dans des systèmes robotiques Python, et benchmarker la performance sur des scénarios MAPF standards. Le code est modulaire et bien documenté, permettant aux chercheurs et développeurs de l’étendre pour des obstacles dynamiques ou des environnements spécialisés.
Fonctionnalités principales de ePH-MAPF
Heuristiques prioritaires efficaces
Multiple fonctions heuristiques
Planification de parcours incrémentielle
Évitement des collisions
Evolutif jusqu’à des centaines d’agents
Implémentation modulaire en Python
Exemples d’intégration ROS
Avantages et inconvénients de ePH-MAPF
Inconvénients
Aucune information explicite sur les coûts ou le modèle de tarification n'est fournie.
Informations limitées sur le déploiement dans le monde réel ou les problèmes de scalabilité en dehors des environnements simulés.
Avantages
Améliore la coordination multi-agents grâce à des améliorations de communication sélective.
Résout efficacement les conflits et les impasses en utilisant des décisions basées sur la valeur Q prioritaire.
Combine des politiques neuronales avec des conseils experts d'agents uniques pour une navigation robuste.
Utilise une méthode d'ensemble pour échantillonner les meilleures solutions parmi plusieurs solveurs, améliorant les performances.
Code open source disponible facilitant la reproductibilité et la recherche ultérieure.
Une collection d'environnements de mondes en grille personnalisables compatibles avec OpenAI Gym pour le développement et le test d'algorithmes d'apprentissage par renforcement.
GridWorldEnvs propose une suite complète d'environnements de mondes en grille pour soutenir la conception, le test et la benchmarkisation des systèmes d'apprentissage par renforcement et multi-agents. Les utilisateurs peuvent facilement configurer les dimensions de la grille, les positions de départ des agents, les emplacements cibles, obstacles, structures de récompense et espaces d'actions. La bibliothèque inclut des modèles prêts à l'emploi tels que la navigation classique, l'évitement d'obstacles et les tâches coopératives, tout en permettant la définition de scénarios personnalisés via JSON ou classes Python. Une intégration transparente avec l'API OpenAI Gym permet d'appliquer directement des algorithmes RL standards. De plus, GridWorldEnvs supporte des expérimentations à agent unique ou multi-agents, des outils de journalisation et de visualisation pour le suivi des performances des agents.