MAPF_G2RL ist ein Open-Source-Forschungsframework, das Graphentheorie und Deep Reinforcement Learning verbindet, um das Multi-Agenten-Pfadfindungsproblem (MAPF) zu lösen. Es kodiert Knoten und Kanten in Vektor-Repräsentationen, definiert räumliche und kollisionsbewusste Belohnungsfunktionen und unterstützt verschiedene RL-Algorithmen wie DQN, PPO und A2C. Das Framework automatisiert die Szenarien-Erstellung durch die Generierung zufälliger Graphen oder den Import realer Karten und steuert Trainingsschleifen, die Politiken für mehrere Agenten gleichzeitig optimieren. Nach dem Lernen werden die Agenten in simulierten Umgebungen bewertet, um Pfadeffizienz, Make-span und Erfolgsraten zu messen. Das modulare Design ermöglicht es Forschern, Kernkomponenten zu erweitern, neue MARL-Techniken zu integrieren und mit klassischen Lösungsansätzen zu benchmarken.