Le système de collecte autonome des déchets multi-agent est une plateforme basée sur la recherche qui utilise l'apprentissage par renforcement multi-agent pour entraîner des robots de collecte des déchets individuels à collaborer dans la planification des itinéraires. Les agents apprennent à éviter la couverture redondante, à minimiser la distance de déplacement et à répondre aux motifs de génération de déchets dynamiques. Construit en Python, le système intègre un environnement de simulation pour tester et affiner les politiques avant déploiement réel. Les utilisateurs peuvent configurer des cartes, des points de dépôt de déchets, des capteurs d'agents et des structures de récompenses pour adapter le comportement à des zones urbaines ou contraintes opérationnelles spécifiques.