El Sistema de Recolección Autónoma de Residuos Multiagente es una plataforma basada en investigación que emplea aprendizaje por refuerzo multiagente para entrenar robots recolectores de residuos que colaboran en la planificación de rutas. Los agentes aprenden a evitar coberturas redundantes, minimizar la distancia de viaje y responder a patrones dinámicos de generación de residuos. Desarrollado en Python, el sistema integra un entorno de simulación para probar y perfeccionar políticas antes del despliegue en el mundo real. Los usuarios pueden configurar mapas, puntos de entrega, sensores de los agentes y estructuras de recompensas para adaptar el comportamiento a áreas urbanas específicas o restricciones operativas.