Un marco de agentes en Python de código abierto que utiliza razonamiento en cadena para resolver laberintos de manera dinámica a través de planificación guiada por LLM.
El marco LLM Maze Agent proporciona un entorno basado en Python para construir agentes inteligentes capaces de navegar laberintos de cuadrícula utilizando grandes modelos de lenguaje. Al combinar interfaces modulares de entorno con plantillas de prompting en cadena de pensamiento y planificación heurística, el agente consulta iterativamente a un LLM para decidir las direcciones de movimiento, adaptarse a obstáculos y actualizar su representación del estado interno. La compatibilidad lista para usar con modelos de OpenAI y Hugging Face permite una integración sin problemas, mientras que la generación de laberintos configurable y la depuración paso a paso facilitan la experimentación con diferentes estrategias. Los investigadores pueden ajustar funciones de recompensa, definir espacios de observación personalizados y visualizar rutas del agente para analizar procesos de razonamiento. Este diseño hace que LLM Maze Agent sea una herramienta versátil para evaluar la planificación basada en LLM, enseñar conceptos de IA y comparar el rendimiento de los modelos en tareas de razonamiento espacial.
Pacman AI ofrece un entorno y un marco de agentes totalmente funcional en Python para el clásico juego de Pacman. El proyecto implementa algoritmos clave de aprendizaje por refuerzo—Q-learning e iteración de valores—para permitir que el agente aprenda políticas óptimas para la recolección de píldoras, navegación en laberintos y evasión de fantasmas. Los usuarios pueden definir funciones de recompensa personalizadas y ajustar hiperparámetros como la tasa de aprendizaje, factor de descuento y estrategia de exploración. El marco soporta registro de métricas, visualización del rendimiento y configuraciones reproducibles de experimentos. Está diseñado para facilitar su extensión, permitiendo a investigadores y estudiantes integrar nuevos algoritmos o enfoques de aprendizaje con redes neuronales y compararlos con métodos de cuadrícula tradicionales dentro del dominio de Pacman.