

Iniciar Sesión

Herramientas 價值迭代 más usadas

Descubre por qué estas herramientas 價值迭代 son las favoritas de usuarios de todo el mundo.

價值迭代

Pacman AI
Un agente de aprendizaje por refuerzo de código abierto que aprende a jugar Pacman, optimizando estrategias de navegación y evitación de fantasmas.

0


0
Visitar IA
¿Qué es Pacman AI?
Pacman AI ofrece un entorno y un marco de agentes totalmente funcional en Python para el clásico juego de Pacman. El proyecto implementa algoritmos clave de aprendizaje por refuerzo—Q-learning e iteración de valores—para permitir que el agente aprenda políticas óptimas para la recolección de píldoras, navegación en laberintos y evasión de fantasmas. Los usuarios pueden definir funciones de recompensa personalizadas y ajustar hiperparámetros como la tasa de aprendizaje, factor de descuento y estrategia de exploración. El marco soporta registro de métricas, visualización del rendimiento y configuraciones reproducibles de experimentos. Está diseñado para facilitar su extensión, permitiendo a investigadores y estudiantes integrar nuevos algoritmos o enfoques de aprendizaje con redes neuronales y compararlos con métodos de cuadrícula tradicionales dentro del dominio de Pacman.
Características principales de Pacman AI

Implementación del algoritmo Q-learning

Agente de iteración de valores

Funciones de recompensa personalizables

Simulación del entorno para Pacman

Registro y visualización del rendimiento

Código modular para fácil extensión



Destacados