Herramientas 價值迭代 más usadas

Descubre por qué estas herramientas 價值迭代 son las favoritas de usuarios de todo el mundo.

價值迭代

  • Un agente de aprendizaje por refuerzo de código abierto que aprende a jugar Pacman, optimizando estrategias de navegación y evitación de fantasmas.
    0
    0
    ¿Qué es Pacman AI?
    Pacman AI ofrece un entorno y un marco de agentes totalmente funcional en Python para el clásico juego de Pacman. El proyecto implementa algoritmos clave de aprendizaje por refuerzo—Q-learning e iteración de valores—para permitir que el agente aprenda políticas óptimas para la recolección de píldoras, navegación en laberintos y evasión de fantasmas. Los usuarios pueden definir funciones de recompensa personalizadas y ajustar hiperparámetros como la tasa de aprendizaje, factor de descuento y estrategia de exploración. El marco soporta registro de métricas, visualización del rendimiento y configuraciones reproducibles de experimentos. Está diseñado para facilitar su extensión, permitiendo a investigadores y estudiantes integrar nuevos algoritmos o enfoques de aprendizaje con redes neuronales y compararlos con métodos de cuadrícula tradicionales dentro del dominio de Pacman.
    Características principales de Pacman AI
    • Implementación del algoritmo Q-learning
    • Agente de iteración de valores
    • Funciones de recompensa personalizables
    • Simulación del entorno para Pacman
    • Registro y visualización del rendimiento
    • Código modular para fácil extensión
Destacados