Herramientas approximation de la valeur Q de alto rendimiento

Accede a soluciones approximation de la valeur Q que te ayudarán a completar tareas complejas con facilidad.

approximation de la valeur Q

  • Agente de Deep Q-Network basado en TensorFlow de código abierto que aprende a jugar Atari Breakout usando repetición de experiencias y redes objetivo.
    0
    0
    ¿Qué es DQN-Deep-Q-Network-Atari-Breakout-TensorFlow?
    DQN-Deep-Q-Network-Atari-Breakout-TensorFlow proporciona una implementación completa del algoritmo DQN adaptada para el entorno Atari Breakout. Utiliza una red neuronal convolucional para aproximar valores Q, aplica repetición de experiencias para romper correlaciones entre observaciones secuenciales y emplea una red objetivo actualizada periódicamente para estabilizar el entrenamiento. El agente sigue una política epsilon-greedy para la exploración y puede entrenarse desde cero con entrada de píxeles en bruto. El repositorio incluye archivos de configuración, scripts de entrenamiento para monitorear el crecimiento de recompensas, scripts de evaluación para probar modelos entrenados y utilidades TensorBoard para visualizar métricas de entrenamiento. Los usuarios pueden ajustar hiperparámetros como tasa de aprendizaje, tamaño del buffer de repetición y tamaño de lotes para experimentar con diferentes configuraciones.
Destacados