Herramientas Hyperparameter-Anpassung más usadas

Descubre por qué estas herramientas Hyperparameter-Anpassung son las favoritas de usuarios de todo el mundo.

Hyperparameter-Anpassung

  • Un marco de RL que ofrece herramientas de entrenamiento y evaluación de PPO, DQN para desarrollar agentes competitivos en el juego Pommerman.
    0
    0
    ¿Qué es PommerLearn?
    PommerLearn permite a investigadores y desarrolladores entrenar bots RL multi-agente en el entorno de juego Pommerman. Incluye implementaciones listas para usar de algoritmos populares (PPO, DQN), archivos de configuración flexibles para hiperparámetros, registro automático y visualización de métricas de entrenamiento, guardado de modelos y scripts de evaluación. Su arquitectura modular facilita la extensión con nuevos algoritmos, la personalización de entornos y la integración con bibliotecas ML estándar como PyTorch.
  • Vanilla Agents proporciona implementaciones listas para usar de agentes RL DQN, PPO y A2C con pipelines de entrenamiento personalizables.
    0
    0
    ¿Qué es Vanilla Agents?
    Vanilla Agents es un marco liviano basado en PyTorch que proporciona implementaciones modulares y extensibles de agentes de aprendizaje por refuerzo fundamentales. Soporta algoritmos como DQN, Double DQN, PPO y A2C, con envoltorios de entorno en plug-in compatibles con OpenAI Gym. Los usuarios pueden configurar hiperparámetros, registrar métricas de entrenamiento, guardar puntos de control y visualizar curvas de aprendizaje. La base de código está organizada para la claridad, siendo ideal para prototipado de investigación, uso educativo y benchmarking de nuevas ideas en RL.
Destacados