Herramientas 強化學習演算法 potentes para cualquier tarea

Patrocinado por Qoder - Qoder es un asistente de codificación impulsado por IA que automatiza la planificación, la codificación y las pruebas para proyectos de software.



Qoder - Qoder es un asistente de codificación impulsado por IA que automatiza la planificación, la codificación y las pruebas para proyectos de software.





Noticias de IA

Iniciar Sesión

強化學習演算法

PommerLearn
Un marco de RL que ofrece herramientas de entrenamiento y evaluación de PPO, DQN para desarrollar agentes competitivos en el juego Pommerman.

0


0
Visitar IA
¿Qué es PommerLearn?
PommerLearn permite a investigadores y desarrolladores entrenar bots RL multi-agente en el entorno de juego Pommerman. Incluye implementaciones listas para usar de algoritmos populares (PPO, DQN), archivos de configuración flexibles para hiperparámetros, registro automático y visualización de métricas de entrenamiento, guardado de modelos y scripts de evaluación. Su arquitectura modular facilita la extensión con nuevos algoritmos, la personalización de entornos y la integración con bibliotecas ML estándar como PyTorch.
Características principales de PommerLearn

Implementación del algoritmo PPO

Implementación del algoritmo DQN

Envoltorios del entorno Pommerman

Hiperparámetros configurables

Integración de registro y TensorBoard

Control de puntos de control y guardado de modelos

Scripts de evaluación
MultiAgent-ReinforcementLearning
Framework de código abierto en Python que implementa algoritmos de aprendizaje por refuerzo multiagente para entornos cooperativos y competitivos.

0


0
Visitar IA
¿Qué es MultiAgent-ReinforcementLearning?
Este repositorio proporciona una suite completa de algoritmos de aprendizaje por refuerzo multiagente, incluyendo MADDPG, DDPG, PPO y más, integrados con benchmarks estándar como el Entorno de Partículas Multi-Agente y OpenAI Gym. Incluye wrappers de entornos personalizables, scripts de entrenamiento configurables, registro en tiempo real y métricas de evaluación del rendimiento. Los usuarios pueden ampliar fácilmente los algoritmos, adaptarlos a tareas personalizadas y comparar políticas en entornos cooperativos y adversarios con mínima configuración.
Características principales de MultiAgent-ReinforcementLearning



Destacados

強化學習演算法

PommerLearn

MultiAgent-ReinforcementLearning