Herramientas реализация DQN potentes para cualquier tarea

Patrocinado por Elser AI - Estudio web todo‑en‑uno que convierte texto e imágenes en arte estilo anime, personajes, voces y cortometrajes.



Elser AI - Estudio web todo‑en‑uno que convierte texto e imágenes en arte estilo anime, personajes, voces y cortometrajes.





Noticias de IA

Iniciar Sesión

реализация DQN

RL-Agents
Biblioteca de código abierto con PyTorch que proporciona implementaciones modulares de agentes de aprendizaje por refuerzo como DQN, PPO, SAC y más.

0


0
Visitar IA
¿Qué es RL-Agents?
RL-Agents es un framework de aprendizaje por refuerzo de nivel investigación construido sobre PyTorch que agrupa algoritmos RL populares en métodos basados en valor, política y actor-crítico. La biblioteca cuenta con una API modular de agentes, aceleración por GPU, integración fluida con OpenAI Gym y herramientas integradas de registro y visualización. Los usuarios pueden configurar hiperparámetros, personalizar bucles de entrenamiento y evaluar el rendimiento con pocas líneas de código, haciendo de RL-Agents una opción ideal para investigación académica, prototipado y experimentación industrial.
Características principales de RL-Agents

Implementaciones de DQN, DDQN, PPO, A2C, SAC, TD3

API modular y extensible para agentes

Aceleración GPU con PyTorch

Integración con entornos OpenAI Gym

Soporte integrado para registros y visualización
YGO-Agent
Un agente RL de código abierto para duelos de Yu-Gi-Oh, que proporciona simulación de entorno, entrenamiento de políticas y optimización de estrategias.

0


0
Visitar IA
¿Qué es YGO-Agent?
El marco YGO-Agent permite a investigadores y entusiastas desarrollar bots de IA que juegan al juego de cartas Yu-Gi-Oh usando aprendizaje por refuerzo. Envuelve el simulador YGOPRO en un entorno compatible con OpenAI Gym, definiendo representaciones de estado como mano, campo y puntos de vida, así como representaciones de acción que incluyen invocaciones, activación de hechizos/trampas y ataques. Las recompensas se basan en resultados de victoria/derrota, daño causado y progreso del juego. La arquitectura del agente usa PyTorch para implementar DQN, con opciones para arquitecturas de red personalizadas, reproducción de experiencia y exploración epsilon-greedy. Los módulos de registro registran curvas de entrenamiento, tasas de victoria y registros detallados de movimientos para análisis. El marco es modular, permitiendo a los usuarios reemplazar o extender componentes como la función de recompensa o el espacio de acción.
Características principales de YGO-Agent



Destacados

реализация DQN

RL-Agents

YGO-Agent