Herramientas TensorBoard-Visualisierung potentes para cualquier tarea

TensorBoard-Visualisierung

mini-AlphaStar
Implementación simplificada en PyTorch de AlphaStar, que permite entrenar un agente RL para StarCraft II con arquitectura de red modular y auto-juego.

0


0
Visitar IA
¿Qué es mini-AlphaStar?
mini-AlphaStar desmitifica la arquitectura compleja de AlphaStar ofreciendo un marco accesible y de código abierto en PyTorch para el desarrollo de IA en StarCraft II. Incluye codificadores de características espaciales para entradas de pantalla y minimapa, procesamiento de características no espaciales, módulos de memoria LSTM, y redes separadas de política y valor para la selección de acciones y evaluación del estado. Utiliza aprendizaje por imitación para comenzar y aprendizaje por refuerzo con auto-juego para afinar, soporta wrappers de entorno compatibles con pysc2, registro con TensorBoard y hiperparámetros configurables. Investigadores y estudiantes pueden generar conjuntos de datos a partir de partidas humanas, entrenar modelos en escenarios personalizados, evaluar el rendimiento del agente y visualizar curvas de aprendizaje. La base modular del código facilita experimentar con variantes de redes, programas de entrenamiento y configuraciones multi-agente. Diseñado para educación y prototipado, no para despliegue en producción.
Características principales de mini-AlphaStar

Codificación de características espaciales y no espaciales

Módulos de memoria LSTM

Redes separadas de política y valor

Pipeline de aprendizaje por imitación y por refuerzo

Wrappers de entorno para auto-juego vía pysc2

Registro y visualización en TensorBoard

Hiperparámetros configurables

Código modular en PyTorch
Multi-Agent DDPG with PyTorch & Unity ML-Agents
Implementa aprendizaje por refuerzo multi-agente DDPG descentralizado usando PyTorch y Unity ML-Agents para entrenamiento colaborativo de agentes.

0


0
Visitar IA
¿Qué es Multi-Agent DDPG with PyTorch & Unity ML-Agents?
Este proyecto de código abierto brinda un marco completo de aprendizaje por refuerzo multi-agente construido sobre PyTorch y Unity ML-Agents. Incluye algoritmos DDPG descentralizados, envoltorios de entornos y scripts de entrenamiento. Los usuarios pueden configurar políticas de agentes, redes críticas, buffers de reproducción y trabajadores de entrenamiento en paralelo. Los hooks de registro permiten monitoreo con TensorBoard, mientras que una estructura modular soporta funciones de recompensa y parámetros de entorno personalizables. El repositorio incluye escenas de ejemplo en Unity demostrando tareas de navegación colaborativa, ideal para ampliar y evaluar escenarios multi-agente en simulaciones.
Características principales de Multi-Agent DDPG with PyTorch & Unity ML-Agents
Vanilla Agents
Vanilla Agents proporciona implementaciones listas para usar de agentes RL DQN, PPO y A2C con pipelines de entrenamiento personalizables.

0


0
Visitar IA
¿Qué es Vanilla Agents?
Vanilla Agents es un marco liviano basado en PyTorch que proporciona implementaciones modulares y extensibles de agentes de aprendizaje por refuerzo fundamentales. Soporta algoritmos como DQN, Double DQN, PPO y A2C, con envoltorios de entorno en plug-in compatibles con OpenAI Gym. Los usuarios pueden configurar hiperparámetros, registrar métricas de entrenamiento, guardar puntos de control y visualizar curvas de aprendizaje. La base de código está organizada para la claridad, siendo ideal para prototipado de investigación, uso educativo y benchmarking de nuevas ideas en RL.
Características principales de Vanilla Agents

TensorBoard-Visualisierung

mini-AlphaStar

Multi-Agent DDPG with PyTorch & Unity ML-Agents

Vanilla Agents

Herramientas TensorBoard-Visualisierung de alto rendimiento

Accede a soluciones TensorBoard-Visualisierung que te ayudarán a completar tareas complejas con facilidad.