

Herramientas 可配置環境 de alto rendimiento

Accede a soluciones 可配置環境 que te ayudarán a completar tareas complejas con facilidad.

可配置環境

PommerLearn
Un marco de RL que ofrece herramientas de entrenamiento y evaluación de PPO, DQN para desarrollar agentes competitivos en el juego Pommerman.

0


0
Visitar IA
¿Qué es PommerLearn?
PommerLearn permite a investigadores y desarrolladores entrenar bots RL multi-agente en el entorno de juego Pommerman. Incluye implementaciones listas para usar de algoritmos populares (PPO, DQN), archivos de configuración flexibles para hiperparámetros, registro automático y visualización de métricas de entrenamiento, guardado de modelos y scripts de evaluación. Su arquitectura modular facilita la extensión con nuevos algoritmos, la personalización de entornos y la integración con bibliotecas ML estándar como PyTorch.
Características principales de PommerLearn

Implementación del algoritmo PPO

Implementación del algoritmo DQN

Envoltorios del entorno Pommerman

Hiperparámetros configurables

Integración de registro y TensorBoard

Control de puntos de control y guardado de modelos

Scripts de evaluación
Pits and Orbs
Pits and Orbs ofrece un entorno de mundo en una cuadrícula multi-agente donde los agentes AI evitan trampas, recogen orbes y compiten en escenarios por turnos.

0


0
Visitar IA
¿Qué es Pits and Orbs?
Pits and Orbs es un entorno de código abierto para aprendizaje por refuerzo, implementado en Python, que ofrece un mundo en una cuadrícula multi-agente por turnos donde los agentes persiguen objetivos y enfrentan peligros ambientales. Cada agente debe navegar en una cuadrícula ajustable, evitar trampas colocadas aleatoriamente que penalizan o terminan episodios, y recolectar orbes para recompensas positivas. El entorno soporta modos competitivos y cooperativos, permitiendo a investigadores explorar diversos escenarios de aprendizaje. Su API simple se integra perfectamente con bibliotecas RL populares como Stable Baselines o RLlib. Características principales incluyen dimensiones de cuadrícula ajustables, distribuciones dinámicas de trampas y orbes, estructuras de recompensa configurables y registro opcional para análisis del entrenamiento.
Características principales de Pits and Orbs



Destacados

Herramientas 可配置環境 de alto rendimiento

Accede a soluciones 可配置環境 que te ayudarán a completar tareas complejas con facilidad.

可配置環境

PommerLearn

Pits and Orbs