Herramientas 구성 가능한 환경 potentes para cualquier tarea

Patrocinado por Qoder - Qoder es un asistente de codificación impulsado por IA que automatiza la planificación, la codificación y las pruebas para proyectos de software.



Qoder - Qoder es un asistente de codificación impulsado por IA que automatiza la planificación, la codificación y las pruebas para proyectos de software.





Noticias de IA

Iniciar Sesión

구성 가능한 환경

Pits and Orbs
Pits and Orbs ofrece un entorno de mundo en una cuadrícula multi-agente donde los agentes AI evitan trampas, recogen orbes y compiten en escenarios por turnos.

0


0
Visitar IA
¿Qué es Pits and Orbs?
Pits and Orbs es un entorno de código abierto para aprendizaje por refuerzo, implementado en Python, que ofrece un mundo en una cuadrícula multi-agente por turnos donde los agentes persiguen objetivos y enfrentan peligros ambientales. Cada agente debe navegar en una cuadrícula ajustable, evitar trampas colocadas aleatoriamente que penalizan o terminan episodios, y recolectar orbes para recompensas positivas. El entorno soporta modos competitivos y cooperativos, permitiendo a investigadores explorar diversos escenarios de aprendizaje. Su API simple se integra perfectamente con bibliotecas RL populares como Stable Baselines o RLlib. Características principales incluyen dimensiones de cuadrícula ajustables, distribuciones dinámicas de trampas y orbes, estructuras de recompensa configurables y registro opcional para análisis del entrenamiento.
Características principales de Pits and Orbs

Simulación de mundo en cuadrícula multi-agente por turnos

Tamaños y diseños de cuadrícula personalizables

Peligros de trampas aleatorias y recompensas de orbes

Soporte para modos competitivos y cooperativos

API compatible con Gym sencilla

Opciones de registro y renderizado de episodios
PommerLearn
Un marco de RL que ofrece herramientas de entrenamiento y evaluación de PPO, DQN para desarrollar agentes competitivos en el juego Pommerman.

0


0
Visitar IA
¿Qué es PommerLearn?
PommerLearn permite a investigadores y desarrolladores entrenar bots RL multi-agente en el entorno de juego Pommerman. Incluye implementaciones listas para usar de algoritmos populares (PPO, DQN), archivos de configuración flexibles para hiperparámetros, registro automático y visualización de métricas de entrenamiento, guardado de modelos y scripts de evaluación. Su arquitectura modular facilita la extensión con nuevos algoritmos, la personalización de entornos y la integración con bibliotecas ML estándar como PyTorch.
Características principales de PommerLearn



Destacados

구성 가능한 환경

Pits and Orbs

PommerLearn