Herramientas 구성 가능한 환경 de alto rendimiento

Accede a soluciones 구성 가능한 환경 que te ayudarán a completar tareas complejas con facilidad.

구성 가능한 환경

  • Pits and Orbs ofrece un entorno de mundo en una cuadrícula multi-agente donde los agentes AI evitan trampas, recogen orbes y compiten en escenarios por turnos.
    0
    0
    ¿Qué es Pits and Orbs?
    Pits and Orbs es un entorno de código abierto para aprendizaje por refuerzo, implementado en Python, que ofrece un mundo en una cuadrícula multi-agente por turnos donde los agentes persiguen objetivos y enfrentan peligros ambientales. Cada agente debe navegar en una cuadrícula ajustable, evitar trampas colocadas aleatoriamente que penalizan o terminan episodios, y recolectar orbes para recompensas positivas. El entorno soporta modos competitivos y cooperativos, permitiendo a investigadores explorar diversos escenarios de aprendizaje. Su API simple se integra perfectamente con bibliotecas RL populares como Stable Baselines o RLlib. Características principales incluyen dimensiones de cuadrícula ajustables, distribuciones dinámicas de trampas y orbes, estructuras de recompensa configurables y registro opcional para análisis del entrenamiento.
    Características principales de Pits and Orbs
    • Simulación de mundo en cuadrícula multi-agente por turnos
    • Tamaños y diseños de cuadrícula personalizables
    • Peligros de trampas aleatorias y recompensas de orbes
    • Soporte para modos competitivos y cooperativos
    • API compatible con Gym sencilla
    • Opciones de registro y renderizado de episodios
  • Un marco de RL que ofrece herramientas de entrenamiento y evaluación de PPO, DQN para desarrollar agentes competitivos en el juego Pommerman.
    0
    0
    ¿Qué es PommerLearn?
    PommerLearn permite a investigadores y desarrolladores entrenar bots RL multi-agente en el entorno de juego Pommerman. Incluye implementaciones listas para usar de algoritmos populares (PPO, DQN), archivos de configuración flexibles para hiperparámetros, registro automático y visualización de métricas de entrenamiento, guardado de modelos y scripts de evaluación. Su arquitectura modular facilita la extensión con nuevos algoritmos, la personalización de entornos y la integración con bibliotecas ML estándar como PyTorch.
Destacados