Herramientas agent navigation potentes para cualquier tarea

Patrocinado por ThumbnailCreator.com - Herramienta potenciada por IA para crear miniaturas de YouTube impresionantes y profesionales, rápida y fácilmente.



ThumbnailCreator.com - Herramienta potenciada por IA para crear miniaturas de YouTube impresionantes y profesionales, rápida y fácilmente.





Noticias de IA

Iniciar Sesión

agent navigation

Pits and Orbs
Pits and Orbs ofrece un entorno de mundo en una cuadrícula multi-agente donde los agentes AI evitan trampas, recogen orbes y compiten en escenarios por turnos.

0


0
Visitar IA
¿Qué es Pits and Orbs?
Pits and Orbs es un entorno de código abierto para aprendizaje por refuerzo, implementado en Python, que ofrece un mundo en una cuadrícula multi-agente por turnos donde los agentes persiguen objetivos y enfrentan peligros ambientales. Cada agente debe navegar en una cuadrícula ajustable, evitar trampas colocadas aleatoriamente que penalizan o terminan episodios, y recolectar orbes para recompensas positivas. El entorno soporta modos competitivos y cooperativos, permitiendo a investigadores explorar diversos escenarios de aprendizaje. Su API simple se integra perfectamente con bibliotecas RL populares como Stable Baselines o RLlib. Características principales incluyen dimensiones de cuadrícula ajustables, distribuciones dinámicas de trampas y orbes, estructuras de recompensa configurables y registro opcional para análisis del entrenamiento.
Características principales de Pits and Orbs

Simulación de mundo en cuadrícula multi-agente por turnos

Tamaños y diseños de cuadrícula personalizables

Peligros de trampas aleatorias y recompensas de orbes

Soporte para modos competitivos y cooperativos

API compatible con Gym sencilla

Opciones de registro y renderizado de episodios
RL Shooter
RL Shooter proporciona un entorno de aprendizaje por refuerzo personalizable basado en Doom para entrenar agentes de IA a navegar y disparar objetivos.

0


0
Visitar IA
¿Qué es RL Shooter?
RL Shooter es un marco basado en Python que integra ViZDoom con las API de OpenAI Gym para crear un entorno flexible de aprendizaje por refuerzo para juegos FPS. Los usuarios pueden definir escenarios, mapas y estructuras de recompensa personalizadas para entrenar agentes en tareas de navegación, detección de objetivos y disparo. Con marcos de observación, espacios de acción y facilidades de registro configurables, soporta bibliotecas populares de RL profundo como Stable Baselines y RLlib, permitiendo un seguimiento claro del rendimiento y la reproducibilidad de los experimentos.
Características principales de RL Shooter
Learning-to-Communicate-PyTorch
Un marco de trabajo en PyTorch que permite a los agentes aprender protocolos de comunicación emergentes en tareas de aprendizaje por refuerzo multiagente.

0


0
Visitar IA
¿Qué es Learning-to-Communicate-PyTorch?
Este repositorio implementa comunicación emergente en aprendizaje por refuerzo multiagente usando PyTorch. Los usuarios pueden configurar redes neuronales para emisores y receptores para jugar a juegos referenciales o navegación cooperativa, fomentando que los agentes desarrollen un canal de comunicación discreto o continuo. Incluye scripts para entrenamiento, evaluación y visualización de protocolos aprendidos, además de utilidades para crear entornos, codificar y decodificar mensajes. Los investigadores pueden extenderlo con tareas personalizadas, modificar arquitecturas de red y analizar la eficiencia del protocolo, promoviendo experimentos rápidos en comunicación emergente de agentes.
Características principales de Learning-to-Communicate-PyTorch



Destacados

agent navigation

Pits and Orbs

RL Shooter

Learning-to-Communicate-PyTorch