Pits and Orbs es un entorno de código abierto para aprendizaje por refuerzo, implementado en Python, que ofrece un mundo en una cuadrícula multi-agente por turnos donde los agentes persiguen objetivos y enfrentan peligros ambientales. Cada agente debe navegar en una cuadrícula ajustable, evitar trampas colocadas aleatoriamente que penalizan o terminan episodios, y recolectar orbes para recompensas positivas. El entorno soporta modos competitivos y cooperativos, permitiendo a investigadores explorar diversos escenarios de aprendizaje. Su API simple se integra perfectamente con bibliotecas RL populares como Stable Baselines o RLlib. Características principales incluyen dimensiones de cuadrícula ajustables, distribuciones dinámicas de trampas y orbes, estructuras de recompensa configurables y registro opcional para análisis del entrenamiento.