Pits and Orbs é um ambiente de aprendizado por reforço de código aberto implementado em Python, oferecendo um mundo em grade multi-agente baseado em turnos onde os agentes perseguem objetivos e enfrentam perigos ambientais. Cada agente deve navegar por uma grade personalizável, evitar poços colocados aleatoriamente que penalizam ou encerram episódios, e coletar orbes para recompensas positivas. O ambiente suporta modos competitivos e cooperativos, permitindo aos pesquisadores explorar cenários de aprendizado variados. Sua API simples se integra facilmente com bibliotecas populares de RL, como Stable Baselines ou RLlib. Recursos principais incluem dimensões ajustáveis da grade, distribuições dinâmicas de poços e orbes, estruturas de recompensa configuráveis e registro opcional para análise de treinamento.