gym-multigrid fornece uma coleção de ambientes de mundos de grade personalizáveis projetados para tarefas de navegação e exploração em múltiplas salas no aprendizado por reforço. Cada ambiente consiste em salas interconectadas, populadas com objetos, chaves, portas e obstáculos. Os usuários podem ajustar deslocamento de grade, configurações de sala e posicionamento de objetos programaticamente. A biblioteca suporta modos de observação total e parcial, oferecendo representações de estado RGB ou matriz. As ações incluem movimento, interação com objetos e manipulação de portas. Ao integrá-lo como ambiente do Gym, pesquisadores podem aproveitar qualquer agente compatível com Gym, treinando e avaliando algoritmos de forma fluida em tarefas como quebra-cabeças de chaves e portas, recuperação de objetos e planejamento hierárquico. O design modular e as dependências mínimas do gym-multigrid fazem dele uma ferramenta ideal para benchmarking de novas estratégias de IA.