Mava é uma biblioteca de código aberto baseada em JAX para desenvolver, treinar e avaliar sistemas de aprendizado por reforço multi-agente. Oferece implementações pré-construídas de algoritmos cooperativos e competitivos, como MAPPO e MADDPG, juntamente com ciclos de treinamento configuráveis que suportam fluxos de trabalho de nó único e distribuídos. Pesquisadores podem importar ambientes do PettingZoo ou definir ambientes personalizados, usando os componentes modulares do Mava para otimização de políticas, gerenciamento de buffer de replay e registro de métricas. A arquitetura flexível da estrutura permite integração perfeita de novos algoritmos, espaços de observação personalizados e estruturas de recompensa. Aproveitando as capacidades de auto-vectorização e aceleração de hardware do JAX, o Mava garante experimentos eficientes em larga escala e benchmarking reprodutível em diversos cenários multi-agente.