이 저장소는 MADDPG, DDPG, PPO 등을 비롯한 완전한 다중 에이전트 강화 학습 알고리즘 세트를 표준 벤치마크인 Multi-Agent Particle Environment와 OpenAI Gym과 통합하여 제공합니다. 사용자 맞춤형 환경 래퍼, 구성 가능한 훈련 스크립트, 실시간 로깅 및 성능 평가 지표를 특징으로 하며, 사용자는 알고리즘 확장, 맞춤 작업에 적응시키기 쉽고, 최소한의 설정으로 협력 및 경쟁 환경 간 정책을 비교할 수 있습니다.