이 오픈소스 프로젝트는 PyTorch와 Unity ML-Agents를 기반으로 구축된 완전한 다중 에이전트 강화 학습 프레임워크를 제공합니다. 분산 DDPG 알고리즘, 환경 래퍼, 훈련 스크립트를 포함하며, 사용자들은 에이전트 정책, 비평 네트워크, 재현 버퍼, 병렬 훈련 워커를 구성할 수 있습니다. 로깅 후크는 TensorBoard 모니터링을 가능하게 하며, 모듈화된 코드는 사용자 지정 보상 함수와 환경 매개변수를 지원합니다. 저장된 Unity 예제 씬은 협력 탐색 작업을 시연하며, 시뮬레이션에서 다중 에이전트 시나리오 확장과 벤치마킹에 이상적입니다.