DEf-MARL(멀티 에이전트 강화 학습을 위한 분산 실행 프레임워크)는 중앙 제어자가 없는 협력 에이전트의 수행과 학습을 위한 견고한 인프라를 제공합니다. 피어 투 피어 통신 프로토콜을 활용하여 정책과 관측 정보를 공유하며, 로컬 상호작용을 통해 조정을 수행합니다. 이 프레임워크는 PyTorch 및 TensorFlow와 원활하게 통합되며, 사용자 정의 환경 래퍼, 분산 롤아웃 수집 및 그래디언트 동기화 모듈을 제공합니다. 사용자들은 에이전트별 관측 공간, 보상 함수, 통신 토폴로지를 정의할 수 있습니다. DEf-MARL은 런타임 동안 에이전트의 동적 추가 및 제거를 지원하며, 노드 간 중요한 상태를 복제하여 장애 내성을 갖추고, 탐색과 활용의 균형을 위한 적응형 통신 스케줄링도 수행합니다. 환경 시뮬레이션을 병렬화하고 중앙 병목 현상을 줄여 훈련 속도를 높이며, 대규모 MARL 연구와 산업용 시뮬레이션에 적합합니다.