협력검색환경은 이산 격자와 연속 공간 모두에서 협력 검색 작업에 적합한 유연한 gym 호환 다중 에이전트 강화 학습 환경을 제공합니다. 에이전트는 부분 관측 하에 작동하며, 사용자 정의 가능한 통신 토폴로지를 기반으로 정보를 공유할 수 있습니다. 이 프레임워크는 검색 및 구호, 동적 목표 추적, 공동 매핑과 같은 사전 정의된 시나리오를 지원하며, 사용자 지정 환경과 보상 구조를 정의하는 API를 제공합니다. Stable Baselines3와 Ray RLlib과 같은 인기 RL 라이브러리와 원활하게 통합되어 있으며, 성능 분석을 위한 로깅 유틸리티와 실시간 모니터링을 위한 시각화 도구를 포함하고 있습니다. 연구자들은 격자 크기, 에이전트 수, 센서 범위, 보상 공유 메커니즘 등을 조정하여 협력 전략을 평가하고 새로운 알고리즘의 벤치마크를 할 수 있습니다.