AutoDRIVE Cooperative MARL은 자율주행 임무를 위한 협력형 다중 에이전트 강화학습(MARL) 정책을 훈련시키고 배포하기 위해 설계된 오픈소스 프레임워크입니다. 교차로, 고속도로 플레토닝, 병합과 같은 교통 시나리오를 모델링 하기 위해 현실감 있는 시뮬레이터와 통합됩니다. 이 프레임워크는 중앙집중식 훈련과 분산형 실행을 구현하여 차량들이 공유된 정책을 학습하여 교통 효율성과 안전성을 극대화할 수 있도록 합니다. 사용자들은 환경 파라미터를 설정하고, 기본 MARL 알고리즘을 선택하며, 훈련 진행 상황을 시각화하고, 에이전트 협조 성과를 벤치마킹할 수 있습니다.
PommerLearn은 연구자와 개발자가 Pommerman 게임 환경에서 다중 에이전트 RL 봇을 훈련할 수 있도록 합니다. 인기 있는 알고리즘(PPO, DQN)의 준비된 구현, 하이퍼파라미터용 유연한 구성 파일, 자동 로깅 및 훈련 지표 시각화, 모델 체크포인트, 평가 스크립트를 포함합니다. 모듈식 아키텍처를 통해 새로운 알고리즘 추가, 환경 맞춤화, 표준 ML 라이브러리(PyTorch 등)와의 통합이 용이합니다.
NavGround Learning은 내비게이션 작업에서 강화 학습 에이전트 개발 및 벤치마킹을 위한 종합 툴킷을 제공합니다. 다중 에이전트 시뮬레이션, 충돌 모델링, 커스터마이징 가능한 센서 및 액츄에이터를 지원합니다. 사용자는 사전 정의된 정책 템플릿을 선택하거나 커스텀 아키텍처를 구현하여 최신 RL 알고리즘으로 훈련하고 성능 지표를 시각화할 수 있습니다. OpenAI Gym 및 Stable Baselines3와의 통합은 실험 관리를 간소화하며, 내장된 로깅 및 시각화 도구는 에이전트 행동과 훈련 역학에 대한 심층 분석을 가능하게 합니다.