Algorithmus-Benchmarking

  • 협력 강화 학습 과제에서 자발적 통신 프로토콜을 학습하고 분석하기 위해 멀티 에이전트 시스템을 위한 오픈소스 PyTorch 프레임워크입니다.
    0
    0
    Emergent Communication in Agents란?
    에이전트의 자발적 통신은 멀티 에이전트 시스템이 자체 통신 프로토콜을 개발하는 방법을 탐구하는 연구자를 위해 설계된 오픈소스 PyTorch 프레임워크입니다. 이 라이브러리는 참조 게임, 결합 게임, 객체 식별 과제 등을 포함하는 협력 강화 학습 과제의 유연한 구현을 제공합니다. 사용자는 발신자와 수신자 에이전트의 아키텍처를 정의하고, 어휘 크기와 시퀀스 길이와 같은 메시지 채널 속성을 지정하며, 정책 기울기 또는 감독 학습과 같은 훈련 전략을 선택할 수 있습니다. 프레임워크에는 실험 수행, 통신 효율성 분석, 자발적 언어 시각화를 위한 엔드투엔드 스크립트가 포함되어 있습니다. 모듈식 설계로 새로운 게임 환경이나 맞춤형 손실 함수를 쉽게 확장할 수 있습니다. 연구자들은 발표된 연구를 재현하고, 새로운 알고리즘을 벤치마킹하며, 자발적 에이전트 언어의 구성적 특성과 의미를 탐구할 수 있습니다.
    Emergent Communication in Agents 핵심 기능
    • 참조 및 결합 게임 구현
    • 구성 가능한 발신자-수신자 에이전트 아키텍처
    • 맞춤형 메시지 채널(어휘, 길이)
    • 정책 기울기와 감독 학습 지원
    • 엔드투엔드 훈련 및 평가 스크립트
    • 자발적 언어 시각화 도구
    • 새로운 환경 추가를 위한 모듈식 설계
  • 그리드 기반 세계에서 여러 협력 및 경쟁 에이전트 광부들이 자원을 수집하는 RL 환경으로, 다중 에이전트 학습을 위한 시뮬레이션입니다.
    0
    0
    Multi-Agent Miners란?
    Multi-Agent Miners는 여러 자율 광부 에이전트들이 이동하고 채굴하며 자원을 수집하는 그리드 월드 환경을 제공합니다. 설정 가능한 맵 크기, 에이전트 수, 보상 구조를 지원하며 경쟁 또는 협력 시나리오를 생성할 수 있습니다. 프레임워크는 PettingZoo를 통해 인기 있는 RL 라이브러리와 통합되어 재설정, 단계 및 렌더링 함수에 대한 표준 API를 제공합니다. 시각화 모드와 로깅 지원으로 행동과 결과 분석이 가능하며, 연구, 교육 및 알고리즘 벤치마킹에 적합합니다.
  • 통신과 보상이 가변적인 협력 검색 작업을 위한 파이썬 기반 다중 에이전트 강화 학습 환경입니다.
    0
    0
    Cooperative Search Environment란?
    협력검색환경은 이산 격자와 연속 공간 모두에서 협력 검색 작업에 적합한 유연한 gym 호환 다중 에이전트 강화 학습 환경을 제공합니다. 에이전트는 부분 관측 하에 작동하며, 사용자 정의 가능한 통신 토폴로지를 기반으로 정보를 공유할 수 있습니다. 이 프레임워크는 검색 및 구호, 동적 목표 추적, 공동 매핑과 같은 사전 정의된 시나리오를 지원하며, 사용자 지정 환경과 보상 구조를 정의하는 API를 제공합니다. Stable Baselines3와 Ray RLlib과 같은 인기 RL 라이브러리와 원활하게 통합되어 있으며, 성능 분석을 위한 로깅 유틸리티와 실시간 모니터링을 위한 시각화 도구를 포함하고 있습니다. 연구자들은 격자 크기, 에이전트 수, 센서 범위, 보상 공유 메커니즘 등을 조정하여 협력 전략을 평가하고 새로운 알고리즘의 벤치마크를 할 수 있습니다.
추천