초보자 친화적 強化學習演算法 도구

간단한 설정과 쉬운 사용법을 제공하는 強化學習演算法 도구로 시작부터 성공적인 작업을 만드세요.

強化學習演算法

  • 포머맨 게임 에이전트 개발을 위한 PPO, DQN 훈련 및 평가 도구를 제공하는 RL 프레임워크입니다.
    0
    0
    PommerLearn란?
    PommerLearn은 연구자와 개발자가 Pommerman 게임 환경에서 다중 에이전트 RL 봇을 훈련할 수 있도록 합니다. 인기 있는 알고리즘(PPO, DQN)의 준비된 구현, 하이퍼파라미터용 유연한 구성 파일, 자동 로깅 및 훈련 지표 시각화, 모델 체크포인트, 평가 스크립트를 포함합니다. 모듈식 아키텍처를 통해 새로운 알고리즘 추가, 환경 맞춤화, 표준 ML 라이브러리(PyTorch 등)와의 통합이 용이합니다.
  • 협력 및 경쟁 환경을 위한 다중 에이전트 강화 학습 알고리즘을 구현하는 오픈소스 Python 프레임워크입니다.
    0
    0
    MultiAgent-ReinforcementLearning란?
    이 저장소는 MADDPG, DDPG, PPO 등을 비롯한 완전한 다중 에이전트 강화 학습 알고리즘 세트를 표준 벤치마크인 Multi-Agent Particle Environment와 OpenAI Gym과 통합하여 제공합니다. 사용자 맞춤형 환경 래퍼, 구성 가능한 훈련 스크립트, 실시간 로깅 및 성능 평가 지표를 특징으로 하며, 사용자는 알고리즘 확장, 맞춤 작업에 적응시키기 쉽고, 최소한의 설정으로 협력 및 경쟁 환경 간 정책을 비교할 수 있습니다.
추천