초보자를 위한 強化學習演算法 도구

후원사 Qoder - Qoder는 소프트웨어 프로젝트의 계획, 코딩 및 테스트를 자동화하는 AI 기반 코딩 어시스턴트입니다.



Qoder - Qoder는 소프트웨어 프로젝트의 계획, 코딩 및 테스트를 자동화하는 AI 기반 코딩 어시스턴트입니다.





AI 뉴스

로그인

強化學習演算法

PommerLearn
포머맨 게임 에이전트 개발을 위한 PPO, DQN 훈련 및 평가 도구를 제공하는 RL 프레임워크입니다.

0


0
AI 방문하기
PommerLearn란?
PommerLearn은 연구자와 개발자가 Pommerman 게임 환경에서 다중 에이전트 RL 봇을 훈련할 수 있도록 합니다. 인기 있는 알고리즘(PPO, DQN)의 준비된 구현, 하이퍼파라미터용 유연한 구성 파일, 자동 로깅 및 훈련 지표 시각화, 모델 체크포인트, 평가 스크립트를 포함합니다. 모듈식 아키텍처를 통해 새로운 알고리즘 추가, 환경 맞춤화, 표준 ML 라이브러리(PyTorch 등)와의 통합이 용이합니다.
PommerLearn 핵심 기능

PPO 알고리즘 구현

DQN 알고리즘 구현

Pommerman 환경 래퍼

구성 가능한 하이퍼파라미터

로깅 및 TensorBoard 통합

모델 체크포인트와 저장

평가 스크립트
MultiAgent-ReinforcementLearning
협력 및 경쟁 환경을 위한 다중 에이전트 강화 학습 알고리즘을 구현하는 오픈소스 Python 프레임워크입니다.

0


0
AI 방문하기
MultiAgent-ReinforcementLearning란?
이 저장소는 MADDPG, DDPG, PPO 등을 비롯한 완전한 다중 에이전트 강화 학습 알고리즘 세트를 표준 벤치마크인 Multi-Agent Particle Environment와 OpenAI Gym과 통합하여 제공합니다. 사용자 맞춤형 환경 래퍼, 구성 가능한 훈련 스크립트, 실시간 로깅 및 성능 평가 지표를 특징으로 하며, 사용자는 알고리즘 확장, 맞춤 작업에 적응시키기 쉽고, 최소한의 설정으로 협력 및 경쟁 환경 간 정책을 비교할 수 있습니다.
MultiAgent-ReinforcementLearning 핵심 기능



強化學習演算法

PommerLearn

MultiAgent-ReinforcementLearning