초보자 친화적 구성 가능한 환경 도구

간단한 설정과 쉬운 사용법을 제공하는 구성 가능한 환경 도구로 시작부터 성공적인 작업을 만드세요.

구성 가능한 환경

  • Pits and Orbs는 AI 에이전트가 함정을 피하고, 구슬을 모으며, 턴 기반 시나리오에서 경쟁하는 다중 에이전트 그리드 월드 환경을 제공합니다.
    0
    0
    Pits and Orbs란?
    Pits and Orbs는 Python으로 구현된 오픈소스 강화 학습 환경으로, 에이전트가 목표를 추구하고 환경 위험에 직면하는 턴 기반 다중 에이전트 그리드 월드를 제공합니다. 각 에이전트는 사용자 정의 가능한 격자를 탐색하며, 페널티를 부여하거나 에피소드를 종료하는 무작위로 배치된 함정을 피하고, 긍정적인 보상을 위해 구슬을 모아야 합니다. 이 환경은 경쟁 모드와 협력 모드를 모두 지원하며, 연구자들이 다양한 학습 시나리오를 탐구할 수 있게 합니다. 간단한 API는 Stable Baselines 또는 RLlib과 같은 인기 RL 라이브러리와 원활하게 통합됩니다. 주요 기능으로는 조정 가능한 격자 크기, 동적 함정 및 구슬 분포, 구성 가능한 보상 구조, 그리고 훈련 분석을 위한 선택적 로깅이 포함됩니다.
  • 포머맨 게임 에이전트 개발을 위한 PPO, DQN 훈련 및 평가 도구를 제공하는 RL 프레임워크입니다.
    0
    0
    PommerLearn란?
    PommerLearn은 연구자와 개발자가 Pommerman 게임 환경에서 다중 에이전트 RL 봇을 훈련할 수 있도록 합니다. 인기 있는 알고리즘(PPO, DQN)의 준비된 구현, 하이퍼파라미터용 유연한 구성 파일, 자동 로깅 및 훈련 지표 시각화, 모델 체크포인트, 평가 스크립트를 포함합니다. 모듈식 아키텍처를 통해 새로운 알고리즘 추가, 환경 맞춤화, 표준 ML 라이브러리(PyTorch 등)와의 통합이 용이합니다.
추천