초보자를 위한 구성 가능한 환경 도구

후원사 Refly.ai - Refly.AI는 비기술 창작자가 자연어와 시각적 캔버스를 사용해 워크플로를 자동화할 수 있도록 지원합니다.



Refly.ai - Refly.AI는 비기술 창작자가 자연어와 시각적 캔버스를 사용해 워크플로를 자동화할 수 있도록 지원합니다.





AI 뉴스

로그인

구성 가능한 환경

Pits and Orbs
Pits and Orbs는 AI 에이전트가 함정을 피하고, 구슬을 모으며, 턴 기반 시나리오에서 경쟁하는 다중 에이전트 그리드 월드 환경을 제공합니다.

0


0
AI 방문하기
Pits and Orbs란?
Pits and Orbs는 Python으로 구현된 오픈소스 강화 학습 환경으로, 에이전트가 목표를 추구하고 환경 위험에 직면하는 턴 기반 다중 에이전트 그리드 월드를 제공합니다. 각 에이전트는 사용자 정의 가능한 격자를 탐색하며, 페널티를 부여하거나 에피소드를 종료하는 무작위로 배치된 함정을 피하고, 긍정적인 보상을 위해 구슬을 모아야 합니다. 이 환경은 경쟁 모드와 협력 모드를 모두 지원하며, 연구자들이 다양한 학습 시나리오를 탐구할 수 있게 합니다. 간단한 API는 Stable Baselines 또는 RLlib과 같은 인기 RL 라이브러리와 원활하게 통합됩니다. 주요 기능으로는 조정 가능한 격자 크기, 동적 함정 및 구슬 분포, 구성 가능한 보상 구조, 그리고 훈련 분석을 위한 선택적 로깅이 포함됩니다.
Pits and Orbs 핵심 기능

턴 기반 다중 에이전트 그리드 월드 시뮬레이션

맞춤형 격자 크기 및 레이아웃

무작위 함정 위험과 구슬 보상

경쟁 및 협력 모드 지원

간단한 Gym 호환 API

에피소드 로깅 및 렌더링 옵션
PommerLearn
포머맨 게임 에이전트 개발을 위한 PPO, DQN 훈련 및 평가 도구를 제공하는 RL 프레임워크입니다.

0


0
AI 방문하기
PommerLearn란?
PommerLearn은 연구자와 개발자가 Pommerman 게임 환경에서 다중 에이전트 RL 봇을 훈련할 수 있도록 합니다. 인기 있는 알고리즘(PPO, DQN)의 준비된 구현, 하이퍼파라미터용 유연한 구성 파일, 자동 로깅 및 훈련 지표 시각화, 모델 체크포인트, 평가 스크립트를 포함합니다. 모듈식 아키텍처를 통해 새로운 알고리즘 추가, 환경 맞춤화, 표준 ML 라이브러리(PyTorch 등)와의 통합이 용이합니다.
PommerLearn 핵심 기능



구성 가능한 환경

Pits and Orbs

PommerLearn