

초보자 친화적 自訂獎勵函數 도구

간단한 설정과 쉬운 사용법을 제공하는 自訂獎勵函數 도구로 시작부터 성공적인 작업을 만드세요.

自訂獎勵函數

StarCraft II Reinforcement Learning Agent
DeepMind의 PySC2 환경을 활용하는 PPO 기반 오픈소스 강화학습 에이전트로 StarCraft II를 훈련 및 플레이합니다.

0


0
AI 방문하기
StarCraft II Reinforcement Learning Agent란?
이 저장소는 StarCraft II 게임 플레이 연구를 위한 엔드-투-엔드 강화학습 프레임워크를 제공합니다. 핵심 에이전트는 PySC2 환경의 관측 데이터를 해석하여 정밀한 게임 내 행동을 출력하는 정책 네트워크를 학습하기 위해 PPO를 사용합니다. 개발자는 신경망 계층, 보상 설계, 학습 일정을 구성하여 성능을 최적화할 수 있습니다. 이 시스템은 샘플 수집의 효율성을 위한 다중 프로세싱, 학습 곡선을 모니터링하는 로깅 유틸리티, 스크립트 또는 내장 AI 대전용 평가 스크립트를 지원합니다. 코드는 Python으로 작성되었으며 TensorFlow를 활용하여 모델 정의 및 최적화를 수행합니다. 사용자는 사용자 정의 보상 함수, 상태 전처리, 네트워크 아키텍처 등 구성요소를 확장할 수 있습니다.
StarCraft II Reinforcement Learning Agent 핵심 기능

SC2 환경에서 PPO 기반 정책 훈련

PySC2와의 연동으로 상태/행동 처리

구성 가능한 신경망 아키텍처와 보상

병렬 샘플 수집을 위한 멀티프로세싱 지원

로그 기록 및 TensorBoard 통합

평가용 스크립트 제공
Gym-Recsys
Gym-Recsys는 확장 가능한 강화 학습 추천 에이전트의 학습 및 평가를 위한 맞춤형 OpenAI Gym 환경을 제공합니다.

0


0
AI 방문하기
Gym-Recsys란?
Gym-Recsys는 추천 작업을 OpenAI Gym 환경으로 래핑하는 도구 모음으로, 강화 학습 알고리즘이 시뮬레이션된 사용자-항목 행렬과 단계별로 상호작용할 수 있도록 합니다. 합성 사용자 행동 생성기, 인기 데이터셋 로드 기능, Precision@K 및 NDCG와 같은 표준 추천 지표를 제공합니다. 사용자들은 보상 함수, 사용자 모델, 아이템 풀을 맞춤형으로 설정하여 재현 가능한 방식으로 다양한 RL 기반 추천 전략을 실험할 수 있습니다.
Gym-Recsys 핵심 기능



초보자 친화적 自訂獎勵函數 도구

간단한 설정과 쉬운 사용법을 제공하는 自訂獎勵函數 도구로 시작부터 성공적인 작업을 만드세요.

自訂獎勵函數

StarCraft II Reinforcement Learning Agent

Gym-Recsys