초보자 친화적 自訂獎勵函數 도구

간단한 설정과 쉬운 사용법을 제공하는 自訂獎勵函數 도구로 시작부터 성공적인 작업을 만드세요.

自訂獎勵函數

  • DeepMind의 PySC2 환경을 활용하는 PPO 기반 오픈소스 강화학습 에이전트로 StarCraft II를 훈련 및 플레이합니다.
    0
    0
    StarCraft II Reinforcement Learning Agent란?
    이 저장소는 StarCraft II 게임 플레이 연구를 위한 엔드-투-엔드 강화학습 프레임워크를 제공합니다. 핵심 에이전트는 PySC2 환경의 관측 데이터를 해석하여 정밀한 게임 내 행동을 출력하는 정책 네트워크를 학습하기 위해 PPO를 사용합니다. 개발자는 신경망 계층, 보상 설계, 학습 일정을 구성하여 성능을 최적화할 수 있습니다. 이 시스템은 샘플 수집의 효율성을 위한 다중 프로세싱, 학습 곡선을 모니터링하는 로깅 유틸리티, 스크립트 또는 내장 AI 대전용 평가 스크립트를 지원합니다. 코드는 Python으로 작성되었으며 TensorFlow를 활용하여 모델 정의 및 최적화를 수행합니다. 사용자는 사용자 정의 보상 함수, 상태 전처리, 네트워크 아키텍처 등 구성요소를 확장할 수 있습니다.
    StarCraft II Reinforcement Learning Agent 핵심 기능
    • SC2 환경에서 PPO 기반 정책 훈련
    • PySC2와의 연동으로 상태/행동 처리
    • 구성 가능한 신경망 아키텍처와 보상
    • 병렬 샘플 수집을 위한 멀티프로세싱 지원
    • 로그 기록 및 TensorBoard 통합
    • 평가용 스크립트 제공
  • Gym-Recsys는 확장 가능한 강화 학습 추천 에이전트의 학습 및 평가를 위한 맞춤형 OpenAI Gym 환경을 제공합니다.
    0
    0
    Gym-Recsys란?
    Gym-Recsys는 추천 작업을 OpenAI Gym 환경으로 래핑하는 도구 모음으로, 강화 학습 알고리즘이 시뮬레이션된 사용자-항목 행렬과 단계별로 상호작용할 수 있도록 합니다. 합성 사용자 행동 생성기, 인기 데이터셋 로드 기능, Precision@K 및 NDCG와 같은 표준 추천 지표를 제공합니다. 사용자들은 보상 함수, 사용자 모델, 아이템 풀을 맞춤형으로 설정하여 재현 가능한 방식으로 다양한 RL 기반 추천 전략을 실험할 수 있습니다.
추천