- 1단계: GitHub에서 레포지토리를 복제합니다.
- 2단계: Python 3.7+와 필요한 의존성 패키지를 pip로 설치합니다.
- 3단계: StarCraft II와 pysc2 환경을 설치하고 구성합니다.
- 4단계: 플레이 데이터셋을 수집하거나 가져오는 데이터 준비 스크립트를 실행합니다.
- 5단계: 모방 학습 훈련 스크립트를 실행하여 정책을 초기화합니다.
- 6단계: 셀프 플레이 기반 강화 학습 스크립트를 실행하여 에이전트를 미세 조정합니다.
- 7단계: 텐서보드로 훈련 진행상황과 지표를 모니터링합니다.
- 8단계: 평가 스크립트를 실행하여 정의된 시나리오에서 에이전트 성능을 평가합니다.