- 1단계: GitHub에서 저장소를 클론하세요.
- 2단계: pip install -r requirements.txt로 의존성을 설치하세요.
- 3단계: 번역 데이터셋을 준비하고 전처리하세요.
- 4단계: 설정 파일에서 에이전트 역할과 정책을 구성하세요.
- 5단계: 감독 학습으로 생성 에이전트를 훈련하세요.
- 6단계: 강화 학습을 사용하여 에이전트를 미세 조정하세요.
- 7단계: 내장 BLEU 및 품질 지표를 사용하여 번역물을 평가하세요.
- 8단계: 결과를 분석하고 보상 함수를 조정하며 반복하세요.