- ステップ1:GitHubからリポジトリをクローンします。
- ステップ2:pip install -r requirements.txt で依存関係をインストールします。
- ステップ3:翻訳データセットを準備し、前処理します。
- ステップ4:設定ファイルでエージェントの役割とポリシーを構成します。
- ステップ5:教師あり学習で生成エージェントを訓練します。
- ステップ6:強化学習を用いてエージェントを微調整します。
- ステップ7:内蔵のBLEUおよび品質指標で翻訳を評価します。
- ステップ8:結果を分析し、報酬関数を調整して繰り返します。