

万能な自訂獎勵函數ツール

多様な用途に対応可能な自訂獎勵函數ツールを利用して、業務の効率化と柔軟性を実現しましょう。

自訂獎勵函數

StarCraft II Reinforcement Learning Agent
DeepMindのPySC2環境を利用したPPOを用いるオープンソースの強化学習エージェントで、StarCraft IIを訓練・プレイします。

0


0
AIを訪れる
StarCraft II Reinforcement Learning Agentとは？
このリポジトリは、StarCraft IIのゲームプレイ研究のためのエンドツーエンドの強化学習フレームワークを提供します。メインエージェントはProximal Policy Optimization（PPO）を使用し、PySC2環境からの観察データを解釈して、正確なゲーム内アクションを出力します。開発者はニューラルネットワークの層、報酬の調整、訓練スケジュールをカスタマイズして性能向上を図れます。システムは、サンプル収集の効率化のためのマルチプロセッシング、訓練曲線の監視用ロギングユーティリティ、スクリプト化やビルトインAI対戦用の評価スクリプトをサポートします。コードはPythonで書かれ、TensorFlowを用いてモデルの定義と最適化を行います。ユーザーは、カスタム報酬関数、状態前処理、ネットワークアーキテクチャなどのコンポーネントを拡張可能です。
StarCraft II Reinforcement Learning Agent コア機能

SC2環境でのPPOを用いたポリシー訓練

状態/アクションの処理統合にDeepMindのPySC2を使用

設定可能なニューラルネットワークアーキテクチャと報酬

並列サンプル収集のためのマルチプロセッシングサポート

ロギングとTensorBoard統合

エージェントの評価用スクリプト
Gym-Recsys
Gym-Recsysは、スケーラブルな学習と評価のためのカスタマイズ可能なOpenAI Gym環境を提供し、強化学習推薦エージェントを実行します。

0


0
AIを訪れる
Gym-Recsysとは？
Gym-Recsysは、推奨タスクをOpenAI Gym環境にラップするツールボックスで、強化学習アルゴリズムがシミュレートされたユーザーアイテム行列とステップバイステップで対話できるようにします。合成ユーザ行動生成器を提供し、一般的なデータセットの読み込みをサポートし、Precision@KやNDCGなどの標準的な推奨指標を提供します。ユーザは報酬関数、ユーザモデル、アイテムプールをカスタマイズして、異なるRLベースの推奨戦略を再現性を持って実験できます。
Gym-Recsys コア機能



フィーチャー

万能な自訂獎勵函數ツール

多様な用途に対応可能な自訂獎勵函數ツールを利用して、業務の効率化と柔軟性を実現しましょう。

自訂獎勵函數

StarCraft II Reinforcement Learning Agent

Gym-Recsys