

万能なニューラルネットワークのカスタマイズツール

多様な用途に対応可能なニューラルネットワークのカスタマイズツールを利用して、業務の効率化と柔軟性を実現しましょう。

ニューラルネットワークのカスタマイズ

MADDPG-Keras
協調型および競合型のマルチエージェント強化学習のためのKerasベースのMulti-Agent Deep Deterministic Policy Gradientの実装です。

0


0
AIを訪れる
MADDPG-Kerasとは？
MADDPG-Kerasは、Kerasに実装されたMADDPGアルゴリズムを用いて、マルチエージェント強化学習の研究のための包括的なフレームワークを提供します。連続アクション空間、複数のエージェント、OpenAI Gymの標準環境をサポートします。研究者と開発者は、ニューラルネットワークのアーキテクチャ、トレーニングのハイパーパラメータ、報酬関数を設定し、組み込みのロギングとモデルのチェックポイント保存機能を使って実験を実行し、マルチエージェントのポリシー学習と比較を高速化できます。
MADDPG-Keras コア機能

Keras & TensorFlowを用いたMADDPGの実装

連続アクション空間のサポート

設定可能なマルチエージェントGym環境

ロギング、TensorBoard統合、チェックポイント保存

カスタマイズ可能なニューラルネットワークアーキテクチャ
StarCraft II Reinforcement Learning Agent
DeepMindのPySC2環境を利用したPPOを用いるオープンソースの強化学習エージェントで、StarCraft IIを訓練・プレイします。

0


0
AIを訪れる
StarCraft II Reinforcement Learning Agentとは？
このリポジトリは、StarCraft IIのゲームプレイ研究のためのエンドツーエンドの強化学習フレームワークを提供します。メインエージェントはProximal Policy Optimization（PPO）を使用し、PySC2環境からの観察データを解釈して、正確なゲーム内アクションを出力します。開発者はニューラルネットワークの層、報酬の調整、訓練スケジュールをカスタマイズして性能向上を図れます。システムは、サンプル収集の効率化のためのマルチプロセッシング、訓練曲線の監視用ロギングユーティリティ、スクリプト化やビルトインAI対戦用の評価スクリプトをサポートします。コードはPythonで書かれ、TensorFlowを用いてモデルの定義と最適化を行います。ユーザーは、カスタム報酬関数、状態前処理、ネットワークアーキテクチャなどのコンポーネントを拡張可能です。
StarCraft II Reinforcement Learning Agent コア機能



フィーチャー

万能なニューラルネットワークのカスタマイズツール

多様な用途に対応可能なニューラルネットワークのカスタマイズツールを利用して、業務の効率化と柔軟性を実現しましょう。

ニューラルネットワークのカスタマイズ

MADDPG-Keras

StarCraft II Reinforcement Learning Agent