多機能なcustom reward functionsツール集

提供元 ThumbnailCreator.com - AI搭載のツールで、美しくプロフェッショナルなYouTubeサムネイルを素早く簡単に作成できます。



ThumbnailCreator.com - AI搭載のツールで、美しくプロフェッショナルなYouTubeサムネイルを素早く簡単に作成できます。





AIニュース

ログイン

custom reward functions

Gym-Recsys
Gym-Recsysは、スケーラブルな学習と評価のためのカスタマイズ可能なOpenAI Gym環境を提供し、強化学習推薦エージェントを実行します。

0


0
AIを訪れる
Gym-Recsysとは？
Gym-Recsysは、推奨タスクをOpenAI Gym環境にラップするツールボックスで、強化学習アルゴリズムがシミュレートされたユーザーアイテム行列とステップバイステップで対話できるようにします。合成ユーザ行動生成器を提供し、一般的なデータセットの読み込みをサポートし、Precision@KやNDCGなどの標準的な推奨指標を提供します。ユーザは報酬関数、ユーザモデル、アイテムプールをカスタマイズして、異なるRLベースの推奨戦略を再現性を持って実験できます。
Gym-Recsys コア機能
gym-fx
gym-fxは、外国為替取引戦略の強化学習エージェントを訓練および評価するためのカスタマイズ可能なOpenAI Gym環境を提供します。

0


0
AIを訪れる
gym-fxとは？
gym-fxは、OpenAI Gymインターフェースを使用したシミュレートされた外国為替取引環境を実装したオープンソースのPythonライブラリです。複数の通貨ペアのサポート、歴史的価格フィードの統合、技術指標、および完全にカスタマイズ可能な報酬関数を提供します。標準化されたAPIを通じて、algorithmsのベンチマークや開発を容易にします。ユーザーは、市場のスリッページや取引コスト、観測空間を設定して、実取引に近いシナリオを模擬し、堅牢な戦略開発と評価を促進します。
gym-fx コア機能
MARFT
MARFTは、協調型AIワークフローと大規模言語モデル最適化のためのオープンソースのマルチエージェントRLファインチューニングツールキットです。

0


0
AIを訪れる
MARFTとは？
MARFTはPythonベースのLLMを対象とし、再現性のある実験と協調AIシステムの迅速なプロトタイピングを可能にします。
MARFT コア機能
Multi-Agent Surveillance
協調型AIエージェントをトレーニングするためのオープンソースのPython環境で、グリッドベースのシナリオに侵入者を監視・検知します。

0


0
AIを訪れる
Multi-Agent Surveillanceとは？
マルチエージェント監視は、離散グリッド内で捕食者または逃避者として行動する複数のAIエージェントのための柔軟なシミュレーションフレームワークを提供します。ユーザーは、グリッドの寸法、エージェント数、検知半径、報酬構造などの環境パラメータを設定できます。リポジトリには、エージェントの動作を制御するPythonクラス、シナリオ生成スクリプト、matplotlibによるビルトインビジュアリゼーション、主要な強化学習ライブラリとのシームレスな統合が含まれ、マルチエージェントの協調のベンチマーク作成やカスタム監視戦略の開発、再現性のある実験を容易に行えます。
Multi-Agent Surveillance コア機能
Multi-Agent DDPG with PyTorch & Unity ML-Agents
PyTorchとUnity ML-Agentsを使用して協調エージェントの訓練のための分散型多エージェントDDPG強化学習を実装します。

0


0
AIを訪れる
Multi-Agent DDPG with PyTorch & Unity ML-Agentsとは？
このオープンソースプロジェクトは、PyTorchとUnity ML-Agentsを基盤とした完全な多エージェント強化学習フレームワークを提供します。分散型DDPGアルゴリズム、環境ラッパー、訓練スクリプトを含みます。ユーザーはエージェントのポリシー、批評ネットワーク、リプレイバッファー、並列訓練ワーカーを設定できます。ロギングフックによりTensorBoardでの監視が可能で、モジュラーコードはカスタム報酬関数や環境パラメータをサポートします。リポジトリには協力ナビゲーションタスクを示すサンプルUnityシーンが含まれ、シミュレーション内での多エージェントシナリオの拡張やベンチマークに最適です。
Multi-Agent DDPG with PyTorch & Unity ML-Agents コア機能
RL Shooter
RL Shooterは、AIエージェントがターゲットをナビゲートし射撃するためのカスタマイズ可能なDoomベースの強化学習環境を提供します。

0


0
AIを訪れる
RL Shooterとは？
RL Shooterは、ViZDoomとOpenAI Gym APIを統合したPythonベースのフレームワークで、FPSゲーム向けの柔軟な強化学習環境を作り出します。ユーザーは、ナビゲーション、ターゲット検出、射撃タスクを訓練するためのカスタムシナリオ、マップ、報酬構造を定義できます。設定可能な観察フレーム、アクションスペース、ロギング機能により、Stable BaselinesやRLlibなどの人気深層RLライブラリをサポートし、パフォーマンスの追跡と実験の再現性を可能にします。
RL Shooter コア機能
Simple Playgrounds
カスタマイズ可能な2Dグリッド環境を作成する軽量なPythonライブラリで、強化学習エージェントのトレーニングとテストを行います。

0


0
AIを訪れる
Simple Playgroundsとは？
Simple Playgroundsは、エージェントが迷路を探索し、オブジェクトと相互作用し、タスクを完了できるインタラクティブな2Dグリッド環境の構築に役立つモジュール式プラットフォームです。ユーザーは、YAMLまたはPythonスクリプトを使って環境レイアウト、オブジェクトの挙動、報酬関数を定義します。組み込みのPygameレンダラーにより、リアルタイムの視覚化が可能になり、ステップベースのAPIにより、Stable Baselines3などのRLライブラリとシームレスに統合できます。マルチエージェントの設定、衝突検出、カスタマイズ可能な物理パラメータをサポートし、プロトタイピング、ベンチマーキング、AIアルゴリズムの教育的デモンストレーションを効率化します。
Simple Playgrounds コア機能
StarCraft II Reinforcement Learning Agent
DeepMindのPySC2環境を利用したPPOを用いるオープンソースの強化学習エージェントで、StarCraft IIを訓練・プレイします。

0


0
AIを訪れる
StarCraft II Reinforcement Learning Agentとは？
このリポジトリは、StarCraft IIのゲームプレイ研究のためのエンドツーエンドの強化学習フレームワークを提供します。メインエージェントはProximal Policy Optimization（PPO）を使用し、PySC2環境からの観察データを解釈して、正確なゲーム内アクションを出力します。開発者はニューラルネットワークの層、報酬の調整、訓練スケジュールをカスタマイズして性能向上を図れます。システムは、サンプル収集の効率化のためのマルチプロセッシング、訓練曲線の監視用ロギングユーティリティ、スクリプト化やビルトインAI対戦用の評価スクリプトをサポートします。コードはPythonで書かれ、TensorFlowを用いてモデルの定義と最適化を行います。ユーザーは、カスタム報酬関数、状態前処理、ネットワークアーキテクチャなどのコンポーネントを拡張可能です。
StarCraft II Reinforcement Learning Agent コア機能



フィーチャー

custom reward functions

Gym-Recsys

gym-fx

MARFT

Multi-Agent Surveillance

Multi-Agent DDPG with PyTorch & Unity ML-Agents

RL Shooter

Simple Playgrounds

StarCraft II Reinforcement Learning Agent