AI 工具
AI 智能代理
MCP
排名
提交及廣告
登入
TW
TW
首頁
標籤
ニューラルネットワークのカスタマイズ
專業ニューラルネットワークのカスタマイズ工具
專為高效與穩定性設計的ニューラルネットワークのカスタマイズ工具,是實現專業成果的不二選擇。
ニューラルネットワークのカスタマイズ
MADDPG-Keras
基於 Keras 的多智能體深度確定性策略梯度算法的實現,用於合作與競爭多智能體強化學習。
0
0
訪問AI
MADDPG-Keras 是什麼?
MADDPG-Keras 通過在 Keras 中實現 MADDPG 算法,為多智能體強化學習研究提供完整框架。它支持連續動作空間、多個智能體和標準的 OpenAI Gym 環境。研究人員和開發者可以配置神經網絡結構、訓練超參數和獎勵函數,並通過內建的日誌和模型檢查點加速策略學習與基準測試。
MADDPG-Keras 核心功能
Keras 和 TensorFlow 實現的 MADDPG
支援連續動作空間
可配置的多智能體 Gym 環境
日誌記錄、TensorBoard 整合及模型檢查點
可自訂的神經網絡結構
StarCraft II Reinforcement Learning Agent
一個開源的增強學習代理,利用PPO在DeepMind的PySC2環境中訓練並玩星際爭霸II。
0
0
訪問AI
StarCraft II Reinforcement Learning Agent 是什麼?
此存儲庫提供一個完整的星際爭霸II遊戲研究增強學習框架。核心代理使用PPO來學習策略網絡,詮釋來自PySC2環境的觀察數據,並輸出精確的遊戲內動作。開發者可以配置神經網絡層、獎勵塑造與訓練計劃,以優化性能。系統支持多處理技術以高效收集樣本,並包含監控訓練曲線的日誌工具與測試已訓練策略的評估腳本(對完成或內建的AI對手)。程式碼以Python撰寫,利用TensorFlow進行模型定義與優化。用戶可以擴展自定義獎勵函數、狀態前處理或網路架構,以符合特定研究需求。
StarCraft II Reinforcement Learning Agent 核心功能
精選