贊助商
FixArt AI
- FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
FixArt AI
- FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
AI 工具
AI 智能代理
MCP
AI 新聞
排名
提交及廣告
登入
TW
TW
首頁
標籤
RL research
專業RL research工具
專為高效與穩定性設計的RL research工具,是實現專業成果的不二選擇。
RL research
Vanilla Agents
Vanilla Agents 提供現成的 DQN、PPO 和 A2C 強化學習代理的實現,具有可自定義的訓練流程。
0
0
訪問AI
Vanilla Agents 是什麼?
Vanilla Agents 是一個輕量級的 PyTorch 為基礎的框架,提供模組化且可擴展的核心強化學習代理實作。它支援 DQN、Double DQN、PPO 和 A2C 等演算法,並配備與 OpenAI Gym 兼容的可插拔環境封裝。用戶可以配置超參數、記錄訓練指標、保存檢查點並制圖學習曲線。程式碼架構清晰,非常適合研究原型設計、教育用途及新想法的基準測試。
Vanilla Agents 核心功能
DQN 與 Double DQN 的實作
PPO 和 A2C 政策梯度代理
OpenAI Gym 環境封裝器
可配置的超參數
日誌與 TensorBoard 支援
模型檢查點的存取與載入
MADDPG-Keras
基於 Keras 的多智能體深度確定性策略梯度算法的實現,用於合作與競爭多智能體強化學習。
0
0
訪問AI
MADDPG-Keras 是什麼?
MADDPG-Keras 通過在 Keras 中實現 MADDPG 算法,為多智能體強化學習研究提供完整框架。它支持連續動作空間、多個智能體和標準的 OpenAI Gym 環境。研究人員和開發者可以配置神經網絡結構、訓練超參數和獎勵函數,並通過內建的日誌和模型檢查點加速策略學習與基準測試。
MADDPG-Keras 核心功能
精選