贊助商
Flowith
- Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
Flowith
- Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
AI 工具
AI 智能代理
MCP
AI 新聞
排名
提交及廣告
登入
TW
TW
首頁
標籤
增強學習框架
高評分增強學習框架工具
探索使用者最推薦的增強學習框架工具,以高效、穩定的解決方案提升您的工作品質。
增強學習框架
Vanilla Agents
Vanilla Agents 提供現成的 DQN、PPO 和 A2C 強化學習代理的實現,具有可自定義的訓練流程。
0
0
訪問AI
Vanilla Agents 是什麼?
Vanilla Agents 是一個輕量級的 PyTorch 為基礎的框架,提供模組化且可擴展的核心強化學習代理實作。它支援 DQN、Double DQN、PPO 和 A2C 等演算法,並配備與 OpenAI Gym 兼容的可插拔環境封裝。用戶可以配置超參數、記錄訓練指標、保存檢查點並制圖學習曲線。程式碼架構清晰,非常適合研究原型設計、教育用途及新想法的基準測試。
Vanilla Agents 核心功能
DQN 與 Double DQN 的實作
PPO 和 A2C 政策梯度代理
OpenAI Gym 環境封裝器
可配置的超參數
日誌與 TensorBoard 支援
模型檢查點的存取與載入
精選