AI 工具
AI 智能代理
MCP
排名
提交及廣告
登入
TW
TW
首頁
標籤
visualisation avec TensorBoard
專業visualisation avec TensorBoard工具
專為高效與穩定性設計的visualisation avec TensorBoard工具,是實現專業成果的不二選擇。
visualisation avec TensorBoard
Vanilla Agents
Vanilla Agents 提供現成的 DQN、PPO 和 A2C 強化學習代理的實現,具有可自定義的訓練流程。
0
0
訪問AI
Vanilla Agents 是什麼?
Vanilla Agents 是一個輕量級的 PyTorch 為基礎的框架,提供模組化且可擴展的核心強化學習代理實作。它支援 DQN、Double DQN、PPO 和 A2C 等演算法,並配備與 OpenAI Gym 兼容的可插拔環境封裝。用戶可以配置超參數、記錄訓練指標、保存檢查點並制圖學習曲線。程式碼架構清晰,非常適合研究原型設計、教育用途及新想法的基準測試。
Vanilla Agents 核心功能
Multi-Agent DDPG with PyTorch & Unity ML-Agents
使用PyTorch和Unity ML-Agents實現去中心化多智能體DDPG強化學習,用於協作智能體訓練。
0
0
訪問AI
Multi-Agent DDPG with PyTorch & Unity ML-Agents 是什麼?
該開源項目提供了建立在PyTorch和Unity ML-Agents之上的完整多智能體強化學習框架。包括去中心化的DDPG演算法、環境包裝器和訓練腳本。用戶可以配置代理策略、評論網絡、重放緩衝區和並行訓練工作者。日誌記錄鉤子支持TensorBoard監控,模組化代碼支持自訂獎勵函數和環境參數。存放庫包含示例Unity場景,演示協作導航任務,非常適合擴展和基準測試多智能體模擬場景。
Multi-Agent DDPG with PyTorch & Unity ML-Agents 核心功能
精選