贊助商
FixArt AI
- FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
FixArt AI
- FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
AI 工具
AI 智能代理
MCP
AI 新聞
排名
提交及廣告
登入
TW
TW
首頁
標籤
ускорение на GPU
專業ускорение на GPU工具
專為高效與穩定性設計的ускорение на GPU工具,是實現專業成果的不二選擇。
ускорение на GPU
MAPF_G2RL
MAPF_G2RL 是一個Python框架,用於訓練深度強化學習代理,以高效的多智能體路徑搜尋在圖上。
0
0
訪問AI
MAPF_G2RL 是什麼?
MAPF_G2RL 是一個開源研究框架,將圖論與深度強化學習結合起來,以解決多智能體路徑搜尋問題(MAPF)。它將節點和邊編碼為向量表示,定義空間和碰撞感知的獎勵函數,支援 DQN、PPO、A2C 等多種 RL 算法。框架通過生成隨機圖或導入現實世界地圖來自動創建場景,並管理訓練循環以同時優化多個代理的策略。訓練後,代理在模擬環境中進行評估,以測量路徑最優化、完成時間和成功率。其模組化設計使研究人員能擴展核心元件、整合新技術,並與傳統解算器做基準測試。
MAPF_G2RL 核心功能
圖編碼與預處理
可自訂的獎勵塑造模組
支援 DQN、PPO、A2C 等演算法
野外與真實地圖的場景產生器
多代理訓練與評估流程
性能日誌與視覺化工具
MADDPG-Keras
基於 Keras 的多智能體深度確定性策略梯度算法的實現,用於合作與競爭多智能體強化學習。
0
0
訪問AI
MADDPG-Keras 是什麼?
MADDPG-Keras 通過在 Keras 中實現 MADDPG 算法,為多智能體強化學習研究提供完整框架。它支持連續動作空間、多個智能體和標準的 OpenAI Gym 環境。研究人員和開發者可以配置神經網絡結構、訓練超參數和獎勵函數,並通過內建的日誌和模型檢查點加速策略學習與基準測試。
MADDPG-Keras 核心功能
精選