AI 工具
AI 智能代理
MCP
排名
提交及廣告
登入
TW
TW
首頁
標籤
оптимизация политик
專業оптимизация политик工具
專為高效與穩定性設計的оптимизация политик工具,是實現專業成果的不二選擇。
оптимизация политик
jason-RL
Jason-RL為Jason BDI代理器配備強化學習,透過獎勵經驗實現基於Q-learning和SARSA的自適應決策。
0
0
訪問AI
jason-RL 是什麼?
Jason-RL在Jason多代理框架中加入一層強化學習,使AgentSpeak BDI代理器可以通過獎勵反饋學習行動選擇策略。它實現了Q-learning和SARSA算法,支援配置學習參數(學習率、折扣因子、探索策略)並記錄訓練指標。通過在代理計劃中定義獎勵函數和運行模擬,開發者可以觀察代理隨時間改善決策,並適應變化的環境,而不需要手動編碼策略。
jason-RL 核心功能
MAPF_G2RL
MAPF_G2RL 是一個Python框架,用於訓練深度強化學習代理,以高效的多智能體路徑搜尋在圖上。
0
0
訪問AI
MAPF_G2RL 是什麼?
MAPF_G2RL 是一個開源研究框架,將圖論與深度強化學習結合起來,以解決多智能體路徑搜尋問題(MAPF)。它將節點和邊編碼為向量表示,定義空間和碰撞感知的獎勵函數,支援 DQN、PPO、A2C 等多種 RL 算法。框架通過生成隨機圖或導入現實世界地圖來自動創建場景,並管理訓練循環以同時優化多個代理的策略。訓練後,代理在模擬環境中進行評估,以測量路徑最優化、完成時間和成功率。其模組化設計使研究人員能擴展核心元件、整合新技術,並與傳統解算器做基準測試。
MAPF_G2RL 核心功能
精選