

專業訓練指標工具

專為高效與穩定性設計的訓練指標工具，是實現專業成果的不二選擇。

訓練指標

jason-RL
Jason-RL為Jason BDI代理器配備強化學習，透過獎勵經驗實現基於Q-learning和SARSA的自適應決策。

0


0
訪問AI
jason-RL 是什麼？
Jason-RL在Jason多代理框架中加入一層強化學習，使AgentSpeak BDI代理器可以通過獎勵反饋學習行動選擇策略。它實現了Q-learning和SARSA算法，支援配置學習參數（學習率、折扣因子、探索策略）並記錄訓練指標。通過在代理計劃中定義獎勵函數和運行模擬，開發者可以觀察代理隨時間改善決策，並適應變化的環境，而不需要手動編碼策略。
jason-RL 核心功能

Q-learning整合

SARSA整合

可配置學習參數

支持獎勵函數

記錄訓練指標



精選