專業강화 학습 통합工具

專為高效與穩定性設計的강화 학습 통합工具,是實現專業成果的不二選擇。

강화 학습 통합

  • 一個DRL管道,能重置表現不佳的代理到之前的頂尖表現者,以改善多智能體強化學習的穩定性與效能。
    0
    0
    Selective Reincarnation for Multi-Agent Reinforcement Learning 是什麼?
    Selective Reincarnation引入一個針對MARL的動態群體型訓練機制。每個代理的表現會定期根據預設閾值評估。當某代理的表現低於同儕時,其權重會被重置為當前表現最佳代理的權重,有效地使其再生,展現驗證過的行為。此策略僅重置表現不佳的代理,維持多樣性,最小化破壞性重置,同時引導探索高回報策略。透過有針對性的神經網路參數遺傳,能降低變異並加速在合作或競爭環境的收斂。兼容任何基於策略梯度的MARL算法,且可無縫整合至PyTorch流程中,並包含可調的超參數設定,如評估頻率、篩選標準與重置策略調整。
  • 提供可自訂的多智慧體巡邏環境,支援多種地圖、智慧體配置和強化學習介面,使用Python實現。
    0
    0
    Patrolling-Zoo 是什麼?
    Patrolling-Zoo提供一個彈性的框架,讓用戶能在Python中建立與實驗多智慧體巡邏任務。庫內包含多種基於格子與圖形的模擬環境,模擬監控、巡查與覆蓋場景。用戶可自行設定智慧體數量、地圖大小、拓撲結構、獎勵和觀測空間。藉由與PettingZoo與Gym API的相容性,支援與流行強化學習演算法的順暢整合。此環境便於在一致設定下進行基準測試與技術比較。通過提供標準場景與自訂工具,促進自主機器人、安保監控、搜尋救援及多智慧體協調策略的研究與應用。
精選