高評分競爭遊戲工具

探索使用者最推薦的競爭遊戲工具,以高效、穩定的解決方案提升您的工作品質。

競爭遊戲

  • MARL-DPP利用確定性點過程實作多智能體強化學習,鼓勵多元化的協調策略。
    0
    0
    MARL-DPP 是什麼?
    MARL-DPP是一個開源框架,使用確定性點過程(DPP)強制多智能體強化學習(MARL)中的多樣性。傳統的MARL方法經常陷入策略收斂到類似行為的問題,MARL-DPP透過引入基於DPP的措施來鼓勵代理保持多元的行動分佈。該工具套件提供模組化的程式碼來將DPP嵌入訓練目標、樣本策略和探索管理中,包括與OpenAI Gym和多智能體粒子環境(MPE)的即插即用整合,以及用於超參數管理、日誌記錄和多樣性指標視覺化的工具。研究人員可以評估多樣性約束在合作任務、資源分配與競爭遊戲中的影響。其擴展性設計支持客製化環境與高階演算法,促進新型MARL-DPP變體的探索。
  • 一個提供 DQN、PPO 和 A2C 代理人,用於在 PettingZoo 遊戲中進行多智能體強化學習的 GitHub 倉庫。
    0
    0
    Reinforcement Learning Agents for PettingZoo Games 是什麼?
    PettingZoo 遊戲的強化學習代理人是一個基於 Python 的程式庫,提供現成的 DQN、PPO 和 A2C 演算法,用於 PettingZoo 環境下的多智能體強化學習。具有標準化的訓練與評估腳本、可配置的超參數、整合的 TensorBoard 日誌記錄,以及支持競爭和合作遊戲。研究人員和開發者可以克隆倉庫、調整環境與演算法參數、運行訓練並視覺化指標,以快速進行多智能體 RL 實驗和基準測試。
精選