

專業協調学習工具

專為高效與穩定性設計的協調学習工具，是實現專業成果的不二選擇。

協調学習

MARL-DPP
MARL-DPP利用確定性點過程實作多智能體強化學習，鼓勵多元化的協調策略。

0


0
訪問AI
MARL-DPP 是什麼？
MARL-DPP是一個開源框架，使用確定性點過程（DPP）強制多智能體強化學習（MARL）中的多樣性。傳統的MARL方法經常陷入策略收斂到類似行為的問題，MARL-DPP透過引入基於DPP的措施來鼓勵代理保持多元的行動分佈。該工具套件提供模組化的程式碼來將DPP嵌入訓練目標、樣本策略和探索管理中，包括與OpenAI Gym和多智能體粒子環境（MPE）的即插即用整合，以及用於超參數管理、日誌記錄和多樣性指標視覺化的工具。研究人員可以評估多樣性約束在合作任務、資源分配與競爭遊戲中的影響。其擴展性設計支持客製化環境與高階演算法，促進新型MARL-DPP變體的探索。
MARL-DPP 核心功能

基於DPP的多樣性模組

與OpenAI Gym整合

支援MPE環境

訓練及評估腳本

多樣性指標的視覺化
MultiAgent-Systems-StarCraft2-PySC2-Raw
一個開源的多智能體強化學習框架，通過PySC2在星際爭霸II中實現原始層級的代理控制與協調。

0


0
訪問AI
MultiAgent-Systems-StarCraft2-PySC2-Raw 是什麼？
MultiAgent-Systems-StarCraft2-PySC2-Raw提供一整套工具組，用於在星際爭霸II中開發、訓練與評估多個AI代理。它暴露低層次控制單位移動、目標指向和技能，同時支持彈性的獎勵設計與場景配置。用戶可以輕鬆插入自定義神經網路架構、定義隊伍協調策略，並記錄指標。基於PySC2，支援並行訓練、檢查點與視覺化，非常適合推動合作與對抗多智能體強化學習的研究。
MultiAgent-Systems-StarCraft2-PySC2-Raw 核心功能



精選

專業協調学習工具

專為高效與穩定性設計的協調学習工具，是實現專業成果的不二選擇。

協調学習

MARL-DPP

MultiAgent-Systems-StarCraft2-PySC2-Raw