AI 工具
AI 智能代理
MCP
排名
提交及廣告
登入
TW
TW
首頁
標籤
machine learning research
專業machine learning research工具
專為高效與穩定性設計的machine learning research工具,是實現專業成果的不二選擇。
machine learning research
Cooperative Search Environment
基於Python的多智能體強化學習環境,用於合作搜尋任務,可配置通信與獎勵。
0
0
訪問AI
Cooperative Search Environment 是什麼?
合作搜尋環境提供一個彈性的、與gym相容的多智能體強化學習環境,適用於離散格子與連續空間中的合作搜尋任務。智能體在部分可觀測的條件下運作,並可根據自訂的通信拓撲分享資訊。框架支持預定義的場景,如搜尋與救援、動態目標追蹤及協作繪圖,並提供API以定義自訂的環境與獎勵結構,與Stabloes Baselines3和Ray RLlib等流行RL庫無縫整合,包含記錄性能的工具及即時可視化功能。研究人員可調整格子大小、智能體數量、感測器範圍及獎勵分享機制,有效評估協作策略與基準新演算法。
Cooperative Search Environment 核心功能
MultiAgent-Systems-StarCraft2-PySC2-Raw
一個開源的多智能體強化學習框架,通過PySC2在星際爭霸II中實現原始層級的代理控制與協調。
0
0
訪問AI
MultiAgent-Systems-StarCraft2-PySC2-Raw 是什麼?
MultiAgent-Systems-StarCraft2-PySC2-Raw提供一整套工具組,用於在星際爭霸II中開發、訓練與評估多個AI代理。它暴露低層次控制單位移動、目標指向和技能,同時支持彈性的獎勵設計與場景配置。用戶可以輕鬆插入自定義神經網路架構、定義隊伍協調策略,並記錄指標。基於PySC2,支援並行訓練、檢查點與視覺化,非常適合推動合作與對抗多智能體強化學習的研究。
MultiAgent-Systems-StarCraft2-PySC2-Raw 核心功能
multiagent_envs
一個開源的Python框架,提供多種多智能體強化學習環境,用於訓練和基準測試AI代理。
0
0
訪問AI
multiagent_envs 是什麼?
multiagent_envs 提供一套模組化的Python環境,專為多智能體強化學習的研究與開發而設。包括合作導航、捕食者-獵物、社會困境和競爭性場景。每個環境允許定義智能體數量、觀察特徵、獎勵函數和碰撞動態。該框架與Stable Baselines和RLlib等常用RL庫無縫整合,支持向量化訓練、平行執行和方便記錄。用戶可以拓展現有場景或遵照API创建新环境,加速算法(如MADDPG、QMIX、PPO)的實驗和重現。
multiagent_envs 核心功能
精選