AI 工具
AI 智能代理
MCP
排名
提交及廣告
登入
TW
TW
首頁
標籤
marco PyTorch
高評分marco PyTorch工具
探索使用者最推薦的marco PyTorch工具,以高效、穩定的解決方案提升您的工作品質。
marco PyTorch
MARL Simulator
一個開源的多智能體增強學習模擬器,支持可擴展的並行訓練、可定製的環境和智能體通訊協議。
0
0
訪問AI
MARL Simulator 是什麼?
MARL模擬器旨在促進多智能體增強學習(MARL)算法的高效和可擴展開發。利用PyTorch的分佈式後端,它允許用戶在多個GPU或節點上運行並行訓練,顯著縮短實驗時間。模擬器提供模組化的環境界面,支持標準的基準場景——如協作導航、掠食者-獵物和網格世界——以及用戶定義的自定義環境。智能體可以使用各種通訊協議來協調行動、共享觀察和同步獎勵。可配置的獎勵和觀察空間使得訓練動態可以精細調控,內建的日誌記錄和視覺化工具提供實時性能指標的洞察。
MARL Simulator 核心功能
Learning-to-Communicate-PyTorch
一個PyTorch框架,讓代理能在多代理強化學習任務中學習新興的通信協議。
0
0
訪問AI
Learning-to-Communicate-PyTorch 是什麼?
此儲存庫利用PyTorch實作多代理增強學習中的新興通信。使用者可配置發送與接收神經網路來進行參照遊戲或合作導航,促使代理建立離散或連續的通信通道。提供訓練、評估與視覺化的腳本,以及用於環境建立、訊息編碼與解碼的工具。研究人員可加入自訂任務、修改網路架構,並分析協議效率,加速新興代理通信的實驗。
Learning-to-Communicate-PyTorch 核心功能
Vanilla Agents
Vanilla Agents 提供現成的 DQN、PPO 和 A2C 強化學習代理的實現,具有可自定義的訓練流程。
0
0
訪問AI
Vanilla Agents 是什麼?
Vanilla Agents 是一個輕量級的 PyTorch 為基礎的框架,提供模組化且可擴展的核心強化學習代理實作。它支援 DQN、Double DQN、PPO 和 A2C 等演算法,並配備與 OpenAI Gym 兼容的可插拔環境封裝。用戶可以配置超參數、記錄訓練指標、保存檢查點並制圖學習曲線。程式碼架構清晰,非常適合研究原型設計、教育用途及新想法的基準測試。
Vanilla Agents 核心功能
精選