Algorithmus-Benchmarking

  • 用於多智能體系統的開源PyTorch框架,以學習和分析合作強化學習任務中的新興通訊協議。
    0
    0
    Emergent Communication in Agents 是什麼?
    智能體中的新興通訊是一個開源的PyTorch框架,專為探索多智能體系統如何發展自己的通訊協議的研究人員設計。該資料庫提供靈活的合作強化學習任務實現,包括參照游戲、組合彩游戲和對象識別挑戰。用戶定義說話者和聽者的架構,指定訊息通道的屬性(如詞匯大小和序列長度),並選擇訓練策略(如策略梯度或監督學習)。框架包括端到端的腳本用於執行實驗、分析通訊效率和可視化新興語言。其模組化設計允許輕鬆擴展新的游戲環境或自定義損失函數。研究人員可以復現已發表的研究、基準測試新算法,並探究新興智能體語言的組合性和語意。
    Emergent Communication in Agents 核心功能
    • 參照和組合游戲的實現
    • 可配置的說話者-聽者架構
    • 可自定義的訊息通道(詞匯、長度)
    • 支持策略梯度和監督學習
    • 端到端訓練與評估腳本
    • 新興語言的可視化工具
    • 模組化設計以添加新環境
  • 一個模擬多個合作與競爭代理礦工在基於網格的世界中收集資源的RL環境,適用於多智能體學習。
    0
    0
    Multi-Agent Miners 是什麼?
    Multi-Agent Miners提供一個基於網格的世界環境,數個自主礦工代理在互動中導航、挖掘並收集資源。支援可配置的地圖大小、代理數量和獎勵結構,用戶可創建競爭或合作場景。該框架與流行的RL庫透過PettingZoo整合,提供標準化的API用於重置、步進和渲染功能。視覺化模式與記錄支援幫助分析行為與結果,適合用於研究、教育和算法基準測試。
  • 基於Python的多智能體強化學習環境,用於合作搜尋任務,可配置通信與獎勵。
    0
    0
    Cooperative Search Environment 是什麼?
    合作搜尋環境提供一個彈性的、與gym相容的多智能體強化學習環境,適用於離散格子與連續空間中的合作搜尋任務。智能體在部分可觀測的條件下運作,並可根據自訂的通信拓撲分享資訊。框架支持預定義的場景,如搜尋與救援、動態目標追蹤及協作繪圖,並提供API以定義自訂的環境與獎勵結構,與Stabloes Baselines3和Ray RLlib等流行RL庫無縫整合,包含記錄性能的工具及即時可視化功能。研究人員可調整格子大小、智能體數量、感測器範圍及獎勵分享機制,有效評估協作策略與基準新演算法。
精選