AI 工具
AI 智能代理
MCP
排名
提交及廣告
登入
TW
TW
首頁
標籤
自定義獎勵函數
專業自定義獎勵函數工具
專為高效與穩定性設計的自定義獎勵函數工具,是實現專業成果的不二選擇。
自定義獎勵函數
MARFT
MARFT是一個開源的多代理強化學習(RL)微調工具包,用於協作AI工作流程和語言模型優化。
0
0
訪問AI
MARFT 是什麼?
MARFT是一個基於Python的LLM,支持可重複實驗和快速原型設計協作式AI系統。
MARFT 核心功能
Multi-Agent Surveillance
用於訓練AI代理進行合作監控和檢測入侵者的開源Python環境,適用於基於網格的場景。
0
0
訪問AI
Multi-Agent Surveillance 是什麼?
Multi-Agent Surveillance提供一個靈活的模擬框架,允許多個AI代理在離散網格世界中扮演捕食者或逃脫者角色。用戶可以配置環境參數,如網格尺寸、代理數量、檢測半徑和獎勵結構。該庫包含用於代理行為的Python類別、場景生成腳本、內建的matplotlib可視化工具,並與流行的強化學習庫無縫整合。使得基準多代理協調、開發定制監控策略和進行可重複性實驗變得容易。
Multi-Agent Surveillance 核心功能
Multi-Agent DDPG with PyTorch & Unity ML-Agents
使用PyTorch和Unity ML-Agents實現去中心化多智能體DDPG強化學習,用於協作智能體訓練。
0
0
訪問AI
Multi-Agent DDPG with PyTorch & Unity ML-Agents 是什麼?
該開源項目提供了建立在PyTorch和Unity ML-Agents之上的完整多智能體強化學習框架。包括去中心化的DDPG演算法、環境包裝器和訓練腳本。用戶可以配置代理策略、評論網絡、重放緩衝區和並行訓練工作者。日誌記錄鉤子支持TensorBoard監控,模組化代碼支持自訂獎勵函數和環境參數。存放庫包含示例Unity場景,演示協作導航任務,非常適合擴展和基準測試多智能體模擬場景。
Multi-Agent DDPG with PyTorch & Unity ML-Agents 核心功能
RL Shooter
RL Shooter 提供一個可自訂的基於 Doom 的強化學習環境,用於訓練 AI 代理在第一人稱射擊遊戲中導航與射擊目標。
0
0
訪問AI
RL Shooter 是什麼?
RL Shooter 是一個基於 Python 的框架,整合 ViZDoom 與 OpenAI Gym API,以建立一個彈性的 FPS 遊戲強化學習環境。使用者可自訂場景、地圖及獎勵結構,以進行導航、目標偵測和射擊任務的訓練。它支援可配置的觀察幀、行動空間與日誌功能,並支援流行的深度 RL 函式庫,例如 Stable Baselines 和 RLlib,以提供明確的性能追蹤及實驗可重複性。
RL Shooter 核心功能
Shepherding
牧羊是一個基於Python的強化學習框架,用於在模擬中訓練AI代理以驅使和引導多個代理。
0
0
訪問AI
Shepherding 是什麼?
牧羊是一個開源的模擬框架,設計用於強化學習研究人員與開發者來研究和實現多代理牧羊任務。它提供一個兼容Gym的環境,代理可以在連續或離散空間中執行側翼、收集與分散目標群的行為。該框架包括模組化的獎勵塑造函數、環境參數設定與訓練性能監控工具。用戶可定義障礙物、動態代理族群和自訂策略,利用TensorFlow或PyTorch。視覺化腳本生成軌跡圖與影片紀錄。牧羊的模組設計允許與現有RL庫完美整合,實現可重現的實驗、創新協作策略的基準測試,以及快速原型設計AI驅動的牧羊解決方案。
Shepherding 核心功能
Simple Playgrounds
一個輕量級的Python庫,用於創建可定製的2D網格環境,以訓練和測試增強學習代理人。
0
0
訪問AI
Simple Playgrounds 是什麼?
Simple Playgrounds提供一個模塊化的平台,用於建立交互式的2D網格環境,代理人在其中可以導航迷宮、與物件互動並完成任務。用戶可以通過簡單的YAML或Python腳本來定義環境佈局、物體行為和獎勵函數。內建的Pygame渲染器提供實時可視化,且基於步驟的API確保與Stable Baselines3等RL庫的無縫集成。支援多代理、多碰撞偵測及可自訂的物理參數,Simple Playgrounds讓原型設計、基準測試與教育演示算法變得更便利。
Simple Playgrounds 核心功能
精選