AI 工具
AI 智能代理
MCP
排名
提交及廣告
登入
TW
TW
首頁
標籤
ferramenta de RL de código aberto
專業ferramenta de RL de código aberto工具
專為高效與穩定性設計的ferramenta de RL de código aberto工具,是實現專業成果的不二選擇。
ferramenta de RL de código aberto
MultiAgent-ReinforcementLearning
開源的Python框架,實現用於合作和競爭環境的多智能體強化學習算法。
0
0
訪問AI
MultiAgent-ReinforcementLearning 是什麼?
此倉庫提供完整的多智能體強化學習算法套件,包括MADDPG、DDPG、PPO等,並整合標準基準如Multi-Agent Particle Environment與OpenAI Gym。具有可自訂的環境包裝器、可設定的訓練腳本、實時日誌記錄與性能評估指標。用戶可以輕鬆擴展算法、適應自訂任務,並在合作與對抗設定中比較策略,只需最少的設置。
MultiAgent-ReinforcementLearning 核心功能
MADDPG、DDPG、PPO的實現
多智能體粒子與Gym的環境包裝器
可配置的訓練與評估腳本
利用TensorBoard進行實時日誌記錄
模組化程式碼庫方便擴展
精選