AI 工具
AI 智能代理
MCP
排名
提交及廣告
登入
TW
TW
首頁
標籤
Hyperparameter-Anpassung
高評分Hyperparameter-Anpassung工具
探索使用者最推薦的Hyperparameter-Anpassung工具,以高效、穩定的解決方案提升您的工作品質。
Hyperparameter-Anpassung
PommerLearn
提供PPO、DQN訓練及評估工具的RL框架,用於開發具競爭力的Pommerman遊戲代理人。
0
0
訪問AI
PommerLearn 是什麼?
PommerLearn使研究人員和開發者能在Pommerman遊戲環境中訓練多智能體RL機器人。它包含現成的流行演算法(PPO、DQN)實作、彈性的超參數配置文件、自動記錄和訓練指標可視化、模型檢查點和評估腳本。其模組化架構便於擴充新演算法、自訂環境及整合標準ML庫如PyTorch。
PommerLearn 核心功能
Vanilla Agents
Vanilla Agents 提供現成的 DQN、PPO 和 A2C 強化學習代理的實現,具有可自定義的訓練流程。
0
0
訪問AI
Vanilla Agents 是什麼?
Vanilla Agents 是一個輕量級的 PyTorch 為基礎的框架,提供模組化且可擴展的核心強化學習代理實作。它支援 DQN、Double DQN、PPO 和 A2C 等演算法,並配備與 OpenAI Gym 兼容的可插拔環境封裝。用戶可以配置超參數、記錄訓練指標、保存檢查點並制圖學習曲線。程式碼架構清晰,非常適合研究原型設計、教育用途及新想法的基準測試。
Vanilla Agents 核心功能
精選