高評分軽量コード工具

探索使用者最推薦的軽量コード工具,以高效、穩定的解決方案提升您的工作品質。

軽量コード

  • Vanilla Agents 提供現成的 DQN、PPO 和 A2C 強化學習代理的實現,具有可自定義的訓練流程。
    0
    0
    Vanilla Agents 是什麼?
    Vanilla Agents 是一個輕量級的 PyTorch 為基礎的框架,提供模組化且可擴展的核心強化學習代理實作。它支援 DQN、Double DQN、PPO 和 A2C 等演算法,並配備與 OpenAI Gym 兼容的可插拔環境封裝。用戶可以配置超參數、記錄訓練指標、保存檢查點並制圖學習曲線。程式碼架構清晰,非常適合研究原型設計、教育用途及新想法的基準測試。
    Vanilla Agents 核心功能
    • DQN 與 Double DQN 的實作
    • PPO 和 A2C 政策梯度代理
    • OpenAI Gym 環境封裝器
    • 可配置的超參數
    • 日誌與 TensorBoard 支援
    • 模型檢查點的存取與載入
精選