高評分리플레이 버퍼工具

探索使用者最推薦的리플레이 버퍼工具,以高效、穩定的解決方案提升您的工作品質。

리플레이 버퍼

  • Acme 是一個模組化的強化學習框架,提供可重用的代理元件和高效的分散式訓練流程。
    0
    0
    Acme 是什麼?
    Acme 是一個基於 Python 的框架,簡化了增強學習代理的開發與評估。它提供預先建立的代理實現(例如 DQN、PPO、SAC)、環境封裝、重播緩衝區以及分散式執行引擎。研究人員可以混合搭配元件,原型設計新算法,通過內建日誌監控訓練指標,並利用擴展式分散式流程進行大規模實驗。Acme 與 TensorFlow 和 JAX 整合,支援透過 OpenAI Gym 接口的自定義環境,並包含快照、評估和超參數配置的工具。
精選