專業RL-Benchmarks工具

專為高效與穩定性設計的RL-Benchmarks工具,是實現專業成果的不二選擇。

RL-Benchmarks

  • Gym-Recsys 提供可自訂的 OpenAI Gym 環境,用於擴展性訓練與評估強化學習推薦代理人
    0
    0
    Gym-Recsys 是什麼?
    Gym-Recsys 是一個工具箱,將推薦任務封裝成 OpenAI Gym 環境,使強化學習演算法能逐步與模擬的用戶-項目矩陣互動。它提供合成用戶行為產生器、支援載入流行資料集,並提供如 Precision@K 和 NDCG 等標準推薦評測指標。用戶可以自訂獎勵函數、用戶模型和項目池,用以實驗不同的 RL 基礎推薦策略,並具有可重現性。
  • RxAgent-Zoo利用RxPY的反應式編程來簡化模組化強化學習代理的開發與實驗。
    0
    0
    RxAgent-Zoo 是什麼?
    本質上,RxAgent-Zoo是一個反應式RL框架,將來自環境、重播緩衝區和訓練循環的資料事件視為可觀測的串流。使用者可以串接運算子來預處理觀測、更新網路和非同步記錄指標。此函式庫提供平行環境支援、可配置的排程器,以及與熱門的Gym和Atari基準測試的整合。插拔式API允許無縫切換代理元件,促進可重現性研究、快速實驗和擴展的訓練流程。
精選