

專業自訂獎勵函數工具

專為高效與穩定性設計的自訂獎勵函數工具，是實現專業成果的不二選擇。

自訂獎勵函數

StarCraft II Reinforcement Learning Agent
一個開源的增強學習代理，利用PPO在DeepMind的PySC2環境中訓練並玩星際爭霸II。

0


0
訪問AI
StarCraft II Reinforcement Learning Agent 是什麼？
此存儲庫提供一個完整的星際爭霸II遊戲研究增強學習框架。核心代理使用PPO來學習策略網絡，詮釋來自PySC2環境的觀察數據，並輸出精確的遊戲內動作。開發者可以配置神經網絡層、獎勵塑造與訓練計劃，以優化性能。系統支持多處理技術以高效收集樣本，並包含監控訓練曲線的日誌工具與測試已訓練策略的評估腳本（對完成或內建的AI對手）。程式碼以Python撰寫，利用TensorFlow進行模型定義與優化。用戶可以擴展自定義獎勵函數、狀態前處理或網路架構，以符合特定研究需求。
StarCraft II Reinforcement Learning Agent 核心功能

基於PPO的SC2環境策略訓練

與DeepMind PySC2整合進行狀態/行動管理

支持可配置的神經網絡架構和獎勵

支持多處理並行樣本收集

日誌記錄與TensorBoard集成

用於性能比較的評估腳本
Gym-Recsys
Gym-Recsys 提供可自訂的 OpenAI Gym 環境，用於擴展性訓練與評估強化學習推薦代理人

0


0
訪問AI
Gym-Recsys 是什麼？
Gym-Recsys 是一個工具箱，將推薦任務封裝成 OpenAI Gym 環境，使強化學習演算法能逐步與模擬的用戶-項目矩陣互動。它提供合成用戶行為產生器、支援載入流行資料集，並提供如 Precision@K 和 NDCG 等標準推薦評測指標。用戶可以自訂獎勵函數、用戶模型和項目池，用以實驗不同的 RL 基礎推薦策略，並具有可重現性。
Gym-Recsys 核心功能



精選

專業自訂獎勵函數工具

專為高效與穩定性設計的自訂獎勵函數工具，是實現專業成果的不二選擇。

自訂獎勵函數

StarCraft II Reinforcement Learning Agent

Gym-Recsys