AI 工具
AI 智能代理
MCP
排名
提交及廣告
登入
TW
TW
首頁
標籤
настраиваемые функции вознаграждения
專業настраиваемые функции вознаграждения工具
專為高效與穩定性設計的настраиваемые функции вознаграждения工具,是實現專業成果的不二選擇。
настраиваемые функции вознаграждения
RL Shooter
RL Shooter 提供一個可自訂的基於 Doom 的強化學習環境,用於訓練 AI 代理在第一人稱射擊遊戲中導航與射擊目標。
0
0
訪問AI
RL Shooter 是什麼?
RL Shooter 是一個基於 Python 的框架,整合 ViZDoom 與 OpenAI Gym API,以建立一個彈性的 FPS 遊戲強化學習環境。使用者可自訂場景、地圖及獎勵結構,以進行導航、目標偵測和射擊任務的訓練。它支援可配置的觀察幀、行動空間與日誌功能,並支援流行的深度 RL 函式庫,例如 Stable Baselines 和 RLlib,以提供明確的性能追蹤及實驗可重複性。
RL Shooter 核心功能
Simple Playgrounds
一個輕量級的Python庫,用於創建可定製的2D網格環境,以訓練和測試增強學習代理人。
0
0
訪問AI
Simple Playgrounds 是什麼?
Simple Playgrounds提供一個模塊化的平台,用於建立交互式的2D網格環境,代理人在其中可以導航迷宮、與物件互動並完成任務。用戶可以通過簡單的YAML或Python腳本來定義環境佈局、物體行為和獎勵函數。內建的Pygame渲染器提供實時可視化,且基於步驟的API確保與Stable Baselines3等RL庫的無縫集成。支援多代理、多碰撞偵測及可自訂的物理參數,Simple Playgrounds讓原型設計、基準測試與教育演示算法變得更便利。
Simple Playgrounds 核心功能
Gym-Recsys
Gym-Recsys 提供可自訂的 OpenAI Gym 環境,用於擴展性訓練與評估強化學習推薦代理人
0
0
訪問AI
Gym-Recsys 是什麼?
Gym-Recsys 是一個工具箱,將推薦任務封裝成 OpenAI Gym 環境,使強化學習演算法能逐步與模擬的用戶-項目矩陣互動。它提供合成用戶行為產生器、支援載入流行資料集,並提供如 Precision@K 和 NDCG 等標準推薦評測指標。用戶可以自訂獎勵函數、用戶模型和項目池,用以實驗不同的 RL 基礎推薦策略,並具有可重現性。
Gym-Recsys 核心功能
gym-fx
gym-fx 提供一個可自訂的 OpenAI Gym 環境,用於訓練和評估強化學習代理,以進行外匯交易策略。
0
0
訪問AI
gym-fx 是什麼?
gym-fx 是一個開源的 Python 函式庫,利用 OpenAI Gym 介面實作模擬外匯交易環境。它支援多貨幣對,整合歷史價格資料、技術指標,並提供完全可自訂的獎勵函數。藉由提供一個標準化的 API,gym-fx 簡化了為演算法交易進行基準測試和發展的流程。用戶可以配置市場滑點、交易成本以及觀察空間,以逼真模擬實盤交易情況,促進策略的開發與評估。
gym-fx 核心功能
精選