AI 工具
AI 智能代理
MCP
排名
提交及廣告
登入
TW
TW
首頁
標籤
RL 라이브러리
專業RL 라이브러리工具
專為高效與穩定性設計的RL 라이브러리工具,是實現專業成果的不二選擇。
RL 라이브러리
Pits and Orbs
Pits and Orbs 提供一個多代理格子世界環境,AI代理在此避免陷阱、收集寶珠,並在回合制場景中競爭。
0
0
訪問AI
Pits and Orbs 是什麼?
Pits and Orbs是一個用Python實作的開源強化學習環境,提供回合制多代理格子世界,在其中代理追求目標並面臨環境危險。每個代理必須在可調整的格子上導航,避免隨機放置的陷阱(會懲罰或終止回合),並收集寶珠來獲得正向獎勵。該環境支援競爭和合作模式,讓研究者探索多樣學習場景。簡單的API可無縫整合如Stable Baselines或RLlib等流行RL框架。目前主要特色包括可調格子尺寸、動態陷阱與寶珠分佈、可配置的獎勵結構,以及選擇性註解訓練數據追踪。
Pits and Orbs 核心功能
Beer Game Environment
一個Python OpenAI Gym環境,模擬啤酒遊戲供應鏈,用於訓練和評估RL代理。
0
0
訪問AI
Beer Game Environment 是什麼?
啤酒遊戲環境提供一個四階段啤酒供應鏈——零售商、批發商、經銷商與製造商的離散時間模擬,並曝光OpenAI Gym介面。代理會收到包括現有庫存、管線庫存和進貨訂單的觀察資訊,然後輸出訂貨量。該環境計算每步的庫存持有和缺貨成本,並支持可定制的需求分布和領先時間。它可與熱門RL庫如Stable Baselines3無縫集成,方便研究人員和教育者在供應鏈優化任務中進行基準測試和訓練。
Beer Game Environment 核心功能
精選