AI 工具
AI 智能代理
MCP
排名
提交及廣告
登入
TW
TW
首頁
標籤
사용자 정의 가능한 그리드
專業사용자 정의 가능한 그리드工具
專為高效與穩定性設計的사용자 정의 가능한 그리드工具,是實現專業成果的不二選擇。
사용자 정의 가능한 그리드
Pits and Orbs
Pits and Orbs 提供一個多代理格子世界環境,AI代理在此避免陷阱、收集寶珠,並在回合制場景中競爭。
0
0
訪問AI
Pits and Orbs 是什麼?
Pits and Orbs是一個用Python實作的開源強化學習環境,提供回合制多代理格子世界,在其中代理追求目標並面臨環境危險。每個代理必須在可調整的格子上導航,避免隨機放置的陷阱(會懲罰或終止回合),並收集寶珠來獲得正向獎勵。該環境支援競爭和合作模式,讓研究者探索多樣學習場景。簡單的API可無縫整合如Stable Baselines或RLlib等流行RL框架。目前主要特色包括可調格子尺寸、動態陷阱與寶珠分佈、可配置的獎勵結構,以及選擇性註解訓練數據追踪。
Pits and Orbs 核心功能
精選