Halite II 是一個開源挑戰框架,舉辦用戶撰寫的機器人之間的回合制策略比賽。每回合,代理接收地圖狀態,發出移動及攻擊命令,並競爭控制最多的領土。平台包括遊戲伺服器、地圖解析器與視覺化工具。開發者可以在本地測試、改進啟發式演算法、優化性能,並提交到線上排行榜。系統支持反覆改良機器人、多智能體合作與標準化環境中的策略研究。
Pits and Orbs是一個用Python實作的開源強化學習環境,提供回合制多代理格子世界,在其中代理追求目標並面臨環境危險。每個代理必須在可調整的格子上導航,避免隨機放置的陷阱(會懲罰或終止回合),並收集寶珠來獲得正向獎勵。該環境支援競爭和合作模式,讓研究者探索多樣學習場景。簡單的API可無縫整合如Stable Baselines或RLlib等流行RL框架。目前主要特色包括可調格子尺寸、動態陷阱與寶珠分佈、可配置的獎勵結構,以及選擇性註解訓練數據追踪。