Multi Agent Simulation提供靈活的API,用以定義具有自訂感測器、執行器和決策邏輯的代理類別。用戶配置帶有障礙物、資源和通信協定的環境,然後運行逐步或實時的模擬循環。內建的日誌系統、事件調度和Matplotlib整合,協助追蹤代理狀態並視覺化結果。模組化設計允許輕鬆擴展新的行為、環境及提升性能,非常適合學術研究、教育以及多代理場景的原型設計。
Pits and Orbs是一個用Python實作的開源強化學習環境,提供回合制多代理格子世界,在其中代理追求目標並面臨環境危險。每個代理必須在可調整的格子上導航,避免隨機放置的陷阱(會懲罰或終止回合),並收集寶珠來獲得正向獎勵。該環境支援競爭和合作模式,讓研究者探索多樣學習場景。簡單的API可無縫整合如Stable Baselines或RLlib等流行RL框架。目前主要特色包括可調格子尺寸、動態陷阱與寶珠分佈、可配置的獎勵結構,以及選擇性註解訓練數據追踪。