

專業에이전트 내비게이션工具

專為高效與穩定性設計的에이전트 내비게이션工具，是實現專業成果的不二選擇。

에이전트 내비게이션

Pits and Orbs
Pits and Orbs 提供一個多代理格子世界環境，AI代理在此避免陷阱、收集寶珠，並在回合制場景中競爭。

0


0
訪問AI
Pits and Orbs 是什麼？
Pits and Orbs是一個用Python實作的開源強化學習環境，提供回合制多代理格子世界，在其中代理追求目標並面臨環境危險。每個代理必須在可調整的格子上導航，避免隨機放置的陷阱（會懲罰或終止回合），並收集寶珠來獲得正向獎勵。該環境支援競爭和合作模式，讓研究者探索多樣學習場景。簡單的API可無縫整合如Stable Baselines或RLlib等流行RL框架。目前主要特色包括可調格子尺寸、動態陷阱與寶珠分佈、可配置的獎勵結構，以及選擇性註解訓練數據追踪。
Pits and Orbs 核心功能

回合制多代理格子世界模擬

可自訂格子大小和佈局

隨機陷阱與寶珠獎勵

支援競爭與合作模式

簡單Gym相容API

回合記錄與渲染選項
RL Shooter
RL Shooter 提供一個可自訂的基於 Doom 的強化學習環境，用於訓練 AI 代理在第一人稱射擊遊戲中導航與射擊目標。

0


0
訪問AI
RL Shooter 是什麼？
RL Shooter 是一個基於 Python 的框架，整合 ViZDoom 與 OpenAI Gym API，以建立一個彈性的 FPS 遊戲強化學習環境。使用者可自訂場景、地圖及獎勵結構，以進行導航、目標偵測和射擊任務的訓練。它支援可配置的觀察幀、行動空間與日誌功能，並支援流行的深度 RL 函式庫，例如 Stable Baselines 和 RLlib，以提供明確的性能追蹤及實驗可重複性。
RL Shooter 核心功能
Learning-to-Communicate-PyTorch
一個PyTorch框架，讓代理能在多代理強化學習任務中學習新興的通信協議。

0


0
訪問AI
Learning-to-Communicate-PyTorch 是什麼？
此儲存庫利用PyTorch實作多代理增強學習中的新興通信。使用者可配置發送與接收神經網路來進行參照遊戲或合作導航，促使代理建立離散或連續的通信通道。提供訓練、評估與視覺化的腳本，以及用於環境建立、訊息編碼與解碼的工具。研究人員可加入自訂任務、修改網路架構，並分析協議效率，加速新興代理通信的實驗。
Learning-to-Communicate-PyTorch 核心功能



精選

專業에이전트 내비게이션工具

專為高效與穩定性設計的에이전트 내비게이션工具，是實現專業成果的不二選擇。

에이전트 내비게이션

Pits and Orbs

RL Shooter

Learning-to-Communicate-PyTorch