

專業可配置環境工具

專為高效與穩定性設計的可配置環境工具，是實現專業成果的不二選擇。

可配置環境

PommerLearn
提供PPO、DQN訓練及評估工具的RL框架，用於開發具競爭力的Pommerman遊戲代理人。

0


0
訪問AI
PommerLearn 是什麼？
PommerLearn使研究人員和開發者能在Pommerman遊戲環境中訓練多智能體RL機器人。它包含現成的流行演算法（PPO、DQN）實作、彈性的超參數配置文件、自動記錄和訓練指標可視化、模型檢查點和評估腳本。其模組化架構便於擴充新演算法、自訂環境及整合標準ML庫如PyTorch。
PommerLearn 核心功能

PPO演算法實作

DQN演算法實作

Pommerman環境包裝器

可配置超參數

記錄與TensorBoard整合

模型檢查點與保存

評估腳本
Pits and Orbs
Pits and Orbs 提供一個多代理格子世界環境，AI代理在此避免陷阱、收集寶珠，並在回合制場景中競爭。

0


0
訪問AI
Pits and Orbs 是什麼？
Pits and Orbs是一個用Python實作的開源強化學習環境，提供回合制多代理格子世界，在其中代理追求目標並面臨環境危險。每個代理必須在可調整的格子上導航，避免隨機放置的陷阱（會懲罰或終止回合），並收集寶珠來獲得正向獎勵。該環境支援競爭和合作模式，讓研究者探索多樣學習場景。簡單的API可無縫整合如Stable Baselines或RLlib等流行RL框架。目前主要特色包括可調格子尺寸、動態陷阱與寶珠分佈、可配置的獎勵結構，以及選擇性註解訓練數據追踪。
Pits and Orbs 核心功能



精選

專業可配置環境工具

專為高效與穩定性設計的可配置環境工具，是實現專業成果的不二選擇。

可配置環境

PommerLearn

Pits and Orbs