

專業fonctions de récompense personnalisables工具

專為高效與穩定性設計的fonctions de récompense personnalisables工具，是實現專業成果的不二選擇。

fonctions de récompense personnalisables

MAPF_G2RL
MAPF_G2RL 是一個Python框架，用於訓練深度強化學習代理，以高效的多智能體路徑搜尋在圖上。

0


0
訪問AI
MAPF_G2RL 是什麼？
MAPF_G2RL 是一個開源研究框架，將圖論與深度強化學習結合起來，以解決多智能體路徑搜尋問題（MAPF）。它將節點和邊編碼為向量表示，定義空間和碰撞感知的獎勵函數，支援 DQN、PPO、A2C 等多種 RL 算法。框架通過生成隨機圖或導入現實世界地圖來自動創建場景，並管理訓練循環以同時優化多個代理的策略。訓練後，代理在模擬環境中進行評估，以測量路徑最優化、完成時間和成功率。其模組化設計使研究人員能擴展核心元件、整合新技術，並與傳統解算器做基準測試。
MAPF_G2RL 核心功能

圖編碼與預處理

可自訂的獎勵塑造模組

支援 DQN、PPO、A2C 等演算法

野外與真實地圖的場景產生器

多代理訓練與評估流程

性能日誌與視覺化工具
MARFT
MARFT是一個開源的多代理強化學習(RL)微調工具包，用於協作AI工作流程和語言模型優化。

0


0
訪問AI
MARFT 是什麼？
MARFT是一個基於Python的LLM，支持可重複實驗和快速原型設計協作式AI系統。
MARFT 核心功能
RL Shooter
RL Shooter 提供一個可自訂的基於 Doom 的強化學習環境，用於訓練 AI 代理在第一人稱射擊遊戲中導航與射擊目標。

0


0
訪問AI
RL Shooter 是什麼？
RL Shooter 是一個基於 Python 的框架，整合 ViZDoom 與 OpenAI Gym API，以建立一個彈性的 FPS 遊戲強化學習環境。使用者可自訂場景、地圖及獎勵結構，以進行導航、目標偵測和射擊任務的訓練。它支援可配置的觀察幀、行動空間與日誌功能，並支援流行的深度 RL 函式庫，例如 Stable Baselines 和 RLlib，以提供明確的性能追蹤及實驗可重複性。
RL Shooter 核心功能



精選

專業fonctions de récompense personnalisables工具

專為高效與穩定性設計的fonctions de récompense personnalisables工具，是實現專業成果的不二選擇。

fonctions de récompense personnalisables

MAPF_G2RL

MARFT

RL Shooter