DEf-MARL(多智能體強化學習去中心化執行框架)提供一個穩健的基礎設施,用於執行與訓練合作智能體,無需中央控制。它利用點對點通訊協議,分享政策與觀測數據,實現局部互動協調。該框架能無縫整合PyTorch及TensorFlow等常用RL工具包,提供可自訂的環境包裝器、分散式Rollout收集與梯度同步模組。用戶可定義特定智能體的觀測空間、獎勵函數與通訊拓撲。DEf-MARL支持運行時動態添加與移除智能體,通過複製關鍵狀態提升錯誤容忍,並採用自適應通訊調度平衡探索與利用。它透過平行模擬環境並減少中心瓶頸,加速訓練,適用於大規模MARL研究及工業模擬。