DEf-MARL(分散型実行フレームワーク)は、中央コントローラーなしで協調エージェントを実行・訓練する堅牢なインフラを提供します。ピアツーピア通信プロトコルを活用してエージェント間でポリシーや観測情報を共有し、ローカルなインタラクションを通じて協調を実現します。このフレームワークは、PyTorchやTensorFlowなどの一般的なRLツールキットとシームレスに連携し、カスタマイズ可能な環境ラッパー、分散ロールアウト収集、および勾配同期モジュールを提供します。ユーザーはエージェント固有の観測空間、報酬関数、および通信トポロジーを定義可能です。DEf-MARLは動的なエージェントの追加・削除をサポートし、重要な状態をノード間で複製することでフォールトトレランスを確保し、探索と利用のバランスをとるための適応的な通信スケジューリングも行います。環境のシミュレーションの並列化と中央のボトルネック削減によりトレーニングを加速し、大規模なMARL研究や産業シミュレーションに適しています。