專業級強化學習研究解決方案

贊助商 Flowith - Flowith 是一個基於畫布的代理型工作空間，提供免費的 🍌Nano Banana Pro 和其他高效模型...



Flowith - Flowith 是一個基於畫布的代理型工作空間，提供免費的 🍌Nano Banana Pro 和其他高效模型...





AI 新聞

登入

強化學習研究

Multi-Agent Reinforcement Learning
一個用於在多種環境中訓練和評估合作與競爭多智能體強化學習算法的開源框架。

0


0
訪問AI
Multi-Agent Reinforcement Learning 是什麼？
alaamoheb的多智能體強化學習是一個全面的開源庫，旨在促進多個智能體在共享環境中的開發、訓練與評估。它包括價值基和策略基算法如DQN、PPO、MADDPG等的模組化實現。此存儲庫支持與OpenAI Gym、Unity ML-Agents和星際爭霸多智能體挑戰的整合，允許用戶在研究和實際應用中實驗。通過可配置的YAML格式實驗設置、日誌工具與可視化工具，實踐者可以監控學習曲線、調整超參數、比較不同算法。這個框架加快了合作、競爭與混合多智能體任務的實驗速度，促進可重複性研究與基準測試。
Multi-Agent Reinforcement Learning 核心功能

DQN、PPO、MADDPG的實現

支持OpenAI Gym、Unity ML-Agents、SMAC

可配置的YAML實驗文件

日誌和TensorBoard整合

評估和可視化工具
MADDPG-Keras
基於 Keras 的多智能體深度確定性策略梯度算法的實現，用於合作與競爭多智能體強化學習。

0


0
訪問AI
MADDPG-Keras 是什麼？
MADDPG-Keras 通過在 Keras 中實現 MADDPG 算法，為多智能體強化學習研究提供完整框架。它支持連續動作空間、多個智能體和標準的 OpenAI Gym 環境。研究人員和開發者可以配置神經網絡結構、訓練超參數和獎勵函數，並通過內建的日誌和模型檢查點加速策略學習與基準測試。
MADDPG-Keras 核心功能



精選

強化學習研究

Multi-Agent Reinforcement Learning

MADDPG-Keras