多機能な強化學習演算法ツール集

提供元 Refly.ai - Refly.AI は、非技術系のクリエイターが自然言語と視覚的キャンバスを使ってワークフローを自動化できるようにするプラットフォームです。



Refly.ai - Refly.AI は、非技術系のクリエイターが自然言語と視覚的キャンバスを使ってワークフローを自動化できるようにするプラットフォームです。





AIニュース

ログイン

強化學習演算法

PommerLearn
PPO、DQNのトレーニングと評価ツールを提供するRLフレームワークで、競争力のあるPommermanエージェントの開発を支援します。

0


0
AIを訪れる
PommerLearnとは？
PommerLearnは、研究者や開発者がPommermanゲーム環境でマルチエージェントRLボットを訓練できるようにします。人気のあるアルゴリズム（PPO、DQN）のあらかじめ用意された実装、ハイパーパラメータ用の柔軟な設定ファイル、自動ロギングとトレーニングメトリクスの可視化、モデルのチェックポイント、評価スクリプトを含みます。そのモジュール化されたアーキテクチャにより、新しいアルゴリズムの拡張、環境のカスタマイズ、PyTorchなどの標準MLライブラリとの統合が容易です。
PommerLearn コア機能

PPOアルゴリズムの実装

DQNアルゴリズムの実装

Pommerman環境ラッパー

設定可能なハイパーパラメータ

ロギングとTensorBoard統合

モデルのチェックポイントと保存

評価スクリプト
MultiAgent-ReinforcementLearning
Open-source Python framework implementing multi-agent reinforcement learning algorithms for cooperative and competitive environments.

0


0
AIを訪れる
MultiAgent-ReinforcementLearningとは？
This repository provides a complete suite of multi-agent reinforcement learning algorithms—including MADDPG, DDPG, PPO, and more—integrated with standard benchmarks like the Multi-Agent Particle Environment and OpenAI Gym. It features customizable environment wrappers, configurable training scripts, real-time logging, and performance evaluation metrics. Users can easily extend algorithms, adapt to custom tasks, and compare policies across cooperative and adversarial settings with minimal setup.
MultiAgent-ReinforcementLearning コア機能



フィーチャー

強化學習演算法

PommerLearn

MultiAgent-ReinforcementLearning