Algorithmus-Benchmarking

  • 協調強化学習タスクにおいて、多エージェントシステムが通信プロトコルを学習・解析するためのオープンソースPyTorchフレームワーク。
    0
    0
    Emergent Communication in Agentsとは?
    エマージング・コミュニケーション・イン・エージェンツは、多エージェントシステムが独自の通信プロトコルを開発する仕組みを研究する研究者向けのPyTorchベースのオープンソースフレームワークです。リファレンスゲーム、組合せゲーム、物体識別課題など、協調型強化学習タスクの柔軟な実装を提供しています。ユーザーはスピーカーとリスナーのエージェントアーキテクチャを定義し、語彙数やシーケンス長などのメッセージチャネルのプロパティを指定し、方策勾配や教師あり学習などのトレーニング戦略を選択します。このフレームワークには、実験の実行、通信効率性の分析、エマージング・ランゲージの可視化のためのエンドツーエンドのスクリプトが含まれます。モジュール式設計により、新しいゲーム環境やカスタム損失関数を容易に拡張可能です。研究者は公開済み研究の再現、新アルゴリズムのベンチマーク、エージェント言語の構成性と意味論の調査が行えます。
    Emergent Communication in Agents コア機能
    • 参照ゲームと組合せゲームの実装
    • 設定可能なスピーカー-リスナーエージェントアーキテクチャ
    • 語彙や長さを調整可能なメッセージチャネル
    • ポリシー勾配や教師あり学習のサポート
    • エンドツーエンドの訓練・評価スクリプト
    • エマージング・ランゲージの可視化ツール
    • 新しい環境を追加できるモジュラー設計
  • 複数の協力および競合するエージェント鉱夫がグリッドベースの世界で資源を収集するマルチエージェント学習を模擬するRL環境。
    0
    0
    Multi-Agent Minersとは?
    Multi-Agent Minersは、複数の自律型鉱夫エージェントが移動、掘削、資源収集をしながら互いに相互作用するグリッドの世界を提供します。設定可能な地図サイズ、エージェント数、報酬構造をサポートし、競争または協力シナリオの作成を可能にします。このフレームワークは、PettingZooを通じて人気のRLライブラリと連携し、リセット、ステップ、レンダリングの標準APIを提供します。可視化モードとロギングサポートにより行動と結果の分析を支援し、研究、教育、アルゴリズムのベンチマークに最適です。
  • 協力的検索タスク用のPythonベースの多エージェント強化学習環境で、通信と報酬を設定可能。
    0
    0
    Cooperative Search Environmentとは?
    Cooperative Search Environmentは、離散格子空間と連続空間の両方で協力検索タスクに最適化された柔軟でgym互換のマルチエージェント強化学習環境を提供します。エージェントは部分観測の下で動作し、カスタマイズ可能な通信トポロジーに基づいて情報を共有できます。フレームワークは、探索と救助、動的ターゲット追跡、協調マッピングなどの事前定義されたシナリオをサポートし、カスタム環境や報酬構造を定義するためのAPIを備えています。Stable Baselines3やRay RLlibなどの人気RLライブラリとシームレスに統合され、性能分析用のロギングユーティリティやリアルタイム監視用のビジュアルツールも含まれます。研究者は、格子のサイズ、エージェントの数、センサー範囲、報酬共有メカニズムを調整して、協調戦略を評価し、新しいアルゴリズムを効果的にベンチマークできます。
フィーチャー