万能なestrutura PyTorchツール

多様な用途に対応可能なestrutura PyTorchツールを利用して、業務の効率化と柔軟性を実現しましょう。

estrutura PyTorch

  • マルチエージェント強化学習課題においてエージェントが出現通信プロトコルを学習できるPyTorchフレームワーク。
    0
    0
    Learning-to-Communicate-PyTorchとは?
    このリポジトリは、PyTorchを使用したマルチエージェント強化学習における出現通信を実現します。ユーザーは送信者および受信者のニューラルネットワークを設定し、指示ゲームや協力ナビゲーションをプレイさせることで、離散または連続の通信チャネルを開発させます。訓練、評価、学習されたプロトコルの可視化のためのスクリプトや、環境作成、メッセージのエンコード・デコードのユーティリティも提供されています。研究者はカスタムタスクの追加やネットワークアーキテクチャの変更、プロトコルの効率性解析などを行い、エージェント通信の迅速な実験を促進します。
  • PyTorchとUnity ML-Agentsを使用して協調エージェントの訓練のための分散型多エージェントDDPG強化学習を実装します。
    0
    0
    Multi-Agent DDPG with PyTorch & Unity ML-Agentsとは?
    このオープンソースプロジェクトは、PyTorchとUnity ML-Agentsを基盤とした完全な多エージェント強化学習フレームワークを提供します。分散型DDPGアルゴリズム、環境ラッパー、訓練スクリプトを含みます。ユーザーはエージェントのポリシー、批評ネットワーク、リプレイバッファー、並列訓練ワーカーを設定できます。ロギングフックによりTensorBoardでの監視が可能で、モジュラーコードはカスタム報酬関数や環境パラメータをサポートします。リポジトリには協力ナビゲーションタスクを示すサンプルUnityシーンが含まれ、シミュレーション内での多エージェントシナリオの拡張やベンチマークに最適です。
フィーチャー