AI News

Cisco、ギガワット規模のクラスター向け Silicon One G300 で AI ネットワーキングを再定義

本日アムステルダムで開催された Cisco Live EMEA において、Cisco は Silicon One G300 の発表により、人工知能(Generative AI)インフラの進化における重要な節目を刻みました。この新しいスイッチシリコンは、ギガワット規模の AI クラスターの要求に合わせて特別に設計されており、電力効率とジョブ完了速度の重要なボトルネックに対処しながら、業界のイーサネット(Ethernet)ベースの AI ファブリックへの移行を加速させることを約束します。

AI ワークロードが静的なトレーニングモデルから動的でエージェント型のワークフローへと移行するにつれ、基盤となるインフラはかつてない圧力に直面しています。Creati.ai では、G300 を単なるハードウェアのアップグレードではなく、「Intelligent Collective Networking」への戦略的な転換点であると考えています。これは、同期的な高帯域幅 GPU 通信と、次世代 AI エージェントの予測不可能なトラフィックパターンとの衝突を処理するために設計されたアーキテクチャです。

スピードのアーキテクチャ:102.4 Tbps とその先へ

本日の発表の目玉は、Silicon One G300 の生の容量です。単一のデバイスで 102.4テラビット/秒(Tbps)Ethernet switching 容量を提供し、このチップは Broadcom や NVIDIA といった競合他社の最先端製品と直接競合する立場にあります。

重要な点として、G300 は Cisco 自社開発の 200 Gbps SerDes 技術を搭載した 1.6T Ethernet ポート をサポートしています。この統合により、最大 512 ポートをサポートする高ラディックス(high-radix)スケーリングが可能になり、ネットワークアーキテクトはより「フラット」なネットワークを構築できます。GPU 間のホップ数を減らすことで、オペレーターは遅延と消費電力を大幅に削減できます。これら 2 つの指標は、ハイパースケーラーやネオクラウドにとっての総所有コスト(TCO)を定義するものです。

Cisco のプレジデント兼最高製品責任者(CPO)である Jeetu Patel 氏は、基調講演の中でこれらの技術の統合を強調しました。「AI イノベーションはかつてない速さで進んでいます... 本日の発表は、統合プラットフォームとしての Cisco の力を浮き彫りにし、シリコンとシステムのイノベーションがどのように組み合わさって、データセンターから職場に至るまで、お客様に価値をもたらすかを示しています。」

Intelligent Collective Networking による効率のパラドックスの解決

生の速度は、ネットワークの混雑によって無効化されることがよくあります。従来の AI クラスターでは、数千の GPU が同時に通信しようとすると、パケットロスやジッターによってトレーニングジョブが停滞し、高価な計算サイクルが無駄になる可能性があります。Cisco は、Intelligent Collective Networking と呼ばれる一連の機能によってこれを解決しようとしています。

G300 アーキテクチャは、大規模な 252MB の完全共有パケットバッファ をダイ上に直接統合しています。メモリを分割する従来の設計とは異なり、G300 では任意のポートからのパケットが利用可能な任意のスペースを使用できます。Cisco の内部シミュレーションによると、これにより業界の代替案と比較して 2.5倍のバースト吸収能力の向上 が実現します。

AI モデルのトレーニングにおいて、テールレイテンシ(最も遅いパケット)がクラスター全体の速度を左右しますが、このバッファリング機能は革新的です。Cisco の報告によると、このアーキテクチャは非最適化トラフィックパターンと比較して、ネットワーク使用率(スループット)を 33% 向上 させ、AI 研究者にとって最も重要な Job Completion Time (JCT) を 28% 改善 します。

ハードウェアアクセラレーションによる負荷分散

G300 の際立った技術的特徴の一つは、負荷分散へのアプローチです。従来のソフトウェアベースのネットワークチューニングは、AI ワークロードに特有のマイクロ秒レベルのバーストに反応するには遅すぎることが多々あります。

G300 は、ハードウェアで パスベースの負荷分散 を実装しており、ソフトウェアの同等機能よりも 10万倍速く 混雑イベントやネットワーク障害に反応できます。これにより、手動の介入なしにトラフィックが利用可能なすべてのパスにインテリジェントに分散されます。数万個の GPU を備えたクラスターを管理するオペレーターにとって、この自動化は、InfiniBand や初期の Ethernet AI 導入における悪名高い課題であった、ネットワークファブリックの絶え間ない手動の「チューニング」の必要性を取り除きます。

比較:Cisco Silicon One G300 の主要仕様

以下の表は、新しい G300 シリコンの主要な技術仕様とパフォーマンス指標を、AI ネットワーキングの標準的な業界ベースラインと比較したものです。

表 1: Cisco Silicon One G300 の技術的ハイライト

機能 仕様 AI ワークロードへの影響
スイッチング容量 102.4 Tbps ギガワット級クラスターの大規模なスケールアウトを可能にする
ポートサポート 1.6T Ethernet 配線の複雑さを軽減し、ラックあたりの密度を高める
パケットバッファ 252MB(完全共有) マイクロバーストを吸収し、トレーニング中のパケットロスを防止する
負荷分散 ハードウェアベース(パス認識型) ソフトウェアよりも10万倍速く混雑イベントに反応する
スループット向上 +33% の使用率 高価な GPU の稼働時間と投資収益率(ROI)を最大化する
ジョブ完了 28% 高速化(非最適化比較) 基盤モデルのトレーニングにおける市場投入までの時間を短縮する
アーキテクチャ プログラム可能な P4 将来のプロトコル(UEC など)を導入後に追加可能

AgenticOps の台頭とシステム統合

Cisco の戦略はシリコンにとどまりません。同社は、AI エージェントがツールや他のエージェントと自律的に対話するシステムである「エージェント型 AI(Agentic AI)」の複雑さを管理するために設計された一連の運用ツール、AgenticOps も発表しました。

これらの新機能は Nexus One 管理コンソールに統合されており、ネットワークの健全性を一元的に把握できます。G300 チップ(プログラム可能なセッションレベルの診断を提供)からのテレメトリと、高レベルのソフトウェアオブザーバビリティを組み合わせることで、IT チームはパフォーマンス低下の根本原因(ケーブルの故障か、ルーティングテーブルの設定ミスか)を、クラスター全体に影響が及ぶ前に特定できます。

さらに Cisco は、G300 が新しい Cisco 8000 および Nexus 9100 システムに搭載されることを発表しました。これらの固定型およびモジュール型システムは、既存のデータセンターインフラのリプレースメントとして設計されており、同社の「現状維持でのアップグレード(upgrade in place)」の哲学をサポートしています。これはチップの 適応型パケット処理(Adaptive Packet Processing) によって促進され、新しいプロトコル(新興の Ultra Ethernet Consortium (UEC) 標準など)をハードウェアの交換ではなくソフトウェアアップデート経由で実装できるようになります。

自律エージェント時代におけるセキュリティ

高速なネットワークは潜在的な脅威の拡散も加速させることを認識し、Cisco は AI Defense ソリューションのアップデートを公開しました。これには、エージェント型のワークフローに対する「インテント認識型のインスペクション」が含まれます。AI エージェントが自律的にリソースを要求し、ツールを実行し始めると、ネットワークはそれらのアクションが正当であるかを検証する必要があります。更新された SASE (Secure Access Service Edge) 製品は、エージェント型トラフィックの「なぜ」と「どのように」を評価できるようになり、これまで純粋なハイパフォーマンスコンピューティング環境には欠けていた自律システムに対するガバナンスの層を提供します。

可用性と市場展望

G300 が示唆するものは、より広範な半導体およびデータセンター市場にとって重要です。インテリジェントなバッファリングと負荷分散を通じて、Ethernet が InfiniBand のような特殊な相互接続のパフォーマンスに匹敵、あるいはそれを上回ることができると証明することで、Cisco は AI ネットワーキングのオープンスタンダードへの業界の動きを裏付けています。

Cisco は Silicon One G300 SDK が現在入手可能 であることを確認しており、このチップを利用した最初のハードウェアシステムは 2026年後半 に出荷される予定です。

2027年のインフラを現在計画している企業やハイパースケーラーにとって、トレーニング時間の 28% 短縮という約束は、数億ドルの潜在的なコスト削減を意味します。AI レースが激化する中、ネットワークの効率性は GPU の速度と同じくらい重要になってきており、G300 により、Cisco はその未来における強力な主張を打ち出しました。

フィーチャー