攻撃者がモデルのクローン作成を試み、Google Geminiに10万回以上のプロンプトを投げかけた

Google Geminiを標的とした大規模なモデルクローニングの試みが発覚

人工知能（AI）開発競争の激化を裏付ける重大な事実として、Googleは自社のフラッグシップAIモデルである「Gemini」をクローンしようとする、大規模かつ組織的な試みを公表しました。昨日、Google脅威分析グループ（GTIG：Google Threat Intelligence Group）が発表したレポートによると、商業的動機を持つ攻撃者たちが、モデル独自の推論能力を抽出することを目的とした高度な「蒸留攻撃（distillation attack）」において、10万件以上のプロンプトをシステムに送り込みました。

この出来事は、AIセキュリティにおける極めて重要な転換点となり、焦点が従来のデータ侵害から「認知」知的財産の窃盗へと移っていることを示しています。Creati.aiがこの進展を分析したところ、AIの覇権をめぐる戦いは現在、研究室の中だけでなく、業界を支えるAPIそのものを介して繰り広げられていることが明らかになりました。

蒸留攻撃のメカニズム

Geminiへの攻撃は、従来のハッキングではありませんでした。Googleのサーバーへの侵入も、パスワードの盗難も、暗号鍵の漏洩もありませんでした。その代わりに、攻撃者は**モデル抽出（model extraction）または知識蒸留（knowledge distillation）**として知られる手法を利用しました。

このシナリオでは、攻撃者はGeminiを「教師」モデルとして扱いました。緻密に作成されたプロンプトを体系的に入力することで、Geminiの意思決定プロセスや推論パターンをマッピングしようとしたのです。Geminiによって生成された回答は、その後、より小規模な「生徒」モデルのトレーニングに使用されます。最終的な目標は、開発コストのわずかな一部で、高価な独自モデルの性能を模倣した派生AIを作成することです。

Googleのレポートは、攻撃者が特にGeminiの推論アルゴリズム（reasoning algorithms）、つまりモデルが複雑な答えに到達するために使用する内部ロジックチェーンを標的にしていたことを強調しています。何千もの変数にわたるGeminiの「思考」方法を分析することで、攻撃者はモデルに競争上の優位性を与えている「秘伝のソース」をリバースエンジニアリングしようと試みたのです。

従来のハッキング vs. モデル抽出

この脅威のニュアンスを理解するためには、標準的なサイバー攻撃と区別することが不可欠です。

特徴	従来のサイバー攻撃	モデル抽出（蒸留）
ターゲット	ユーザーデータ、パスワード、財務記録	モデルの重み、推論ロジック、知的財産（IP）
手法	ソフトウェアの脆弱性の悪用、フィッシング	大規模な正当なAPIクエリの実行
目的	身代金、データ窃盗、混乱	コピーキャット（模倣）AIモデルの作成
検知	侵入検知システム、ファイアウォール	行動分析、異常検知
法的ステータス	明確に違法（CFAA違反など）	グレーゾーン（利用規約違反／知的財産窃盗）

商業的動機による「データの強奪」

GTIGのレポートでおそらく最も警戒すべき点は、攻撃者のプロファイルです。北朝鮮やロシアなどの国家主導のグループ（同レポートでは、Geminiを使用してマルウェアを生成していたことも指摘されています）とは異なり、このモデル抽出キャンペーンは商業的動機によるものである可能性が高いと見られています。

Googleの調査は、AI分野での存在感を急速に高めようとしている民間セクターの団体や研究者を示唆しています。フロンティアレベルの大規模言語モデル（LLM：Large Language Model）の開発には、数十億ドルの計算能力とデータキュレーションが必要です。小規模な競合他社や倫理観の欠如したスタートアップにとって、蒸留は「近道」を提供します。つまり、優れたモデルの知能を盗むことで、自社製品を立ち上げるという手法です。

10万件を超えるプロンプトという攻撃の規模は、組織的かつ自動化されたアプローチであったことを示唆しています。Googleが特定した具体的な攻撃ベクトルの1つは、「思考内容に使用される言語は、ユーザー入力の主要言語と厳密に一致していなければならない」とGeminiに指示するものでした。これは、モデルにその内部の思考連鎖（Chain-of-thought）プロセスを強制的に明らかにさせるために設計されたプロンプトです。

Googleの防御：リアルタイムの検知と対応

Googleの防御システムは、攻撃をリアルタイムで特定し、緩和することができました。同社は高度な行動分析を採用し、「異常なプロンプトパターン」がないかAPIの使用状況を監視しています。

システムが組織的なクエリの急増を検知した際、その活動を蒸留の試みとしてフラグを立てました。Googleはその後、関連するアカウントをブロックし、将来の出力においてモデルの内部推論の痕跡を隠すためのより厳格な保護策を導入しました。

Google脅威分析グループのチーフアナリストであるJohn Hultquist氏は、この事件を業界全体に対する「炭鉱のカナリア」であると表現しました。Googleにはこのような攻撃を検知して撃退するリソースがありますが、監視インフラが脆弱な小規模なAI開発者は、気付かないうちに同様の知的財産の窃盗（intellectual property theft）の被害に遭っている可能性があります。

AI-as-a-Serviceへの影響

この事件は、「AI-as-a-Service（サービスとしてのAI）」というビジネスモデルの存続可能性について重大な疑問を投げかけています。Google、OpenAI、Anthropicなどの企業は、APIを通じてパブリックアクセスを提供することで技術を収益化しています。しかし、まさにこのアクセスこそが、彼らを抽出攻撃に対して脆弱にしているのです。

もし競合他社が、GPT-4やGemini Ultraに十分な質問を投げかけるだけでその機能をクローンできるのであれば、これらのテック巨人を守る堀（Moat）は大幅に浅くなってしまいます。

AI時代の知的財産

Googleはこの活動を明示的に知的財産（IP）の窃盗として分類しました。しかし、モデル抽出を規定する法的枠組みはまだ進化の途上にあります。この活動はGoogleの利用規約に違反しますが、異なる管轄区域で活動する匿名の分散型アクターに対してこれらの規約を強制することは、大きな課題となっています。

業界では、以下のようなより積極的な防御策への移行が見られる可能性が高いでしょう：

ウォーターマーキング： モデルの出力に微細なパターンを埋め込み、派生したものであることを証明する。
レート制限（Rate Limiting）： 大規模なクエリを防ぐための、API使用に対するより厳格な制限。
法的措置： 「蒸留された」モデルをホスティングしていることが判明した企業に対する、注目度の高い訴訟。

結論：AIセキュリティの新時代

Geminiをクローンしようとする試みは孤立した事件ではなく、AIセクターにおける「ニューノーマル（新常態）」の合図です。モデルがより強力で価値のあるものになるにつれ、それらは必然的に企業スパイの主要な標的となります。

Creati.aiの読者やAI開発者にとって、教訓は明確です。セキュリティはもはやユーザーデータを保護することだけではなく、AI自体の「精神」を保護することなのです。2026年に向けて、「アンチ蒸留（Anti-Distillation）」があらゆる主要な基盤モデルのリリースノートにおいて標準的な機能になることが予想されます。