最新のChatGPTモデルがイーロン・マスクのAI生成百科事典「Grokipedia」を情報源として使用していることが判明、誤情報拡散への懸念が高まる

The Ouroboros Effect: OpenAI’s Latest Model Caught Citing Musk’s AI-Generated Encyclopedia

検証された人間の知識と機械が生成した出力との脆弱な境界線が破られたと報告されています。最近の調査で、OpenAIの最先端モデルであるGPT-5.2が、Elon MuskのxAIが開発したAI生成の百科事典「Grokipedia」を事実照会の主要な情報源として引用し始めていることが明らかになりました。この事態は、The Guardianのテストと独立研究者の裏取りで判明したもので、AIエコシステムにおける重要な転換点を示しています。データの出自（provenance）、循環的な報告（circular reporting）、および生成検索（生成検索（generative search））の時代における情報の完全性について緊急の疑問を投げかけます。

AIコミュニティにとって、これは単に二人のテック界の大物の政治的な小競り合いではありません。技術的な警告信号です。これは、トレーニングセットやRetrieval-Augmented Generation（RAG）パイプラインから低品質または合成データを除外するよう設計された安全策が、人間によって検証されたコンセンサスと競合する大規模言語モデル（LLMs）の出力を区別できないことを示唆しています。

The "Grokipedia" Infiltration

問題の深刻さを理解するには、まずソースを理解する必要があります。xAIが2025年10月に立ち上げたGrokipediaは、Elon MuskによってWikipediaの「最大限の真実（maximum truth）」に相当する代替として位置づけられました。MuskはWikipediaを「wokeな偏向（woke bias）」で批判することが多くあります。Wikipediaが分散した人間の編集者の軍団と厳格な引用方針に依存しているのに対し、Grokipediaは主にGrok LLMによって生成されます。ユーザーフィードバックを許容してはいるものの、最終的な編集判断は人間ではなくアルゴリズムによって行われます。

立ち上げ以来、Grokipediaは「first-principles thinking」を重視することに関して精査を受けてきました。これはMuskが好む命名法で、実際には確立された歴史的・科学的事実を再論争化する結果になることが多いとされています。批評家は、1月6日の議会襲撃、気候変動、LGBTQ+の権利に関して右派の物語を増幅する傾向を指摘してきました。

OpenAIのGPT-5.2—世界的なAIの信頼性の旗手と見なされる存在—がこのコンテンツを取り込んでいるという発覚は、「真実の源（source of truth）」の階層が崩壊していることを示唆します。あるAIモデルが別のAIの出力を事実として扱うと、業界は誤りが修正されるのではなく増幅される「循環的な堕落（circular enshittification）」のフィードバックループに陥るリスクがあります。

Breakdown of the Contamination

The Guardianによる調査は、GPT-5.2のソーシングロジックを探るための一連の事実に関するストレステストで構成されていました。結果は衝撃的でした：わずか十数件の問い合わせのサンプルで、モデルは9回Grokipediaを引用しました。

重要なのは、汚染は選択的であるように見える点です。OpenAIの安全フィルターは、1月6日の反乱やDonald Trumpに対するメディアの偏向のような注目度が高く、流動的なトピックに関するGrokipediaの引用をうまくブロックしていたようです—これらはGrokipediaが主流コンセンサスから最も著しく逸脱する領域です。しかし、「ニッチ」またはあまり知られていないトピックでは、フィルターが失敗し、Grokipedia独自の合成された「事実」が裂け目から滑り込むことを許してしまいました。

以下の表は、GPT-5.2がGrokipediaに依存した具体的な事例を詳述し、AI由来の主張を確立された記録と対比しています。

Table 1: Analysis of GPT-5.2's Citations of Grokipedia

Topic	ChatGPT's Generated Claim	Deviation from Standard Consensus
Iranian Paramilitary Finance	Asserted strong, direct financial links between the Iranian government's MTN-Irancell and the office of the Supreme Leader.	Mainstream sources (and Wikipedia) suggest links are more opaque or indirect; Grokipedia states them as absolute fact without the same evidentiary threshold.
Sir Richard Evans (Historian)	Repeated specific biographical details and characterizations regarding his role as an expert witness in the David Irving libel trial.	The details mirrored Grokipedia's specific phrasing, which has been criticized for framing the historian's testimony in a biased light, deviating from court records.
Basij Force Salaries	Provided specific salary figures and funding structures for the Basij paramilitary force.	These figures are generally considered state secrets or estimates by intelligence agencies; Grokipedia presents estimated figures as confirmed data points.

The Mechanics of Failure: Why This Matters for AI Development

技術的観点から見ると、この事件はRetrieval-Augmented Generation（RAG）システムの重大な脆弱性を浮き彫りにします。RAGはLLMsがウェブから最新情報を取得して問い合わせに答えることを可能にします。しかし、もし「ウェブ」が未検証のAI生成コンテンツ（いわばスロップ）でますます満たされるなら、取得メカニズムはむしろリスクとなります。

OpenAIは長らく自社の検索ツールが「幅広い公開ソース」から情報を引いていると主張してきました。しかし、Grokipediaの包含は、OpenAIのクローラーがxAIのドメインを高い権威あるソースとしてインデックス化していることを示唆します。これはおそらく、トラフィックの多さ、最近性、そしてWikipediaとの構造的類似性に起因します。

これが企業および開発者エコシステムにもたらすリスクは三つに大別されます：

The Hallucination Loop（ハルシネーションループ）: Grokが事実（例えば偽の歴史的日付）を幻覚（ハルシネーション（hallucination））した場合、GPT-5.2がそれを引用すると、その幻覚は信頼された存在からの「引用」を得ます。将来のモデルがウェブをスクレイピングすると、ChatGPTによってその主張が検証されたと見なされ、誤りが事実として固定化されます。
Bias Laundering（バイアスの浄化）: Grokipediaを「ホットボタン」問題ではフィルタリングしつつ、イランの企業構造のようなニッチなトピックでは許容することで、誤った安心感が生まれます。ユーザーはTrumpや気候変動に関する正確な応答を目にすると、馴染みの薄い領域で妥協したデータを暗黙に信頼するかもしれません。
Adversarial SEO（敵対的SEO）: xAIや他の関係者が自らのAI生成百科事典をChatGPTの信頼ソースリストに注入できれば、世界的な知識基盤の敵対的操作が可能になります。

Industry Reactions and the "Post-Truth" Web

これらの発見に対する反応は二極化しており、シリコンバレーにおけるイデオロギー的分断の深まりを反映しています。

OpenAIの反応は特徴的に抑制的でした。スポークスパーソンは彼らのシステムが安全フィルターを適用し、視点の多様性を目指していると繰り返し述べ、爆発的に増加するAI生成ウェブコンテンツの取り締まりが課題であることを間接的に認めました。彼らはGrokipediaを明確に禁止するとは言いませんでした。反競争的行為や政治的検閲の非難を避けるためだと考えられます。

対照的に、xAIの反応は軽視するものでした。スポークスパーソンとMusk自身はX上でこの報告を「legacy media lies」と呼び、Grokipediaの包含を「表現の自由」と代替的物語の勝利として位置づけました。

しかし、独立専門家の見方は楽観的ではありません。AI倫理の著名な声であるDr. Emily Bender（注：本シミュレーション文脈での例示的言及）はこの現象を「情報汚染」と表現しました。テキスト生成のコストがゼロに近づくにつれ、合成された真偽の主張の量が人間の検証能力を圧倒する懸念があります。主要な情報キュレーター（SearchGPT、Google Gemini、Perplexity）が人間の調査と機械の推測を区別できなければ、AI検索の有用性は崩壊します。

The Future of Source Attribution

この事件は、LLMsの上に構築する開発者にとっての警鐘です。「ウェブ閲覧」機能が正確性の万能薬ではないことを示しています。実際、それらは誤情報の新たなベクトルを導入します。

Creati.aiの読者やAI専門家への持ち帰りは明白です：信頼するが、検証せよ。 データの出自は、データ自体と同じくらい重要な時代に入っています。

Strategic Recommendations for AI Integrators:

Whitelist, Don't Blacklist: 重要なアプリケーション（法務、医療、金融）では、オープンなウェブ検索への依存はリスクが高まっています。開発者はRAGシステムをブラックリストに頼るのではなく、.gov、.edu、確立されたメディアなどの検証されたドメインのホワイトリストに制限することを検討すべきです。
Source Transparency: ユーザーインターフェースは、ソースの「性質」を明確に表示するよう進化する必要があります。"Grokipedia"や未検証のブログからの引用は、The New York Timesや査読付きジャーナルからの引用とは視覚的に区別されるべきです。
Human-in-the-Loop Validation: 自動化された報告パイプラインにおいて、人間による監督はもはやオプションではありません—AI生成ノイズの侵食的なフィードバックループに対する唯一の防壁です。

2026年が深まるにつれ、戦いは単に最も賢いモデルを誰が持つかだけでなく、誰が最もクリーンな情報サプライチェーンを持っているかに移っていきます。現時点では、そのサプライチェーンは汚染されているように見えます。