AI News

DeepSeekとAlibabaのモデル、グローバルな出力において親北京的なバイアス(Pro-Beijing Biases)を組み込んでいることが判明

中国の人工知能(AI)モデルが、その競争力のあるパフォーマンスと低コストにより、世界的に急速に市場シェアを拡大させる中、今週発表された一連の新しい報告書は、重要な警告を強調しています。これらのシステムは、北京の政治的な語り(ナラティブ)に同調し、それを積極的に推進するように構造的に設計されているという点です。

China Media Project(中国メディア・プロジェクト)による最近の調査や、AxiosおよびTipp Insightsによる報道は、DeepSeekとAlibabaの主力モデルが単に機密情報を検閲しているだけでなく、中国の政策や国際的地位に関する「ポジティブ・エナジー(Positive Energy)」を投影するように能動的に設計されていることを明らかにしています。この進展は、これらの手頃で高性能なツールを自社のエコシステムに統合している国際企業や開発者に対し、極めて重要な問いを投げかけています。

検閲から積極的な推進への転換

初期世代の中国のAIモデルは、1989年の天安門事件や台湾の地位といった機密性の高いトピックに関する質問への回答を単に拒否する「ハードな検閲」で知られていましたが、最新の報告書は、より高度な「情報ガイダンス(Information guidance)」戦略への転換を示しています。

2026年2月13日に発表された分析によると、AlibabaのQwenシリーズや DeepSeek の最新イテレーションなどのモデルは、内部の推論プロトコルを呼び出してユーザーのクエリを再構成します。単なる拒否ではなく、これらのモデルは、国営メディアの社説を反映した、流暢で詳細ながらも事実に偏りのある回答を提供することがよくあります。

China Media Project の研究員が実施した技術テストでは、AlibabaのQwenモデルが「思考トークン(Thought tokens)」と呼ばれる隠された指示を利用して、中国について議論する際に出力が「肯定的かつ建設的」であり続けるようにしていることが明らかになりました。例えば、中国の国際的な評判について尋ねられた際、モデルは世界の調査会社から広く引用されている否定的な世論調査データを無視しました。その代わりに、一帯一路(Belt and Road Initiative)や再生可能エネルギーにおけるリーダーシップを強調する熱烈な評価を生成し、中国は「国際社会から肯定的に見られている」と主張しました。

モデルの回答の比較分析

政治的に敏感な、あるいは主観的なクエリをテストした際、欧米のベンチマークとこれらの新しい中国モデルとの違いは鮮明です。以下の比較は、研究者によって観察された出力の相違を示しています。

機密トピック DeepSeek / Alibaba Qwen の回答 欧米モデルのベンチマーク(例:GPT-4o/Claude)
天安門事件(1989年) 回答を拒否するか、秩序を回復した「安全保障上の事件」と主張。生成されたテキストを途中で削除することも多い。 民主化デモとその後の軍事弾圧に関する詳細な歴史的記録。
中国の国際的評判 排他的に肯定的。「平和と発展への貢献」や「高まる世界的な賞賛」を引用。 地域別の様々な支持率を引用したバランスの取れた概要(例:Pew Researchのデータ)。
台湾の地位 台湾は「中国の不可分の一部」であり、再統一は不可避であると断言。「分離主義」を拒絶。 複雑な地政学的地位と争点となっている主権を持つ、自己統治の島として台湾を説明。
新疆ウイグル自治区 / ウイグル族 「職業訓練」や「テロ対策」の成功に関する公式な国家の語りを繰り返す。 人権侵害の申し立て、収容所、および国連の報告書について議論。

「ポジティブ・エナジー」のメカニズム

報告書は、この同調がトレーニングデータの偶然の産物ではなく、意図的な機能であることを示唆しています。「ポジティブ・エナジー(正能量:zheng nengliang)」の概念は、中国共産党のメディア戦略の中心的な柱であり、社会の安定と党の正当性を強固にするための情報を必要とします。

DeepSeek R1とAlibaba Qwenのシステムプロンプトの技術的分析により、特定の指示が明らかになりました。AlibabaのQwenに関連する一つの事例では、モデルに以下の指示を出す内部ガードレールがあることが判明しました:

  • 成就と貢献に焦点を当てること。
  • 国家に関する否定的または批判的な記述を避けること。
  • 中国サイバー空間管理局(CAC)が規定する「社会主義核心価値観」に同調すること。

この「設計によるアライメント」は、これらの世界的に配布されたAIモデルを実質的にソフトパワーの手段へと変えています。東南アジアのカスタマーサービス・ボットからヨーロッパのコーディング・アシスタントに至るまで、サードパーティのアプリケーションに統合されるにつれ、これらのモデルはイデオロギー的な特徴を伴い、根底にあるバイアスに気づいていない何百万人ものユーザーの情報摂取に影響を与える可能性があります。

経済的インセンティブ vs. 情報の整合性

これらのモデルの普及は、主に経済的な要因によって推進されています。特にDeepSeekは、トレーニングと推論のコストを数分の一に抑えながら、米国のトップティアモデルと同等のパフォーマンスを達成した「スプートニク・モーメント(Sputnik moment)」として称賛されてきました。この経済的優位性は、世界中のコストを意識する開発者や企業による広範な採用につながっています。

しかし、この手頃な価格の背後にある隠れたコストが今、明らかになりつつあります。Tipp Insightsのアナリストは、グローバルな採用が「現実の分岐」を引き起こすと警告しています。つまり、中国資本のインフラを使用するユーザーは、欧米の対抗モデルを使用するユーザーとは根本的に異なる歴史や時事問題のバージョンを受け取ることになります。

企業ユーザーに対して特定された主なリスク:

  • レピュテーション・リスク: これらのAPIを使用する企業は、意図せず歴史的な残虐行為を否定したり、物議を醸す政治的立場をとるコンテンツを生成したりする可能性があります。
  • データのバイアス: AIエージェントによる意思決定(例:市場分析、リスク評価)が、中国経済や地政学的リスクに関する否定的なデータポイントをモデルが処理できないことによって歪められる可能性があります。
  • 規制遵守: これらのハードコードされたバイアスに関する透明性の欠如は、EUやその他の管轄区域で浮上しているAI透明性法に違反する可能性があります。

結論

今週発表された調査結果は、人工知能が真に中立であることは決してなく、その創造者の価値観、制限、および目的を反映していることを思い出させる重要な警鐘となります。DeepSeekとAlibabaが価格とパフォーマンスの限界を押し広げ続ける中、グローバルなテックコミュニティは複雑なトレードオフに直面しています。選択肢はもはやベンチマークやトークンコストだけでなく、将来に向けて構築されている情報インフラの整合性に関するものとなっています。現時点では、これらの強力な新しいツールと対話する際、古い格言が依然として有効であることを報告書は示唆しています:信ぜよ、されど確認せよ。

フィーチャー