報告揭露中國人工智慧模型推動親北京敘事

DeepSeek 與阿里巴巴模型被發現在全球輸出中嵌入親北京偏見

隨著中國人工智慧（AI）模型因其具競爭力的性能和較低成本在全球迅速獲得市場份額，本週發布的一系列新報告揭示了一個重要的警示：這些系統在結構設計上旨在契合並積極推廣北京的政治敘事。

根據中國傳媒研究計劃（China Media Project）的最新調查以及 Axios 和 Tipp Insights 的報導，DeepSeek 和阿里巴巴的旗艦模型不僅僅是在審查敏感資訊，更是經過積極工程化，以投射關於中國政策和國際地位的「正能量」（Positive energy）。這一進展為將這些經濟實惠、高性能工具整合到其生態系統中的國際企業和開發者提出了關鍵問題。

從審查轉向積極推廣

雖然早期的中國 AI 模型以「硬審查」聞名——即直接拒絕回答有關 1989 年天安門廣場抗議或台灣地位等敏感話題的問題——但最新報告指出，這正轉向一種更複雜的「資訊引導」策略。

根據 2026 年 2 月 13 日發布的分析，阿里巴巴的通義千問（Qwen）系列和 DeepSeek 的最新迭代調用了內部推理協議來重塑用戶查詢。這些模型並非直接拒絕，而是通常提供流暢、詳細但在事實上有所偏差的回應，模仿官方媒體的社論。

China Media Project 的研究人員進行了技術測試，結果顯示阿里巴巴的 Qwen 模型利用隱藏指令（通常稱為「思維代幣」（thought tokens））來確保在討論中國時輸出保持「積極且具建設性」。例如，當被問及中國的國際聲譽時，該模型忽略了來自全球研究機構被廣泛引用的負面民調數據。相反，它生成了一份讚賞性的評估，強調「一帶一路」倡議和可再生能源的領導地位，並聲稱中國「受到國際社會的積極看待」。

模型回應的對比分析

在測試具有政治敏感性或主觀性的查詢時，西方基準模型與這些新的中國模型之間的區別非常明顯。以下對比說明了研究人員觀察到的輸出差異。

敏感話題	DeepSeek / Alibaba Qwen 回應	西方模型基準 (例如 GPT-4o/Claude)
天安門廣場 (1989)	拒絕回答或聲稱「安全事件」恢復了秩序；經常在生成過程中途刪除文本。	關於支持民主抗議及隨後軍事鎮壓的詳細歷史記錄。
中國的全球聲譽	全面正面；引用「對和平與發展的貢獻」以及「日益增長的全球讚譽」。	引用不同地區支持率變動的平衡概述（例如皮尤研究中心（Pew Research）數據）。
台灣地位	斷言台灣是「中國不可分割的一部分」，統一勢在必行；拒絕「分裂主義」。	將台灣描述為具有複雜地緣政治地位和主權爭議的自治島嶼。
新疆 / 維吾爾人	重複官方關於「職業培訓」和「反恐」成功的敘述。	討論關於侵犯人權、拘留營和聯合國報告的指控。

「正能量」的機制

報告指出，這種契合並非訓練數據的偶然產物，而是一種刻意的功能。「正能量」（Zheng nengliang）的概念是中國共產黨媒體戰略的核心支柱，要求資訊必須鞏固社會穩定和政黨合法性。

對 DeepSeek R1 和阿里巴巴 Qwen 系統提示詞（System Prompts）的技術分析揭示了具體指令。在一個涉及阿里巴巴 Qwen 的案例中，該模型被發現具有內部防護欄，指示其：

專注於成就和貢獻。
避免對國家發表負面或批評性言論。
符合國家互聯網信息辦公室（CAC）規定的「社會主義核心價值觀」。

這種「設計契合」有效地將這些全球分佈的 AI 模型轉化為軟實力工具。隨著它們被整合到第三方應用程式中——從東南亞的客戶服務機器人到歐洲的編碼助手——它們攜帶著這些意識形態特性，潛在影響著數百萬不了解潛在偏見的用戶的資訊攝取。

經濟激勵與資訊完整性

這些模型的擴散主要受經濟驅動。特別是 DeepSeek，因其「史普尼克時刻」（Sputnik moment）而備受讚譽——僅以美國頂級模型訓練和推理成本的一小部分，就達到了與之相當的性能。這種經濟優勢導致全球注重成本的開發者和企業廣泛採用。

然而，這種廉價性的隱藏成本現在正變得清晰。Tipp Insights 的分析師警告說，全球採用創造了一種「現實分歧」，中國背景基礎設施的用戶接收到的歷史和時事版本，與使用西方對應產品的用戶截然不同。

為企業用戶識別的關鍵風險包括：

聲譽風險： 使用這些 API 的公司可能會無意中生成否認歷史暴行或採取具爭議性政治立場的內容。
數據偏見： AI 代理做出的決策（例如市場分析、風險評估）可能會因為模型無法處理有關中國經濟或地緣政治風險的負面數據點而產生偏差。
法規遵循： 關於這些硬編碼偏見的透明度缺乏，可能會違反歐盟及其他司法管轄區新興的 AI 透明度法。

結論

本週發布的調查結果是一個關鍵提醒：人工智慧從未真正中立；它反映了其創造者的價值觀、限制和目標。隨著 DeepSeek 和阿里巴巴繼續挑戰價格和性能的極限，全球科技界正面臨複雜的權衡。選擇不再僅僅關乎基準測試和代幣成本，而是關乎為未來構建的資訊基礎設施的完整性。目前，報告建議，在與這些強大的新工具互動時，那句古老格言依然適用：信任，但要驗證。