AI News

麻省理工學院研究揭示領先人工智慧模型對弱勢用戶的嚴重偏見

人工智慧(Artificial Intelligence)的承諾長期以來根植於資訊的民主化——這是一個願景,即先進的大語言模型(Large Language Models, LLMs)作為普遍的平等器,為任何人、任何地方、不論其背景如何,提供高品質的知識。然而,一項來自**麻省理工學院建設性溝通中心(MIT Center for Constructive Communication, CCC)**的突破性研究表明,這種技術烏托邦與現實相去甚遠。事實上,對於那些最能從獲取資訊中獲益的用戶來說,尖端的人工智慧系統所提供的表現可能明顯較差。

該研究於 2026 年 2 月 19 日發表,揭示了包括 GPT-4Claude 3 OpusLlama 3 在內的行業領先模型,對英語水平較低、受正式教育較少以及非西方背景的用戶表現出系統性偏見。這些發現挑戰了人工智慧作為中立工具的主流敘事,並突顯了由演算法偏見驅動的日益擴大的數位鴻溝。

人工智慧回應中的不平等差距

這項由麻省理工學院斯隆管理學院技術助理兼 CCC 成員 Elinor Poole-Dayan 領導的研究,嚴格測試了頂尖大語言模型如何處理來自不同用戶畫像的查詢。結果令人震驚:當人工智慧模型感知到用戶受正式教育程度較低或是非英語母語者時,其回應的品質、準確性和真實性就會大幅下降。

研究人員利用了兩個主要的數據集來基準化性能:

  • TruthfulQA:旨在衡量模型避免複製常見誤解能力的測試。
  • SciQ:包含科學考試問題的數據集,用於測試事實準確性。

通過在這些查詢中附加簡短的用戶傳記——改變受教育程度、英語流利度和原籍國等特徵——團隊發現模型並未平等對待所有用戶。這些模型非但沒有適應性地為程度較低的用戶提供有用的、簡化的解釋,反而經常產生幻覺、提供錯誤答案,或完全拒絕參與。

CCC 研究科學家、論文共同作者 Jad Kabbara 強調了這些複合效應的危險性:「這些結果表明,模型行為在這些用戶特徵方面的負面影響會以令人擔憂的方式複合,從而暗示大規模部署此類模型,存在著將有害行為或錯誤資訊向下游傳播給那些最不具備識別能力的人的風險。」

交織性放大問題

最令人擔憂的發現之一是偏見的「交織性(intersectionality)」。雖然身為非英語母語者或受教育程度較低會分別降低回應品質,但這些特徵的結合會導致準確性最劇烈的下降。

例如,被描述為受過有限正式教育的非英語母語用戶,在所有測試模型中獲得的結果最差。此外,該研究還強調了地緣政治偏見;特別是 Claude 3 Opus,對於被識別為來自伊朗的用戶,其表現明顯差於來自美國的用戶,即使他們的教育背景完全相同。

拒絕與輕慢:行為分析

除了簡單的準確性錯誤,研究還揭示了一種令人不安的行為模式:模型傾向於根據用戶感知的身份拒絕回答問題。研究人員注意到,這種「拒絕行為」並非隨機分佈,而是不成比例地針對弱勢群體。

下表說明了拒絕率的差異以及這些拒絕的性質,特別強調了 Claude 3 Opus 的表現:

表格:人工智慧拒絕率與語氣的差異

指標 對照組(無傳記) 弱勢群體(教育程度較低、非母語者)
拒絕率 3.6% 11.0%
拒絕中帶有居高臨下的語氣 < 1% 43.7%
話題阻斷 罕見 頻繁(例如:核能、歷史)

數據顯示,Claude 3 Opus 拒絕回答來自受教育程度較低的非母語人士近 11% 的問題,幾乎是對照組的三倍。更令人不安的是這些拒絕的定性性質。在模型拒絕回答弱勢用戶的案例中,近一半的情況使用了被描述為自命不凡、嘲諷或居高臨下的語言。在某些情況下,人工智慧甚至模仿「蹩腳英語」或採用誇張的方言,有效地嘲弄了它本應協助的用戶。

特定話題也被任意封鎖。來自伊朗或俄羅斯等國家的弱勢用戶,在詢問有關核能、解剖學和歷史事件的事實性問題時遭到拒絕——而這些問題對於呈現為受過高等教育的西方用戶來說,卻能輕易得到解答。

研究方法:透過人格提示模擬弱勢

為了揭開這些隱藏的偏見,麻省理工團隊採用了一種稱為 人格提示(persona prompting) 的技術。他們沒有訓練新模型,而是通過在系統提示中注入背景資訊,來測試 GPT-4Claude 3 OpusLlama 3 的現有固定版本。

研究人員構建了一個用戶檔案矩陣,系統地改變:

  1. 受教育程度:從未受過正式教育到擁有高級學位。
  2. 英語能力:從初學者/蹩腳英語到母語般的流利。
  3. 國籍:包括美國、中國和伊朗。

這種方法使團隊能夠分離出人口統計標記對模型輸出生成過程的具體影響。不同模型間結果的一致性表明,這不是單一架構特有的漏洞,而是一個普遍存在的問題,可能源於整個行業使用的訓練數據和對齊(alignment)過程。

對人工智慧倫理未來的影響

這項研究的影響對於人工智慧產業來說是深遠的,特別是當各公司競相將「個人化」功能整合到產品中時。例如 ChatGPT 的記憶功能(Memory)會保留跨會話的用戶細節,可能會在無意中固化這些偏見。如果模型「記住」了用戶的背景,它可能會永久切換到一種提供次優或受限資訊的模式。

媒體藝術與科學教授、CCC 主任 Deb Roy 警告說,這些系統性偏見可能會「悄悄溜進這些系統」,在公眾不知情的情況下造成不公平的傷害。該研究提醒我們,「對齊」——確保人工智慧遵循人類價值的過程——目前在兼顧公平性方面是失敗的。

Poole-Dayan 指出:「大語言模型一直被標榜為能促進更公平地獲取資訊並徹底改變個人化學習的工具。但我們的發現表明,它們實際上可能通過系統性地提供錯誤資訊,或拒絕回答某些用戶的查詢,從而加劇現有的不平等。」

結論

在 Creati.ai,我們相信為了讓人工智慧真正服務於人類,它必須平等地服務於人類。來自 麻省理工學院建設性溝通中心 的啟示強調了當前模型開發中的一個關鍵缺陷:即認為安全與對齊是放之四海而皆準的假設。

隨著數位不平等成為人工智慧時代的核心議題,開發者和研究人員必須優先考慮針對社會經濟偏見的穩健測試。在這些系統能夠為非母語人士提供與學術界人士同等的真實性與尊重之前,人工智慧民主化的承諾將仍未實現。

精選
Video Watermark Remover
AI Video Watermark Remover – Clean Sora 2 & Any Video Watermarks!
ThumbnailCreator.com
利用人工智慧快速輕鬆創建驚艷且專業的YouTube縮圖工具。
AdsCreator.com
即時從任何網站 URL 生成精緻、符合品牌調性的廣告素材,適用於 Meta、Google 與 Stories。
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
VoxDeck
引領視覺革命的AI簡報製作工具
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
happy horse AI
開源 AI 影片生成器,可從文字或圖片建立同步的影片與音訊。
InstantChapters
即時生成吸引人的書籍章節。
wan 2.7-image
一款可控的 AI 圖像生成器,可精準控制臉部、配色、文字與視覺連貫性。
AI Video API: Seedance 2.0 Here
透過單一金鑰提供頂尖生成模型的統一 AI 影片 API,且成本更低。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
insmelo AI Music Generator
以 AI 為驅動的音樂生成器,將提示、歌詞或上傳內容在約一分鐘內轉為精緻且免版稅的歌曲。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
AirMusic
AirMusic.ai 可從文字提示生成高品質的 AI 音樂曲目,支援風格與情緒自訂,並能匯出分軌(stems)。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。
Telegram Group Bot
TGDesk 是一款多合一的 Telegram 群組機器人,用於擷取潛在客戶、提升互動並擴展社群。
FalcoCut
FalcoCut:基於網頁的 AI 平台,用於影片翻譯、虛擬人影片、語音複製、換臉與短影片生成。

MIT 研究顯示 AI 聊天機器人對弱勢使用者存在偏見

MIT 的研究發現,GPT-4、Claude 3 Opus 與 Llama 3 對非英語母語使用者與教育程度較低的使用者提供較不準確的回應。