AI News

想像力的新基準:AI 超越平均,但天才仍屬於人類

機器與心智的古老辯論已達到一個關鍵的新里程碑。今天發表的一項突破性研究量化了創意產業中許多人直覺上感受到的現象:人工智慧(Artificial Intelligence,尤其是像 GPT-4 這類的先進大型語言模型(Large Language Models,LLMs))已正式超越一般人的創意產出。然而,在為人類藝術終結敲響警鐘之前,數據揭示了一個重要的細微差異——最有想像力的人類頭腦仍然在統計上對算法保持顯著優勢。

這項將生物認知與矽基處理在標準化創造力測驗中對比的研究表明,儘管 AI 成功提高了創意產出的「下限」,但尚未打破由頂尖人類創新者建立的「上限」。對於生成式AI(Generative AI)領域的專業人士來說,這一區別不僅是學術性的;它從根本上改變了我們對 AI 在創意工作流程中角色的看法,將敘事從替代轉為深度增強。

方法論:測量那不可測量之物

量化創造力歷來是認知科學家的挑戰。為了評估當前 AI 模型對比人類參與者的能力,研究人員使用了托倫斯創造力測驗(Torrance Tests of Creative Thinking,TTCT)和替代用途任務(Alternate Uses Task,AUT)。這些是業界標準的評估,用以衡量發散性思維——即對開放性問題生成多種獨特解法的能力(例如:「列出一塊磚所有可能的用途」)。

研究比較了來自多元人群的受試者回應與 GPT-4 生成的答案。輸出在三個主要維度進行評分:

  • 流暢度(Fluency): 產生的相關想法總數。
  • 靈活度(Flexibility): 想法所屬不同類別的多樣性。
  • 原創性(Originality): 相較於整體樣本,想法的統計稀有性。

通過嚴格控制提示工程與人類回應時間,該研究在 2026 年提供了迄今最準確的「同條件比較」。

「平均」差距:AI 的主導之處

報告最引人注目的發現是 AI 對「平均」人類參與者的壓倒性優勢。在流暢度方面,AI 的表現超過了近 90% 的人類群體。當典型人類在限定時間內可能列出 10 到 15 種回形針的用途時,AI 可以瞬間生成 50 種,覆蓋更多類別。

更令人驚訝的是,AI 在原創性得分上也超過了人類的中位數回應。這挑戰了早期對大型語言模型僅為「隨機鸚鵡」、只能模仿的批評。研究指出,模型龐大的訓練資料使其能比受過一般創意訓練的人更有效地連結分散的概念。例如,平均參與者可能會建議將磚塊用作「門檔」或「壓紙鎮」(常見回應),而 AI 則容易提出像是「將其研碎成紅色顏料用於塗料」或「作為太陽能加熱器的熱質量」等用途。

這表明,在需要標準化構思與大量產出的任務上,AI 不再只是工具;它對於未經訓練的人腦來說,是一個更優秀的生成者。

人類的優勢:為何頂尖 1% 仍然勝出

儘管 AI 在多數情況統計上勝過大多數人類,研究凸顯了技術尚未突破的「創造天花板」。那一百分位的人類——那些持續被評為高度有創造力的個體——在原創性的質量與深度上仍持續超越 GPT-4。

研究人員指出,AI 擅長聯想型associative)創造力(將 X 與 Y 連結),但在需要深層語境理解、情感共鳴或跳脫既有邏輯的概念型conceptual)創造力方面較為吃力。最出色的人類想法被描述為具有「有意義的驚喜」——這些想法不僅罕見,而且擁有一種即使新穎也能立刻被辨識為有價值的邏輯。

此外,靈活度得分揭示了 AI 的侷限。雖然 AI 可以生成更多想法,但想法的類型經常遵循其訓練資料衍生出的可預測模式。相反,頂尖的人類創作者展現出能夠進行違反機率性預期的「飛躍」能力。

比較分析:人類 vs. 機器 的表現

為了視覺化平均人類、頂尖人類創作者與當前 AI 之間的差異,以下分解說明了研究的核心發現。

Metric Average Human Participant AI (GPT-4 Model) Top 1% Human Creative
Fluency (Volume) Low to Moderate
(10-15 ideas)
Exceptional
(50+ ideas)
High
(30-40 ideas)
Originality Score Low
(Relies on common associations)
High
(Connects distant concepts)
Exceptional
(creates novel paradigms)
Flexibility Moderate
(Stays within 2-3 categories)
High
(Spans multiple categories)
Very High
(Cross-pollinates disciplines)
Contextual Nuance High
(Understanding of social norms)
Moderate
(Can miss subtle cues)
Exceptional
(Deep emotional resonance)

對創意經濟的影響

這項研究的結果對 2026 年及以後的創意經濟具有深遠影響。數據顯示,對「平均」創意工作——基本文案撰寫、素材圖像、標準頭腦風暴——的價值將隨著 AI 將這些任務商品化而持續下滑。如果 AI 能在生成標準想法方面超越平均人類,市場將不可避免地轉向這些自動化解決方案以滿足基線需求。

然而,對於精英人類創意的溢價可能會飆升。既然「最優秀」的人類仍勝過「最優秀」的 AI,人類創意者的角色將從產量生成者轉變為品質策展人與深度新穎性的來源。

關鍵要點(給專業人士):

  • 擺脫寫作障礙: 對於一般創作者,AI 是提升輸出到更高原創標準的強大槓桿,實質上消除了「空白頁」問題。
  • 策展能力為關鍵技能: 隨著 AI 產生高流暢度的輸出,人類辨別哪些想法真正「最好」的能力(AI 難以勝任的判斷)成為關鍵職能。
  • 混合工作流程: 研究支持「人機混合(Centaur)模式」,即使用 AI 工具的人類專家,其表現優於僅靠 AI 或僅靠人類的情況。

定義那道天花板

為何會存在這道天花板?認知科學家推測這與意圖親身經驗有關。AI 在既有的人類知識分布範圍內運作。它可以探索該分布的邊緣,但無法跳出來創造源自獨特、主觀世界經驗的事物——因為它本身並無此類經驗。

頂尖人類創作者汲取感官經驗、個人創傷、喜悅與複雜的社會動力,這些目前無法被編碼。雖然 AI 可以模擬情感的語言,研究發現人類評估者常能區分 AI 那種「空洞」的新穎與人類詩人或思想家所產生的「共鳴」新穎。

結論

「AI 毀滅創意」的敘事顯然是錯誤的;相反,AI 正在將創造力民主化。透過擊敗平均水平,AI 迫使整個生態系統升級。被視為「有創意」的門檻已經改變。單純的勝任現在已被自動化。

對 Creati.ai 的讀者來說,這項研究是一通行動的號召。我們不再為成為平均而競爭。可用的工具確保了基線比以往任何時候都高。現在的挑戰是利用這些工具來達到那上層百分位——佔據人類創意、以機器速度輔助,達成過去被認為不可能的想像力成就的領域。機器已經提高了地板;現在由我們來提高天花板。

精選