
人工智慧(Artificial Intelligence)與個人身分的交匯點已達到另一個法律爆發點,前 NPR《晨間新聞》(Morning Edition)主持人 David Greene 已對 Google 提起訴訟。這份提交至聖塔克拉拉郡高等法院的訴狀指控,這家科技巨頭的 AI 驅動研究工具 NotebookLM,在其「音訊總覽(Audio Overviews)」功能中使用了一種男聲,該聲音在未經許可或未支付報酬的情況下,非法複製了 Greene 獨特的聲線形象。
這項備受矚目的法律行動標誌著關於「合成媒體(Synthetic media)」與創作者權利持續爭論中的一個重要時刻。它呼應了近期涉及 Scarlett Johansson 與 OpenAI 的爭議,進一步迫使科技產業界定語音合成的倫理與法律界限。對於 AI 社群而言,Greene 的訴訟不僅僅關乎一個人的聲音;它是一項試金石,測試特定的語音「風格」與「節奏」——而不僅僅是原始音訊錄音——在法律下如何受到保護。
根據訴狀,Greene 直到 2024 年秋天前都對 NotebookLM 一無所知,當時一位前同事聯繫他,詢問他是否已將語音授權給 Google。該同事注意到,在該工具爆紅的「音訊總覽(Audio Overviews)」功能(該功能可根據使用者上傳的檔案,生成兩位 AI 代理人之間的對話式播客)中,男主持人的聲音聽起來「非常像」Greene。
在聽完生成的音訊後,Greene 描述自己「完全被嚇壞了」。訴狀詳細指出,該 AI 語音不僅聽起來像一個普通的男性廣播員,還捕捉到了 Greene 在 NPR 工作近 13 年間磨練出的特定細微差別。據稱,這些細微差別包括他獨特的句子節奏、語調,甚至是特定的口頭禪,如 Greene 聲稱是他招牌廣播風格一部分的「嗯(uhhs)」和「那個(likes)」。
「這是一個詭異的時刻,你會覺得自己在聽自己的聲音,」Greene 在訴訟提交後的採訪中表示。「我的聲音就像是我身分中最重要的部分。」訴狀主張,這種相似度足以愚弄親近的朋友甚至是 Greene 的妻子,這表明該 AI 模型可能是在他於 NPR 任職期間及其目前在 KCRW 角色中所產生的大量公開音訊數據上進行訓練的。
該訴訟指控 Google 違反了加州法律下的 Greene 「公開權(Right of publicity)」。與保護創意作品的著作權不同,公開權保護個人免於在未經同意的情況下,其姓名、形象或語音被用於商業目的。由 Boies Schiller Flexner 律師事務所的 Joshua Michelangelo Stein 領導的 Greene 法律團隊辯稱,Google 實際上已經「偷走」了 Greene 的專業身分,以使其 AI 產品更加人性化。
訴狀指控:
Google 迅速駁回了這些指控,稱其「毫無根據」。在一份聲明中,Google 發言人 José Castañeda 澄清,爭議中的語音並非任何特定個人的複製體,而是基於一位受僱專業演員的錄音。
「NotebookLM 音訊總覽中的男聲是基於 Google 聘請的一位受僱專業演員,」Castañeda 表示。Google 的辯護依賴於這樣一個論點:雖然該語音可能具有 Greene 協助推廣的「播客風格」節奏,但它並不是 Greene 本人的數位複製品。這種辯解與 OpenAI 當時聲稱其「Sky」語音不是 Scarlett Johansson,而是一位音色自然相似的不同女演員的說法如出一轍。
然而,法律專家指出,加州的公開權法律可能非常廣泛。如果陪審團發現該語音足以「聽起來像」而導致混淆或暗示認可,Google 仍可能承擔責任,無論是否使用了不同的演員作為基礎。著名的 1988 年 Midler v. Ford Motor Co. 案確立了語音與面孔一樣具有辨識度,為了商業利益而模仿語音是可以起訴的。
為了理解具體的爭議點,我們在下方分解了對立的說法。
Greene 訴 Google 案主張比較
| 功能/面向 | David Greene 的指控 | Google 的辯護 |
|---|---|---|
| 語音來源 | 可能在未經同意的情況下使用了多年的 NPR 存檔進行訓練。 | 源自一位特定的、受僱的專業語音演員。 |
| 語音特徵 | 符合獨特的節奏、音調和特定的「習慣」(例如「uhhs」)。 | 通用的「播客主持人」風格;相似之處純屬巧合。 |
| 公眾認知 | 朋友、家人和同事都認定該語音為 Greene。 | 無意模仿;無意造成混淆。 |
| 法律依據 | 違反公開權及身分盜用。 | 指控毫無根據;語音演員是一個獨立的個人。 |
| 預期結果 | 損害賠償及停止使用該語音的禁令。 | 駁回訴訟;繼續運行該功能。 |
這起訴訟發生在 Scarlett Johansson 與 OpenAI 之間備受矚目的糾紛後不到兩年。在那個案例中,Johansson 拒絕為 ChatGPT 授權她的語音,結果該公司隨後發布了一個名為「Sky」的語音,聽起來驚人地相似。OpenAI 最終在遭到反對後暫停了該語音的使用,儘管他們堅持認為這並非模仿。
Greene 的訴訟不同之處在於,Greene 是一名記者,語音是他的主要專業資產,而不是一位以視覺角色聞名的好萊塢演員。這一區別至關重要;對於廣播員來說,合成複製體是一個直接的競爭對手。如果 AI 可以為任何文章或文件生成「David Greene 風格」的旁白,理論上市場對真正的 David Greene 的需求可能會減少。
Creati.ai 的產業分析師建議,此案可能會為表達「風格」設定一個重要的先例。雖然著作權通常不保護「風格」(例如,你不能為某種音樂流派申請著作權),但公開權為個人身分建立了一道屏障。聖塔克拉拉法院面臨的問題將是:「公共廣播語音」是屬於該流派,還是屬於那個人?
NotebookLM 一直是 Google 在 AI 領域出人意料的成功案例之一。它由 Gemini 1.5 Pro 模型驅動,允許使用者上傳 PDF、文字檔和其他來源,然後由 AI 進行「閱讀」和綜合。「音訊總覽」功能更進一步,生成兩位 AI 主持人(一男一女)之間的腳本對話,他們以輕鬆、充滿打趣的方式討論素材。
該功能的成功在於其超寫實的韻律(Prosody)。AI 主持人會互相打斷、使用填充詞、改變音調來表達懷疑或興奮,並在句子之間「呼吸」。正是這種高保真的現實感引發了訴訟。Greene 主張,男主持人表達好奇的特定方式——句尾語調上揚並伴隨溫暖、低頻的音色——是他《晨間新聞》形象的獨特屬性。
正如我們在 Creati.ai 上報導的,Greene v. Google 的結果可能會重塑合成語音代理人的發展。如果法院做出有利於 Greene 的裁決,AI 公司可能需要實施更嚴格的「負面檢查」,以確保其語音不會意外地與名人相似。
潛在影響包括:
目前,NotebookLM 的語音仍然有效,且 Google 沒有表現出撤回該功能的跡象。隨著案件進入證據開示階段,科技界將密切關注「音訊總覽」主持人是否會被禁言——或者對於誰擁有「語音」的定義是否會在演算法時代被重新改寫。