NPR 的大衛·格林控告 Google 因 NotebookLM AI 複製其聲音

前 NPR 主持人 David Greene 起訴 Google，指控其涉嫌盜用 NotebookLM 語音

人工智慧（Artificial Intelligence）與個人身分的交匯點已達到另一個法律爆發點，前 NPR《晨間新聞》（Morning Edition）主持人 David Greene 已對 Google 提起訴訟。這份提交至聖塔克拉拉郡高等法院的訴狀指控，這家科技巨頭的 AI 驅動研究工具 NotebookLM，在其「音訊總覽（Audio Overviews）」功能中使用了一種男聲，該聲音在未經許可或未支付報酬的情況下，非法複製了 Greene 獨特的聲線形象。

這項備受矚目的法律行動標誌著關於「合成媒體（Synthetic media）」與創作者權利持續爭論中的一個重要時刻。它呼應了近期涉及 Scarlett Johansson 與 OpenAI 的爭議，進一步迫使科技產業界定語音合成的倫理與法律界限。對於 AI 社群而言，Greene 的訴訟不僅僅關乎一個人的聲音；它是一項試金石，測試特定的語音「風格」與「節奏」——而不僅僅是原始音訊錄音——在法律下如何受到保護。

發現過程：一種「詭異」的熟悉感

根據訴狀，Greene 直到 2024 年秋天前都對 NotebookLM 一無所知，當時一位前同事聯繫他，詢問他是否已將語音授權給 Google。該同事注意到，在該工具爆紅的「音訊總覽（Audio Overviews）」功能（該功能可根據使用者上傳的檔案，生成兩位 AI 代理人之間的對話式播客）中，男主持人的聲音聽起來「非常像」Greene。

在聽完生成的音訊後，Greene 描述自己「完全被嚇壞了」。訴狀詳細指出，該 AI 語音不僅聽起來像一個普通的男性廣播員，還捕捉到了 Greene 在 NPR 工作近 13 年間磨練出的特定細微差別。據稱，這些細微差別包括他獨特的句子節奏、語調，甚至是特定的口頭禪，如 Greene 聲稱是他招牌廣播風格一部分的「嗯（uhhs）」和「那個（likes）」。

「這是一個詭異的時刻，你會覺得自己在聽自己的聲音，」Greene 在訴訟提交後的採訪中表示。「我的聲音就像是我身分中最重要的部分。」訴狀主張，這種相似度足以愚弄親近的朋友甚至是 Greene 的妻子，這表明該 AI 模型可能是在他於 NPR 任職期間及其目前在 KCRW 角色中所產生的大量公開音訊數據上進行訓練的。

核心指控：身分盜用

該訴訟指控 Google 違反了加州法律下的 Greene 「公開權（Right of publicity）」。與保護創意作品的著作權不同，公開權保護個人免於在未經同意的情況下，其姓名、形象或語音被用於商業目的。由 Boies Schiller Flexner 律師事務所的 Joshua Michelangelo Stein 領導的 Greene 法律團隊辯稱，Google 實際上已經「偷走」了 Greene 的專業身分，以使其 AI 產品更加人性化。

訴狀指控：

未經授權的訓練： Google 可能使用了 Greene 大量的公開廣播語料庫來訓練 NotebookLM 語音模型。
商業剝削： Google 從與 Greene 語音相關的「溫暖、專業且值得信賴」的特質中獲益，使 NotebookLM 對使用者更具吸引力。
不可彌補的損害： 合成複製體的存在稀釋了 Greene 實際語音作品的價值，並可能被用來說出 Greene 絕不會認可的話。

Google 的辯解：「專業演員」論點

Google 迅速駁回了這些指控，稱其「毫無根據」。在一份聲明中，Google 發言人 José Castañeda 澄清，爭議中的語音並非任何特定個人的複製體，而是基於一位受僱專業演員的錄音。

「NotebookLM 音訊總覽中的男聲是基於 Google 聘請的一位受僱專業演員，」Castañeda 表示。Google 的辯護依賴於這樣一個論點：雖然該語音可能具有 Greene 協助推廣的「播客風格」節奏，但它並不是 Greene 本人的數位複製品。這種辯解與 OpenAI 當時聲稱其「Sky」語音不是 Scarlett Johansson，而是一位音色自然相似的不同女演員的說法如出一轍。

然而，法律專家指出，加州的公開權法律可能非常廣泛。如果陪審團發現該語音足以「聽起來像」而導致混淆或暗示認可，Google 仍可能承擔責任，無論是否使用了不同的演員作為基礎。著名的 1988 年 Midler v. Ford Motor Co. 案確立了語音與面孔一樣具有辨識度，為了商業利益而模仿語音是可以起訴的。

比較：Greene 與 NotebookLM 的主張

為了理解具體的爭議點，我們在下方分解了對立的說法。

Greene 訴 Google 案主張比較

功能/面向	David Greene 的指控	Google 的辯護
語音來源	可能在未經同意的情況下使用了多年的 NPR 存檔進行訓練。	源自一位特定的、受僱的專業語音演員。
語音特徵	符合獨特的節奏、音調和特定的「習慣」（例如「uhhs」）。	通用的「播客主持人」風格；相似之處純屬巧合。
公眾認知	朋友、家人和同事都認定該語音為 Greene。	無意模仿；無意造成混淆。
法律依據	違反公開權及身分盜用。	指控毫無根據；語音演員是一個獨立的個人。
預期結果	損害賠償及停止使用該語音的禁令。	駁回訴訟；繼續運行該功能。

「Sky」的回響：語音糾紛的模式

這起訴訟發生在 Scarlett Johansson 與 OpenAI 之間備受矚目的糾紛後不到兩年。在那個案例中，Johansson 拒絕為 ChatGPT 授權她的語音，結果該公司隨後發布了一個名為「Sky」的語音，聽起來驚人地相似。OpenAI 最終在遭到反對後暫停了該語音的使用，儘管他們堅持認為這並非模仿。

Greene 的訴訟不同之處在於，Greene 是一名記者，語音是他的主要專業資產，而不是一位以視覺角色聞名的好萊塢演員。這一區別至關重要；對於廣播員來說，合成複製體是一個直接的競爭對手。如果 AI 可以為任何文章或文件生成「David Greene 風格」的旁白，理論上市場對真正的 David Greene 的需求可能會減少。

Creati.ai 的產業分析師建議，此案可能會為表達「風格」設定一個重要的先例。雖然著作權通常不保護「風格」（例如，你不能為某種音樂流派申請著作權），但公開權為個人身分建立了一道屏障。聖塔克拉拉法院面臨的問題將是：「公共廣播語音」是屬於該流派，還是屬於那個人？

技術背景：NotebookLM 如何運作

NotebookLM 一直是 Google 在 AI 領域出人意料的成功案例之一。它由 Gemini 1.5 Pro 模型驅動，允許使用者上傳 PDF、文字檔和其他來源，然後由 AI 進行「閱讀」和綜合。「音訊總覽」功能更進一步，生成兩位 AI 主持人（一男一女）之間的腳本對話，他們以輕鬆、充滿打趣的方式討論素材。

該功能的成功在於其超寫實的韻律（Prosody）。AI 主持人會互相打斷、使用填充詞、改變音調來表達懷疑或興奮，並在句子之間「呼吸」。正是這種高保真的現實感引發了訴訟。Greene 主張，男主持人表達好奇的特定方式——句尾語調上揚並伴隨溫暖、低頻的音色——是他《晨間新聞》形象的獨特屬性。

對 AI 產業的影響

正如我們在 Creati.ai 上報導的，Greene v. Google 的結果可能會重塑合成語音代理人的發展。如果法院做出有利於 Greene 的裁決，AI 公司可能需要實施更嚴格的「負面檢查」，以確保其語音不會意外地與名人相似。

潛在影響包括：

更嚴格的授權： 科技公司可能被迫與任何他們意圖模仿其風格（即使是粗略模仿）的配音人才簽署明確的協議。
語音審計： 可能會出現新的協議，即對 AI 語音進行公眾人物數據庫比對篩選，以避免意外的法律責任。
「通用」指令： 公司可能會刻意設計 AI 語音，使其聽起來更具機器感或獨特性，以避免被指控模仿人類記者。

目前，NotebookLM 的語音仍然有效，且 Google 沒有表現出撤回該功能的跡象。隨著案件進入證據開示階段，科技界將密切關注「音訊總覽」主持人是否會被禁言——或者對於誰擁有「語音」的定義是否會在演算法時代被重新改寫。