AI News

元NPRホストのデビッド・グリーン(David Greene)氏、NotebookLMによる音声盗用の疑いでGoogleを提訴

人工知能(Artificial Intelligence)と個人のアイデンティティの交差点は、NPRの『Morning Edition』の元ホストであるデビッド・グリーン(David Greene)氏がGoogleに対して訴訟を提起したことで、新たな法的火種となりました。サンタクララ郡上位裁判所に提出された訴状によると、テック大手である同社のAI搭載リサーチツール「NotebookLM」の「音声概要(Audio Overviews)」機能で使用されている男性の声が、グリーンの許可や報酬なしに、彼の独特な音声の人格を不法に複製していると主張しています。

この注目を集める法的措置は、「シンセティックメディア(synthetic media)」とクリエイターの権利を巡る現在進行中の議論において、重要な瞬間となります。これは、スカーレット・ヨハンソン(Scarlett Johansson)氏とOpenAIが関与した最近の論争を彷彿とさせ、テック業界に対して音声合成の倫理的および法的境界を定義するようさらなる圧力をかけています。AIコミュニティにとって、グリーン氏の訴訟は単一の個人の声に関するものではなく、生の音声録音だけでなく、特定の音声の「スタイル」や「抑揚」が法律の下でどのように保護されるかについての試金石となります。

発見:「不気味な」親近感

訴状によると、グリーン氏は2024年秋、元同僚から自分の声をGoogleにライセンス供与したかどうかを尋ねられるまで、NotebookLMの存在を知りませんでした。その同僚は、ユーザーがアップロードしたドキュメントに基づいて2人のAIエージェント間で会話形式のポッドキャストを生成する、このツールのバイラルな「音声概要」機能に登場する男性ホストが、グリーン氏に「非常によく似ている」と指摘しました。

生成された音声を聴いた際、グリーン氏は「完全に怖くなった」と述べています。訴状では、そのAI音声が単に一般的な男性放送者のように聞こえるだけでなく、NPRで13年近くかけて磨き上げられたグリーン氏の配信の特定のニュアンスを捉えていると詳細に説明されています。これらのニュアンスには、彼のユニークな文章のペース、イントネーション、さらには「えーと」や「あの」といった、グリーン氏が自身のトレードマークである放送スタイルの一部であると主張する特定の口癖までもが含まれているとされています。

「自分の声を聴いているような、不気味な瞬間です」と、グリーン氏は提訴後のインタビューで語りました。「私の声は、私という人間を構成する最も重要な部分なのです」。訴状は、その類似性が親しい友人やグリーン氏の妻さえも欺くほど強力であったと断言しており、AIモデルがNPRでの在職期間や現在のKCRWでの役割から得られる膨大な公開音声データでトレーニングされた可能性を示唆しています。

主な主張:アイデンティティの不正流用

訴訟は、Googleがカリフォルニア州法の下でのグリーン氏のパブリシティ権(right of publicity)を侵害したと非難しています。著作物を保護する著作権とは異なり、パブリシティ権は、同意なしに個人の名前、画像、または音声が商業目的で使用されることから個人を保護するものです。Boies Schiller Flexnerのジョシュア・ミケランジェロ・スタイン(Joshua Michelangelo Stein)氏率いるグリーン氏の弁護団は、Googleが自社のAI製品を人間らしく見せるために、グリーン氏の職業的アイデンティティを事実上「盗んだ」と主張しています。

訴状では以下の点が主張されています:

  1. 無断トレーニング: Googleは、NotebookLMの音声モデルをトレーニングするために、グリーン氏の膨大な公開ラジオ放送のコーパスを使用した可能性が高い。
  2. 商業的搾取: Googleは、NotebookLMをユーザーにとってより魅力的なものにするために、グリーン氏の声に関連する「温かく、プロフェッショナルで、信頼できる」特質から利益を得た。
  3. 回復不能な損害: 合成クローンの存在は、グリーン氏の実際の音声の仕事の価値を希薄化させ、グリーン氏が決して支持しないようなことを言わせるために使用される可能性がある。

Googleの反論:「プロ俳優」という主張

Googleはこれらの主張を「根拠がない」として即座に退けました。Googleの広報担当者であるホセ・カスタニェーダ(José Castañeda)氏は声明の中で、問題の音声は特定の個人のクローンではなく、有料のプロ俳優による録音に基づいたものであると明らかにしました。

「NotebookLMの音声概要(Audio Overviews)の男性の声は、Googleが雇用した有料のプロ俳優に基づいています」とカスタニェーダ氏は述べました。Googleの弁護は、その音声が(グリーン氏が普及に貢献した)「ポッドキャスト・スタイル」の抑揚を持っている可能性はあるものの、グリーン氏自身のデジタル複製ではないという主張に依拠しています。この弁護は、OpenAIが「Sky」の音声はスカーレット・ヨハンソンではなく、自然に似た声質を持つ別の女優であると主張した際のものと似ています。

しかし、法律の専門家は、カリフォルニア州のパブリシティ権法は広範囲に及ぶ可能性があると指摘しています。もし陪審員が、その音声が混乱を招くほど、あるいは支持を示唆するほど「酷似している」と判断した場合、別の俳優がベースとして使用されたかどうかに関わらず、Googleは依然として責任を問われる可能性があります。有名な1988年の「Midler v. Ford Motor Co.」事件では、音声は顔と同じくらい独特なものであり、商業的利益のためにそれを模倣することは訴訟の対象となり得ることが確立されました。

比較:グリーン氏 vs. NotebookLMの主張

争点の具体的な内容を理解するために、対立する主張を以下にまとめました。

Greene v. Googleにおける主張の比較

特徴/側面 デビッド・グリーン(David Greene)氏の主張 Googleの反論
音声の出所 同意なしに長年のNPRアーカイブでトレーニングされた可能性が高い。 特定の有料プロ音声俳優に由来。
音声の特徴 独特の抑揚、ピッチ、特定の「口癖」(例:「えーと」)と一致。 一般的な「ポッドキャスト・ホスト」スタイル。類似性は偶然。
世間の認識 友人、家族、同僚がその音声をグリーン氏であると特定。 模倣の意図はない。混乱を招く意図もない。
法的根拠 パブリシティ権の侵害およびアイデンティティの不正流用。 根拠のない主張。音声俳優は別人である。
希望する結果 損害賠償および音声の使用停止を求める差止命令。 訴訟の棄却。機能の継続運用。

「Sky」の残響:音声紛争のパターン

この訴訟は、スカーレット・ヨハンソン氏とOpenAIの間の注目を集めた紛争から2年足らずで発生しました。その事例では、ヨハンソン氏がChatGPTへの音声ライセンス供与を拒否したところ、同社が驚くほど似た「Sky」という名前の音声をリリースしました。OpenAIは最終的に、模倣ではないと主張しつつも、反発を受けてその音声の使用を停止しました。

グリーン氏の訴訟が異なるのは、彼が視覚的な役柄で知られるハリウッド俳優ではなく、声が主要な職業的資産であるジャーナリストであるという点です。この区別は極めて重要です。放送者にとって、合成クローンは直接的な競合相手となります。もしAIがいかなる記事やドキュメントに対しても「デビッド・グリーン・スタイル」のナレーションを生成できるのであれば、本物のデビッド・グリーンに対する市場の需要は理論的に減少する可能性があります。

Creati.aiの業界アナリストは、このケースが配信の「スタイル」に関する重要な先例となる可能性があると示唆しています。著作権は通常「スタイル」を保護しませんが(例えば、音楽のジャンルを著作権で保護することはできません)、パブリシティ権は個人のアイデンティティを保護する盾となります。サンタクララ裁判所への問いは、「『公共ラジオの音声』はジャンルに属するのか、それとも個人に属するのか?」というものになるでしょう。

技術的背景:NotebookLMの仕組み

NotebookLMは、AI分野におけるGoogleの驚くべき成功例の1つとなっています。Gemini 1.5 Proモデルを搭載しており、ユーザーはPDF、テキストファイル、その他のソースをアップロードでき、AIはそれを「読み取り」、要約します。「音声概要(Audio Overview)」機能はこれをさらに一歩進め、2人のAIホスト(男性1名、女性1名)がカジュアルで冗談を交えた形式で素材について話し合う、台本付きの対話を生成します。

この機能の成功は、その極めてリアルな韻律(Prosody)にあります。AIホストはお互いの言葉を遮ったり、つなぎ言葉(フィラー)を使ったり、ピッチを変えて懐疑心や興奮を表現したり、文章の間で「息を吸ったり」します。まさにこの高精度なリアリズムが、今回の訴訟の引き金となりました。グリーン氏は、男性ホストの特定の好奇心の表現方法(文章の終わりの上昇調のイントネーションと、温かく低音域の音色の組み合わせ)は、自身の『Morning Edition』の人格におけるユニークな属性であると主張しています。

AI業界への影響

Creati.aiで取り上げているように、『Greene v. Google』の結果は、合成音声エージェントの開発を再編する可能性があります。もし裁判所がグリーン氏に有利な判決を下せば、AI企業は自社の音声が有名人に誤って似てしまわないよう、より厳格な「ネガティブチェック」を実装する必要があるかもしれません。

潜在的な影響には以下が含まれます:

  • より厳格なライセンス供与: テック企業は、たとえ緩やかであっても模倣しようとするスタイルの音声タレントと、明示的な契約を締結することを余儀なくされる可能性がある。
  • 音声監査: 偶発的な法的責任を避けるために、AI音声を著名人のデータベースと照らし合わせて審査する新しいプロトコルが登場する可能性がある。
  • 「ジェネリック」な義務付け: 企業は、人間のジャーナリストを模倣しているという非難を避けるために、意図的にAI音声をよりロボット的、あるいは独特なものにするよう設計する可能性がある。

現在のところ、NotebookLMの音声はアクティブなままであり、Googleはこの機能を撤回する兆しを見せていません。ケースが証拠開示(Discovery)へと進むにつれ、テック界は「音声概要(Audio Overview)」のホストたちが沈黙させられるのか、それとも「声」の所有権の定義がアルゴリズム時代に合わせて書き換えられるのかを注視することになるでしょう。

フィーチャー