
Die Schnittstelle von Künstlicher Intelligenz (Artificial Intelligence, AI) und persönlicher Identität hat einen weiteren rechtlichen Brennpunkt erreicht, da David Greene, der ehemalige Moderator von NPRs Morning Edition, Klage gegen Google eingereicht hat. Die beim Santa Clara County Superior Court eingereichte Beschwerde behauptet, dass das KI-gestützte Recherche-Tool des Technologieriesen, NotebookLM, in seiner Funktion „Audio Overviews“ eine männliche Stimme verwendet, die Greenes unverwechselbare stimmliche Persona illegal und ohne seine Erlaubnis oder Entschädigung repliziert.
Diese vielbeachtete rechtliche Maßnahme markiert einen bedeutenden Moment in der laufenden Debatte über „synthetische Medien“ (Synthetic Media) und die Rechte von Urhebern. Sie spiegelt die jüngste Kontroverse um Scarlett Johansson und OpenAI wider und setzt die Tech-Industrie weiter unter Druck, die ethischen und rechtlichen Grenzen der Sprachsynthese zu definieren. Für die KI-Community ist Greenes Klage nicht nur die Sache einer einzelnen Stimme; sie ist ein Lackmustest dafür, wie spezifische stimmliche „Stile“ und „Kadenzen“ – und nicht nur reine Audioaufnahmen – gesetzlich geschützt sind.
Laut der Klage wusste Greene nichts von NotebookLM bis zum Herbst 2024, als ein ehemaliger Kollege ihn kontaktierte, um zu fragen, ob er Google seine Stimme lizenziert habe. Der Kollege merkte an, dass der männliche Moderator in der viralen Funktion „Audio Overviews“ (Audio-Übersichten) des Tools – die konversationsbasierte Podcasts zwischen zwei KI-Agenten auf der Grundlage von vom Nutzer hochgeladenen Dokumenten generiert – Greene „sehr ähnlich“ klang.
Beim Anhören der generierten Audioaufnahmen beschreibt Greene, „völlig verängstigt“ gewesen zu sein. Die Beschwerde führt aus, dass die KI-Stimme nicht bloß wie ein generischer männlicher Sprecher klang, sondern die spezifischen Nuancen von Greenes Vortragsweise einfing, die er über fast 13 Jahre bei NPR verfeinert hatte. Diese Nuancen umfassen angeblich sein einzigartiges Satztempo, die Intonation und sogar spezifische verbale Eigenheiten wie „uhhs“ und „likes“, von denen Greene behauptet, sie seien Teil seines charakteristischen Sendestils.
„Es ist dieser unheimliche Moment, in dem man das Gefühl hat, sich selbst zuzuhören“, erklärte Greene in einem Interview nach der Einreichung. „Meine Stimme ist sozusagen der wichtigste Teil dessen, wer ich bin.“ Die Klage macht geltend, dass die Ähnlichkeit stark genug war, um enge Freunde und sogar Greenes Frau zu täuschen, was darauf hindeutet, dass das KI-Modell mit der riesigen Menge an öffentlichen Audiodaten trainiert worden sein könnte, die aus seiner Amtszeit bei NPR und seiner aktuellen Rolle bei KCRW verfügbar sind.
Die Klage wirft Google vor, Greenes Recht auf Eigenvermarktung (Right of Publicity) nach kalifornischem Recht zu verletzen. Im Gegensatz zum Urheberrecht, das kreative Werke schützt, schützt das Recht auf Eigenvermarktung eine Person davor, dass ihr Name, ihr Bild oder ihre Stimme ohne Zustimmung für kommerzielle Zwecke verwendet wird. Greenes Anwaltsteam, angeführt von Joshua Michelangelo Stein von Boies Schiller Flexner, argumentiert, dass Google Greenes berufliche Identität effektiv „gestohlen“ habe, um sein KI-Produkt zu vermenschlichen.
Die Beschwerde behauptet:
Google hat die Vorwürfe umgehend als „haltlos“ zurückgewiesen. In einer Erklärung stellte Google-Sprecher José Castañeda klar, dass die fragliche Stimme kein Klon einer bestimmten Person sei, sondern auf Aufnahmen eines bezahlten professionellen Schauspielers basiere.
„Der Klang der männlichen Stimme in den Audio Overviews von NotebookLM basiert auf einem bezahlten professionellen Schauspieler, den Google engagiert hat“, erklärte Castañeda. Googles Verteidigung stützt sich auf das Argument, dass die Stimme zwar eine Kadenz im „Podcast-Stil“ haben mag – die Greene mit populär gemacht hat –, sie jedoch kein digitales Replikat von Greene selbst ist. Diese Verteidigung ähnelt der von OpenAI, als sie behaupteten, ihre „Sky“-Stimme sei nicht Scarlett Johansson, sondern eine andere Schauspielerin mit einer natürlich ähnlichen Klangfarbe.
Rechtsexperten weisen jedoch darauf hin, dass die kalifornischen Gesetze zum Recht auf Eigenvermarktung weit gefasst sein können. Wenn eine Jury feststellt, dass die Stimme ähnlich genug klingt, um Verwirrung zu stiften oder eine Befürwortung impliziert, könnte Google dennoch haftbar gemacht werden, unabhängig davon, ob ein anderer Schauspieler als Basis verwendet wurde. Der berühmte Fall Midler gegen Ford Motor Co. von 1988 stellte fest, dass eine Stimme ebenso unverwechselbar ist wie ein Gesicht und dass die Nachahmung zum kommerziellen Vorteil einklagbar sein kann.
Um die spezifischen Streitpunkte zu verstehen, haben wir die gegensätzlichen Darstellungen unten aufgeschlüsselt.
Vergleich der Behauptungen in Greene gegen Google
| Merkmal/Aspekt | David Greenes Vorwurf | Googles Verteidigung |
|---|---|---|
| Ursprung der Stimme | Wahrscheinlich ohne Zustimmung auf jahrelangen NPR-Archiven trainiert. | Abgeleitet von einem spezifischen, bezahlten professionellen Synchronsprecher. |
| Stimmliche Merkmale | Entspricht der einzigartigen Kadenz, Tonhöhe und spezifischen „Eigenheiten“ (z. B. „uhhs“). | Generischer „Podcast-Moderator“-Stil; Ähnlichkeiten sind zufällig. |
| Öffentliche Wahrnehmung | Freunde, Familie und Kollegen identifizierten die Stimme als Greene. | Keine Absicht zur Nachahmung; keine Verwirrung beabsichtigt. |
| Rechtliche Grundlage | Verletzung des Rechts auf Eigenvermarktung und Identitätsmissbrauch. | Haltlose Behauptungen; der Synchronsprecher ist eine eigenständige Person. |
| Gewünschtes Ergebnis | Schadenersatz und eine Unterlassungsverfügung zur Einstellung der Sprachnutzung. | Abweisung der Klage; Fortführung der Funktion. |
Diese Klage erfolgt weniger als zwei Jahre nach dem aufsehenerregenden Streit zwischen Scarlett Johansson und OpenAI. In diesem Fall weigerte sich Johansson, ihre Stimme für ChatGPT zu lizenzieren, nur damit das Unternehmen eine Stimme namens „Sky“ veröffentlichte, die bemerkenswert ähnlich klang. OpenAI stellte die Nutzung der Stimme nach dem heftigen Widerstand schließlich ein, obwohl sie behaupteten, es handele sich nicht um eine Nachahmung.
Die Greene-Klage unterscheidet sich dadurch, dass Greene ein Journalist ist, dessen Stimme sein wichtigstes berufliches Kapital ist, und nicht ein Hollywood-Schauspieler, der für visuelle Rollen bekannt ist. Dieser Unterschied ist entscheidend; für einen Rundfunksprecher ist ein synthetischer Klon ein direkter Konkurrent. Wenn eine KI eine Erzählung im „David-Greene-Stil“ für jeden Artikel oder jedes Dokument generieren kann, könnte die Marktnachfrage nach dem tatsächlichen David Greene theoretisch sinken.
Branchenanalysten bei Creati.ai vermuten, dass dieser Fall einen wichtigen Präzedenzfall für den „Stil“ der Vortragsweise schaffen könnte. Während das Urheberrecht normalerweise keinen „Stil“ schützt (man kann beispielsweise kein Musikgenre urheberrechtlich schützen), schafft das Recht auf Eigenvermarktung einen Schutzschild für die persönliche Identität. Die Frage für das Gericht in Santa Clara wird sein: Gehört eine „Public-Radio-Stimme“ zum Genre oder gehört sie dem Menschen?
NotebookLM war eine der überraschenden Erfolgsgeschichten von Google im KI-Bereich. Angetrieben durch das Modell Gemini 1.5 Pro ermöglicht es Nutzern, PDFs, Textdateien und andere Quellen hochzuladen, die die KI dann „liest“ und zusammenfasst. Die Funktion „Audio Overview“ geht noch einen Schritt weiter, indem sie einen skriptbasierten Dialog zwischen zwei KI-Moderatoren generiert – einem männlichen und einem weiblichen –, die das Material in einem lockeren, schlagabtauschähnlichen Format diskutieren.
Der Erfolg der Funktion liegt in ihrer hyperrealistischen Prosodie. Die KI-Moderatoren unterbrechen einander, verwenden Füllwörter, ändern die Tonhöhe, um Skepsis oder Aufregung auszudrücken, und „atmen“ zwischen den Sätzen. Genau dieser realitätsgetreue Realismus hat die Klage ausgelöst. Greene argumentiert, dass die spezifische Methode des männlichen Moderators, Neugier auszudrücken – eine steigende Flexion am Satzende in Kombination mit einer warmen, tieferen Klangfarbe – ein einzigartiges Attribut seiner „Morning Edition“-Persona ist.
Wie wir auf Creati.ai berichten, könnte der Ausgang von Greene gegen Google die Entwicklung von synthetischen Sprachagenten neu gestalten. Wenn die Gerichte zugunsten von Greene entscheiden, müssen KI-Unternehmen möglicherweise strengere „Negativprüfungen“ einführen, um sicherzustellen, dass ihre Stimmen nicht versehentlich berühmten Persönlichkeiten ähneln.
Mögliche Auswirkungen sind:
Vorerst bleibt die NotebookLM-Stimme aktiv, und Google zeigt keine Anzeichen für eine Rücknahme der Funktion. Während der Fall in die Beweisaufnahme geht, wird die Tech-Welt beobachten, ob die „Audio Overview“-Moderatoren zum Schweigen gebracht werden – oder ob die Definition darüber, wem eine „Stimme“ gehört, für das algorithmische Zeitalter neu geschrieben wird.