
La intersección de la inteligencia artificial (IA) y la identidad personal ha alcanzado otro punto de conflicto legal, ya que David Greene, el ex presentador de Morning Edition de NPR, ha presentado una demanda contra Google. La denuncia, presentada en el Tribunal Superior del Condado de Santa Clara, alega que la herramienta de investigación impulsada por IA del gigante tecnológico, NotebookLM, utiliza una voz masculina en su función "Audio Overviews" que replica ilegalmente la personalidad vocal distintiva de Greene sin su permiso ni compensación.
Esta acción legal de alto perfil marca un momento significativo en el debate en curso sobre los "medios sintéticos" (synthetic media) y los derechos de los creadores. Se hace eco de la reciente controversia que involucra a Scarlett Johansson y OpenAI, presionando aún más a la industria tecnológica para definir los límites éticos y legales de la síntesis de voz. Para la comunidad de IA, la demanda de Greene no se trata solo de la voz de un hombre; es una prueba de fuego para determinar cómo los "estilos" y las "cadencias" vocales específicos —en lugar de solo grabaciones de audio en bruto— están protegidos por la ley.
Según la demanda, Greene no tuvo conocimiento de NotebookLM hasta el otoño de 2024, cuando un antiguo colega se puso en contacto para preguntarle si había licenciado su voz a Google. El colega notó que el presentador masculino en la viral función "Audio Overviews" de la herramienta —que genera pódcasts conversacionales entre dos agentes de IA basados en documentos cargados por el usuario— sonaba "muy parecido" a Greene.
Al escuchar el audio generado, Greene describe sentirse "completamente asustado". La denuncia detalla que la voz de IA no solo sonaba como un locutor masculino genérico, sino que capturaba los matices específicos de la locución de Greene perfeccionados durante casi 13 años en NPR. Estos matices supuestamente incluyen su ritmo de fraseo único, entonación e incluso tics verbales específicos como los "uhhs" y "likes" que Greene afirma que son parte de su estilo de locución característico.
"Es ese momento inquietante en el que sientes que te estás escuchando a ti mismo", declaró Greene en una entrevista tras la presentación de la demanda. "Mi voz es, por así decirlo, la parte más importante de quién soy". La demanda afirma que el parecido era lo suficientemente fuerte como para engañar a amigos cercanos e incluso a la esposa de Greene, sugiriendo que el modelo de IA podría haber sido entrenado con la gran cantidad de datos de audio públicos disponibles de su paso por NPR y su papel actual en KCRW.
La demanda acusa a Google de violar el derecho de publicidad (right of publicity) de Greene bajo la ley de California. A diferencia del derecho de autor, que protege las obras creativas, el derecho de publicidad protege a un individuo de que se utilice su nombre, imagen o voz con fines comerciales sin su consentimiento. El equipo legal de Greene, encabezado por Joshua Michelangelo Stein de Boies Schiller Flexner, sostiene que Google ha "robado" efectivamente la identidad profesional de Greene para humanizar su producto de IA.
La denuncia alega que:
Google ha rechazado rápidamente las acusaciones calificándolas de "infundadas". En un comunicado, el portavoz de Google, José Castañeda, aclaró que la voz en cuestión no era un clon de ningún individuo específico, sino que se basaba en grabaciones de un actor profesional pagado.
"El sonido de la voz masculina en las Audio Overviews de NotebookLM se basa en un actor profesional pagado que Google contrató", afirmó Castañeda. La defensa de Google se basa en el argumento de que, si bien la voz puede tener una cadencia de "estilo pódcast" —que Greene ayudó a popularizar—, no es una réplica digital del propio Greene. Esta defensa es similar a la utilizada por OpenAI cuando afirmaron que su voz "Sky" no era Scarlett Johansson, sino una actriz diferente con un timbre naturalmente similar.
Sin embargo, los expertos legales señalan que las leyes de derecho de publicidad de California pueden ser amplias. Si un jurado determina que la voz es lo suficientemente "parecida" como para causar confusión o implicar un respaldo, Google aún podría ser responsable, independientemente de si se utilizó a un actor diferente como base. El famoso caso de 1988 Midler v. Ford Motor Co. estableció que una voz es tan distintiva como un rostro, y que imitarla con fines comerciales puede ser procesable.
Para comprender los puntos específicos de disputa, hemos desglosado las narrativas opuestas a continuación.
Comparación de reclamaciones en Greene v. Google
| Característica/Aspecto | David Greene's Allegation | Defensa de Google |
|---|---|---|
| Origen de la voz | Probablemente entrenada en años de archivos de NPR sin consentimiento. | Derivada de un actor de voz profesional específico y pagado. |
| Rasgos vocales | Coincide con la cadencia única, el tono y "tics" específicos (p. ej., "uhhs"). | Estilo genérico de "presentador de pódcast"; las similitudes son coincidentes. |
| Percepción pública | Amigos, familiares y colegas identificaron la voz como la de Greene. | Sin intención de imitar; no se pretendía causar confusión. |
| Base legal | Violación del derecho de publicidad y apropiación indebida de la identidad. | Reclamaciones infundadas; el actor de voz es un individuo distinto. |
| Resultado deseado | Daños y perjuicios y una orden judicial para dejar de usar la voz. | Desestimación de la demanda; continuación de la función. |
Esta demanda llega menos de dos años después de la disputa de alto perfil entre Scarlett Johansson y OpenAI. En esa instancia, Johansson se negó a licenciar su voz para ChatGPT, solo para que la empresa lanzara una voz llamada "Sky" que sonaba notablemente similar. OpenAI finalmente pausó el uso de la voz tras la reacción negativa, aunque mantuvieron que no era una imitación.
La demanda de Greene difiere en que Greene es un periodista cuya voz es su principal activo profesional, en lugar de un actor de Hollywood conocido por papeles visuales. Esta distinción es crucial; para un locutor, un clon sintético es un competidor directo. Si una IA puede generar una narración al "estilo de David Greene" para cualquier artículo o documento, la demanda del mercado para el David Greene real podría, teóricamente, disminuir.
Analistas de la industria en Creati.ai sugieren que este caso podría sentar un precedente vital para el "estilo" de locución. Si bien el derecho de autor no suele proteger un "estilo" (no se puede registrar el derecho de autor de un género musical, por ejemplo), el Derecho de Publicidad crea un escudo para la identidad personal. La pregunta para el tribunal de Santa Clara será: ¿pertenece una "voz de radio pública" al género o pertenece al hombre?
NotebookLM ha sido uno de los sorprendentes éxitos de Google en el espacio de la IA. Impulsado por el modelo Gemini 1.5 Pro, permite a los usuarios cargar archivos PDF, archivos de texto y otras fuentes, que la IA luego "lee" y sintetiza. La función "Audio Overview" va un paso más allá al generar un diálogo guionizado entre dos presentadores de IA —uno masculino, una femenina— que discuten el material en un formato casual y lleno de bromas.
El éxito de la función reside en su prosodia hiperrealista. Los presentadores de IA se interrumpen entre sí, utilizan muletillas, cambian el tono para expresar escepticismo o entusiasmo y "respiran" entre frases. Es precisamente este realismo de alta fidelidad lo que ha desencadenado la demanda. Greene argumenta que el método específico del presentador masculino para expresar curiosidad —una inflexión ascendente al final de las frases combinada con un timbre cálido de registro bajo— es un atributo único de su personalidad en "Morning Edition".
Como cubrimos en Creati.ai, el resultado de Greene v. Google podría remodelar el desarrollo de agentes de voz sintéticos. Si los tribunales fallan a favor de Greene, las empresas de IA podrían necesitar implementar "controles negativos" más estrictos para garantizar que sus voces no se parezcan accidentalmente a figuras famosas.
Los impactos potenciales incluyen:
Por ahora, la voz de NotebookLM permanece activa y Google no muestra signos de retirar la función. A medida que el caso avance hacia la fase de proposición de pruebas (discovery), el mundo tecnológico estará atento para ver si los presentadores de "Audio Overview" serán silenciados o si la definición de quién posee una "voz" será reescrita para la era algorítmica.