AI News

O Ex-Apresentador da NPR, David Greene, Processa o Google por Suposto Roubo de Voz no NotebookLM

A interseção da inteligência artificial (Artificial Intelligence - AI) e a identidade pessoal atingiu outro ponto crítico legal, com David Greene, o ex-apresentador do Morning Edition da NPR, abrindo um processo contra o Google. A queixa, apresentada no Tribunal Superior do Condado de Santa Clara, alega que a ferramenta de pesquisa baseada em IA da gigante da tecnologia, NotebookLM, utiliza uma voz masculina em seu recurso de "Audio Overviews" que replica ilegalmente a persona vocal distinta de Greene sem sua permissão ou compensação.

Esta ação legal de alto perfil marca um momento significativo no debate contínuo sobre "mídia sintética" (synthetic media) e os direitos dos criadores. Ela ecoa a recente controvérsia envolvendo Scarlett Johansson e a OpenAI, pressionando ainda mais a indústria de tecnologia a definir as fronteiras éticas e legais da síntese de voz. Para a comunidade de IA, o processo de Greene não é apenas sobre a voz de um homem; é um teste decisivo para saber como "estilos" e "cadências" vocais específicos — e não apenas gravações de áudio brutas — são protegidos pela lei.

A Descoberta: Uma Familiaridade "Assustadora"

De acordo com o processo, Greene não tinha conhecimento do NotebookLM até o outono de 2024, quando um ex-colega entrou em contato para perguntar se ele havia licenciado sua voz para o Google. O colega observou que o apresentador masculino no recurso viral de "Resumos de Áudio" (Audio Overviews) da ferramenta — que gera podcasts conversacionais entre dois agentes de IA com base em documentos carregados pelo usuário — soava "muito parecido" com Greene.

Ao ouvir o áudio gerado, Greene descreve ter ficado "completamente assustado". A queixa detalha que a voz da IA não soava meramente como um locutor masculino genérico, mas capturava as nuances específicas da entrega de Greene, aperfeiçoadas ao longo de quase 13 anos na NPR. Essas nuances supostamente incluem seu ritmo de frase único, entonação e até vícios verbais específicos, como os "uhhs" e "likes", que Greene afirma fazerem parte de seu estilo de transmissão característico.

"É esse momento assustador em que você sente que está ouvindo a si mesmo", afirmou Greene em uma entrevista após a abertura do processo. "Minha voz é, tipo, a parte mais importante de quem eu sou." O processo afirma que a semelhança era forte o suficiente para enganar amigos próximos e até a esposa de Greene, sugerindo que o modelo de IA pode ter sido treinado na vasta quantidade de dados de áudio públicos disponíveis de seu mandato na NPR e de seu papel atual na KCRW.

As Principais Alegações: Apropriação Indébita de Identidade

O processo acusa o Google de violar o direito de publicidade (right of publicity) de Greene sob a lei da Califórnia. Ao contrário dos direitos autorais, que protegem obras criativas, o direito de publicidade protege um indivíduo de ter seu nome, imagem ou voz usados para fins comerciais sem consentimento. A equipe jurídica de Greene, liderada por Joshua Michelangelo Stein da Boies Schiller Flexner, argumenta que o Google efetivamente "roubou" a identidade profissional de Greene para humanizar seu produto de IA.

A queixa alega que:

  1. Treinamento Não Autorizado: O Google provavelmente usou o extenso corpus de transmissões de rádio pública de Greene para treinar o modelo de voz do NotebookLM.
  2. Exploração Comercial: O Google se beneficiou das qualidades "quentes, profissionais e confiáveis" associadas à voz de Greene para tornar o NotebookLM mais atraente para os usuários.
  3. Dano Irreparável: A existência de um clone sintético dilui o valor do trabalho de voz real de Greene e poderia potencialmente ser usado para dizer coisas que Greene nunca endossaria.

A Defesa do Google: O Argumento do "Ator Profissional"

O Google descartou rapidamente as alegações como "sem fundamento". Em um comunicado, o porta-voz do Google, José Castañeda, esclareceu que a voz em questão não era um clone de nenhum indivíduo específico, mas baseava-se em gravações de um ator profissional pago.

"O som da voz masculina nos Resumos de Áudio do NotebookLM é baseado em um ator profissional pago que o Google contratou", afirmou Castañeda. A defesa do Google baseia-se no argumento de que, embora a voz possa ter uma cadência de "estilo de podcast" — que Greene ajudou a popularizar — ela não é uma réplica digital do próprio Greene. Esta defesa é semelhante à usada pela OpenAI quando afirmaram que sua voz "Sky" não era Scarlett Johansson, mas sim uma atriz diferente com um timbre naturalmente semelhante.

No entanto, especialistas jurídicos observam que as leis de direito de publicidade da Califórnia podem ser amplas. Se um júri considerar que a voz é "semelhante" o suficiente para causar confusão ou implicar um endosso, o Google ainda poderá ser responsabilizado, independentemente de um ator diferente ter sido usado como base. O famoso caso de 1988 Midler v. Ford Motor Co. estabeleceu que uma voz é tão distinta quanto um rosto, e imitá-la para ganho comercial pode ser passível de ação judicial.

Comparação: Alegações de Greene vs. Google

Para entender os pontos específicos de discórdia, detalhamos as narrativas opostas abaixo.

Comparação de Alegações em Greene v. Google

Recurso/Aspeto Alegação de David Greene Defesa do Google
Origem da Voz Provavelmente treinada em anos de arquivos da NPR sem consentimento. Derivada de um ator de voz profissional pago específico.
Traços Vocais Corresponde à cadência única, tom e "vícios" específicos (ex: "uhhs"). Estilo genérico de "apresentador de podcast"; semelhanças são coincidentes.
Percepção Pública Amigos, familiares e colegas identificaram a voz como sendo de Greene. Sem intenção de imitar; nenhuma confusão pretendida.
Base Legal Violação do Direito de Publicidade e Apropriação Indébita de Identidade. Alegações sem fundamento; o ator de voz é um indivíduo distinto.
Resultado Desejado Indenização e uma liminar para interromper o uso da voz. Arquivamento do processo; operação contínua do recurso.

O Eco de "Sky": Um Padrão de Disputas de Voz

Este processo ocorre menos de dois anos após a disputa de alto perfil entre Scarlett Johansson e a OpenAI. Naquela instância, Johansson se recusou a licenciar sua voz para o ChatGPT, apenas para a empresa lançar uma voz chamada "Sky" que soava notavelmente semelhante. A OpenAI acabou pausando o uso da voz após a repercussão negativa, embora mantivessem que não era uma imitação.

O processo de Greene difere no fato de que Greene é um jornalista cuja voz é seu principal ativo profissional, em vez de um ator de Hollywood conhecido por papéis visuais. Essa distinção é crucial; para um locutor, um clone sintético é um concorrente direto. Se uma IA pode gerar uma narração no "estilo David Greene" para qualquer artigo ou documento, a demanda de mercado pelo David Greene real poderia, teoricamente, diminuir.

Analistas da indústria na Creati.ai sugerem que este caso pode estabelecer um precedente vital para o "estilo" de entrega. Embora os direitos autorais normalmente não protejam um "estilo" (não se pode registrar o direito autoral de um gênero musical, por exemplo), o Direito de Publicidade cria um escudo para a identidade pessoal. A questão para o tribunal de Santa Clara será: uma "voz de rádio pública" pertence ao gênero ou pertence ao homem?

Contexto Técnico: Como o NotebookLM Funciona

O NotebookLM tem sido uma das histórias de sucesso surpreendentes do Google no espaço da IA. Alimentado pelo modelo Gemini 1.5 Pro, ele permite que os usuários carreguem PDFs, arquivos de texto e outras fontes, que a IA então "lê" e sintetiza. O recurso de "Resumo de Áudio" vai um passo além ao gerar um diálogo roteirizado entre dois apresentadores de IA — um masculino, um feminino — que discutem o material em um formato casual e cheio de interações.

O sucesso do recurso reside em sua prosódia hiper-realista. Os apresentadores de IA se interrompem, usam palavras de preenchimento, mudam o tom para expressar ceticismo ou entusiasmo e "respiram" entre as frases. É precisamente esse realismo de alta fidelidade que desencadeou o processo. Greene argumenta que o método específico do apresentador masculino de expressar curiosidade — uma inflexão ascendente no final das frases combinada com um timbre quente de registro baixo — é um atributo único de sua persona no "Morning Edition".

Implicações para a Indústria de IA

Como cobrimos na Creati.ai, o resultado de Greene v. Google pode remodelar o desenvolvimento de agentes de voz sintéticos. Se os tribunais decidirem a favor de Greene, as empresas de IA podem precisar implementar "verificações negativas" mais rigorosas para garantir que suas vozes não se assemelhem acidentalmente a figuras famosas.

Os impactos potenciais incluem:

  • Licenciamento mais Rígido: As empresas de tecnologia podem ser forçadas a assinar acordos explícitos com qualquer talento de voz cujo estilo pretendam aproximar, mesmo que vagamente.
  • Auditoria de Voz: Novos protocolos podem surgir onde as vozes de IA são examinadas contra bancos de dados de figuras públicas para evitar responsabilidade acidental.
  • Mandatos "Genéricos": As empresas podem projetar intencionalmente vozes de IA para soarem mais robóticas ou distintas para evitar acusações de imitar jornalistas humanos.

Por enquanto, a voz do NotebookLM permanece ativa e o Google não mostra sinais de retirar o recurso. À medida que o caso avança para a fase de descoberta, o mundo da tecnologia estará observando para ver se os apresentadores do "Resumo de Áudio" serão silenciados — ou se a definição de quem possui uma "voz" será reescrita para a era algorítmica.

Em Destaque