
L'intersection de l'intelligence artificielle (IA) et de l'identité personnelle a atteint un nouveau point de rupture juridique alors que David Greene, l'ancien animateur de Morning Edition sur NPR, a déposé une plainte contre Google. La plainte, déposée devant la Cour supérieure du comté de Santa Clara, allègue que NotebookLM, l'outil de recherche de Google alimenté par l'IA, utilise une voix masculine dans sa fonctionnalité « Aperçus audio (Audio Overviews) » qui reproduit illégalement la personnalité vocale distincte de Greene sans sa permission ni compensation.
Cette action en justice de haut profil marque un moment important dans le débat en cours sur les « médias synthétiques (synthetic media) » et les droits des créateurs. Elle fait écho à la récente controverse impliquant Scarlett Johansson et OpenAI, accentuant la pression sur l'industrie technologique pour définir les frontières éthiques et juridiques de la synthèse vocale. Pour la communauté de l'IA, le procès de Greene ne concerne pas seulement la voix d'un homme ; c'est un test décisif pour déterminer comment les « styles » et « cadences » vocaux spécifiques — plutôt que de simples enregistrements audio bruts — sont protégés par la loi.
Selon la plainte, Greene n'était pas au courant de l'existence de NotebookLM jusqu'à l'automne 2024, lorsqu'un ancien collègue l'a contacté pour lui demander s'il avait cédé sa voix sous licence à Google. Le collègue a noté que l'hôte masculin dans la fonctionnalité virale « Aperçus audio » de l'outil — qui génère des podcasts conversationnels entre deux agents IA basés sur des documents téléchargés par l'utilisateur — ressemblait « énormément » à Greene.
En écoutant l'audio généré, Greene décrit avoir été « complètement terrifié ». La plainte précise que la voix de l'IA ne ressemblait pas simplement à celle d'un présentateur masculin générique, mais qu'elle capturait les nuances spécifiques de l'élocution de Greene, perfectionnée pendant près de 13 ans à NPR. Ces nuances incluraient son rythme de phrase unique, son intonation et même des tics verbaux spécifiques tels que les « euh » et les « genre » (likes) qui, selon Greene, font partie de sa signature radiophonique.
« C’est ce moment étrange où vous avez l'impression de vous écouter vous-même », a déclaré Greene dans une interview après le dépôt de la plainte. « Ma voix est, en quelque sorte, la partie la plus importante de ce que je suis. » Le procès affirme que la ressemblance était suffisamment forte pour tromper des amis proches et même la femme de Greene, suggérant que le modèle d'IA pourrait avoir été entraîné sur la vaste quantité de données audio publiques disponibles depuis son passage à NPR et son rôle actuel à KCRW.
La plainte accuse Google de violer le droit à l'image (right of publicity) de Greene en vertu de la loi californienne. Contrairement au droit d'auteur, qui protège les œuvres créatives, le droit à l'image protège un individu contre l'utilisation de son nom, de son image ou de sa voix à des fins commerciales sans son consentement. L'équipe juridique de Greene, dirigée par Joshua Michelangelo Stein de Boies Schiller Flexner, soutient que Google a effectivement « volé » l'identité professionnelle de Greene pour humaniser son produit d'IA.
La plainte allègue que :
Google a rapidement rejeté ces allégations, les qualifiant de « sans fondement ». Dans une déclaration, le porte-parole de Google, José Castañeda, a précisé que la voix en question n'était pas le clone d'un individu spécifique mais était basée sur des enregistrements d'un acteur professionnel rémunéré.
« Le son de la voix masculine dans les Aperçus audio de NotebookLM est basé sur un acteur professionnel rémunéré que Google a embauché », a déclaré Castañeda. La défense de Google repose sur l'argument selon lequel, bien que la voix puisse avoir une cadence de « style podcast » — que Greene a contribué à populariser — elle n'est pas une réplique numérique de Greene lui-même. Cette défense est similaire à celle utilisée par OpenAI lorsqu'ils ont affirmé que leur voix « Sky » n'était pas Scarlett Johansson, mais plutôt une actrice différente avec un timbre naturellement similaire.
Cependant, les experts juridiques notent que les lois californiennes sur le droit à l'image peuvent être larges. Si un jury estime que la voix est suffisamment « ressemblante » pour causer une confusion ou impliquer un soutien, Google pourrait tout de même être tenu responsable, indépendamment du fait qu'un acteur différent ait été utilisé comme base. La célèbre affaire Midler v. Ford Motor Co. de 1988 a établi qu'une voix est aussi distinctive qu'un visage, et que l'imiter à des fins commerciales peut faire l'objet de poursuites.
Pour comprendre les points de discorde spécifiques, nous avons décomposé les récits opposés ci-dessous.
Comparaison des affirmations dans l'affaire Greene c. Google
| Caractéristique/Aspect | Allégation de David Greene | Défense de Google |
|---|---|---|
| Origine de la voix | Probablement entraînée sur des années d'archives de NPR sans consentement. | Dérivée d'un acteur vocal professionnel spécifique et rémunéré. |
| Traits vocaux | Correspond à la cadence unique, au ton et aux « tics » spécifiques (ex: « euh »). | Style générique d'« animateur de podcast » ; les similitudes sont fortuites. |
| Perception du public | Des amis, la famille et des collègues ont identifié la voix comme étant celle de Greene. | Aucune intention d'imiter ; aucune confusion visée. |
| Base juridique | Violation du droit à l'image et appropriation illicite d'identité. | Allégations sans fondement ; l'acteur vocal est un individu distinct. |
| Résultat souhaité | Dommages-intérêts et injonction pour arrêter d'utiliser la voix. | Rejet de la plainte ; maintien de la fonctionnalité. |
Ce procès intervient moins de deux ans après le différend médiatisé entre Scarlett Johansson et OpenAI. Dans ce cas, Johansson avait refusé de licencier sa voix pour ChatGPT, pour voir ensuite l'entreprise publier une voix nommée « Sky » qui lui ressemblait étrangement. OpenAI a finalement suspendu l'utilisation de la voix suite au tollé, bien qu'ils aient maintenu qu'il ne s'agissait pas d'une imitation.
Le procès de Greene diffère en ce sens que Greene est un journaliste dont la voix est son principal atout professionnel, plutôt qu'un acteur d'Hollywood connu pour des rôles visuels. Cette distinction est cruciale ; pour un présentateur, un clone synthétique est un concurrent direct. Si une IA peut générer une narration « à la David Greene » pour n'importe quel article ou document, la demande du marché pour le véritable David Greene pourrait théoriquement diminuer.
Les analystes de l'industrie chez Creati.ai suggèrent que cette affaire pourrait établir un précédent vital pour le « style » d'élocution. Bien que le droit d'auteur ne protège généralement pas un « style » (on ne peut pas protéger par copyright un genre de musique, par exemple), le Droit à l'image crée un bouclier pour l'identité personnelle. La question pour le tribunal de Santa Clara sera : une « voix de radio publique » appartient-elle au genre, ou appartient-elle à l'homme ?
NotebookLM a été l'un des succès surprises de Google dans l'espace de l'IA. Alimenté par le modèle Gemini 1.5 Pro, il permet aux utilisateurs de télécharger des PDF, des fichiers texte et d'autres sources, que l'IA « lit » et synthétise ensuite. La fonctionnalité « Aperçu audio » va encore plus loin en générant un dialogue scénarisé entre deux hôtes IA — un homme, une femme — qui discutent du contenu dans un format décontracté et plein de plaisanteries.
Le succès de la fonctionnalité réside dans sa prosodie hyper-réaliste. Les hôtes IA s'interrompent mutuellement, utilisent des mots de remplissage, changent de ton pour exprimer leur scepticisme ou leur enthousiasme, et « respirent » entre les phrases. C'est précisément ce réalisme de haute fidélité qui a déclenché le procès. Greene soutient que la méthode spécifique de l'hôte masculin pour exprimer sa curiosité — une inflexion montante à la fin des phrases combinée à un timbre chaleureux et grave — est un attribut unique de sa personnalité de Morning Edition.
Comme nous le rapportons chez Creati.ai, l'issue de l'affaire Greene v. Google pourrait remodeler le développement des agents vocaux synthétiques. Si les tribunaux tranchent en faveur de Greene, les entreprises d'IA pourraient devoir mettre en œuvre des « vérifications négatives » plus strictes pour s'assurer que leurs voix ne ressemblent pas accidentellement à des personnalités célèbres.
Les impacts potentiels incluent :
Pour l'instant, la voix de NotebookLM reste active et Google ne montre aucun signe de retrait de la fonctionnalité. Alors que l'affaire avance vers la phase de communication des pièces, le monde de la technologie surveillera de près si les hôtes des « Aperçus audio » seront réduits au silence — ou si la définition de qui possède une « voix » sera réécrite pour l'ère algorithmique.