AI News

Бывший ведущий NPR Дэвид Грин подает в суд на Google из-за предполагаемой кражи голоса для NotebookLM

Пересечение искусственного интеллекта и личности достигло очередной юридической точки кипения: Дэвид Грин (David Greene), бывший ведущий программы Morning Edition на NPR, подал иск против Google. В жалобе, поданной в Высший суд округа Санта-Клара, утверждается, что исследовательский инструмент Google на базе ИИ, NotebookLM, использует мужской голос в функции Аудиообзоры (Audio Overviews), который незаконно воспроизводит уникальный вокальный образ Грина без его разрешения или компенсации.

Этот резонансный судебный иск знаменует собой важный момент в продолжающейся дискуссии о «синтетических медиа» (synthetic media) и правах авторов. Он перекликается с недавним скандалом с участием Скарлетт Йоханссон и OpenAI, усиливая давление на технологическую индустрию с целью определения этических и юридических границ синтеза голоса. Для сообщества ИИ иск Грина — это не просто голос одного человека; это лакмусовая бумажка того, как специфические вокальные «стили» и «каденции» — а не просто необработанные аудиозаписи — защищены законом.

Открытие: «Жуткое» сходство

Согласно иску, Грин не знал о NotebookLM до осени 2024 года, когда бывший коллега связался с ним, чтобы спросить, лицензировал ли он свой голос для Google. Коллега заметил, что ведущий-мужчина в ставшей вирусной функции инструмента «Audio Overviews» (Аудиообзоры) — которая генерирует разговорные подкасты между двумя ИИ-агентами на основе загруженных пользователем документов — звучит «очень похоже» на Грина.

Прослушав сгенерированное аудио, Грин описывает свое состояние как «полный шок». В жалобе подробно указывается, что голос ИИ не просто звучал как голос обычного диктора-мужчины, но и уловил специфические нюансы подачи Грина, отточенные за почти 13 лет работы на NPR. Эти нюансы, как утверждается, включают его уникальный темп предложений, интонацию и даже специфические речевые привычки, такие как «э-э» и «типа», которые, по утверждению Грина, являются частью его фирменного стиля вещания.

«Это тот жуткий момент, когда тебе кажется, что ты слушаешь самого себя», — заявил Грин в интервью после подачи иска. «Мой голос — это, пожалуй, самая важная часть того, кто я есть». В иске утверждается, что сходство было достаточно сильным, чтобы обмануть близких друзей и даже жену Грина, предполагая, что модель ИИ могла обучаться на огромном количестве общедоступных аудиоданных со времен его работы на NPR и его текущей роли в KCRW.

Основные обвинения: Незаконное присвоение личности

Иск обвиняет Google в нарушении права на публичность (right of publicity) Грина в соответствии с законодательством Калифорнии. В отличие от авторского права, которое защищает творческие произведения, право на публичность защищает человека от использования его имени, изображения или голоса в коммерческих целях без согласия. Юридическая команда Грина, возглавляемая Джошуа Микеланджело Стейном из Boies Schiller Flexner, утверждает, что Google фактически «украла» профессиональную идентичность Грина, чтобы гуманизировать свой ИИ-продукт.

В жалобе утверждается, что:

  1. Несанкционированное обучение: Google, вероятно, использовала обширный корпус публичных радиопередач Грина для обучения голосовой модели NotebookLM.
  2. Коммерческая эксплуатация: Google извлекла выгоду из «теплых, профессиональных и заслуживающих доверия» качеств, связанных с голосом Грина, чтобы сделать NotebookLM более привлекательным для пользователей.
  3. Непоправимый вред: Существование синтетического клона обесценивает реальную работу Грина с голосом и потенциально может быть использовано для произнесения вещей, которые Грин никогда бы не поддержал.

Защита Google: Аргумент о «профессиональном актере»

Google быстро отвергла обвинения как «безосновательные». В заявлении представитель Google Хосе Кастаньеда пояснил, что рассматриваемый голос не был клоном какого-либо конкретного человека, а был основан на записях платного профессионального актера.

«Звучание мужского голоса в Audio Overviews в NotebookLM основано на найме платного профессионального актера Google», — заявил Кастаньеда. Защита Google опирается на аргумент о том, что, хотя голос может иметь каденцию в «стиле подкаста» — которую Грин помог популяризировать — он не является цифровой копией самого Грина. Эта защита аналогична той, которую использовала OpenAI, утверждая, что их голос «Sky» не принадлежал Скарлетт Йоханссон, а был голосом другой актрисы с естественным схожим тембром.

Однако эксперты по правовым вопросам отмечают, что законы Калифорнии о праве на публичность могут быть широкими. Если присяжные сочтут, что голос звучит достаточно похоже, чтобы вызвать путаницу или подразумевать одобрение, Google все равно может нести ответственность, независимо от того, использовался ли другой актер в качестве основы. Знаменитое дело 1988 года Midler v. Ford Motor Co. установило, что голос так же индивидуален, как и лицо, и его имитация в целях коммерческой выгоды может быть преследуема по закону.

Сравнение: Претензии Грина против аргументов NotebookLM

Чтобы понять конкретные точки разногласий, мы разбили противоположные позиции ниже.

Сравнение претензий в деле Грин против Google

Характеристика/Аспект Дэвид Грин (David Greene): Обвинение Защита Google
Происхождение голоса Вероятно, обучался на многолетних архивах NPR без согласия. Получен от конкретного, оплачиваемого профессионального актера озвучивания.
Вокальные черты Соответствует уникальной каденции, высоте тона и специфическим «привычкам» (например, «э-э»). Общий стиль «ведущего подкаста»; сходство случайно.
Общественное восприятие Друзья, семья и коллеги идентифицировали голос как принадлежащий Грину. Нет намерения подражать; путаница не предполагалась.
Юридическое основание Нарушение права на публичность и незаконное присвоение личности. Безосновательные претензии; актер озвучивания является отдельным лицом.
Желаемый результат Возмещение ущерба и судебный запрет на использование голоса. Отклонение иска; продолжение работы функции.

Эхо «Sky»: Паттерн споров о голосе

Этот иск подан менее чем через два года после громкого спора между Скарлетт Йоханссон и OpenAI. В том случае Йоханссон отказалась лицензировать свой голос для ChatGPT, после чего компания выпустила голос под названием «Sky», который звучал на удивление похоже. В конечном итоге OpenAI приостановила использование голоса после негативной реакции, хотя и настаивала на том, что это не было имитацией.

Иск Грина отличается тем, что Грин — журналист, чей голос является его основным профессиональным активом, а не голливудский актер, известный своими визуальными ролями. Это различие имеет решающее значение; для диктора синтетический клон является прямым конкурентом. Если ИИ может генерировать озвучку любой статьи или документа в стиле Дэвида Грина, рыночный спрос на настоящего Дэвида Грина теоретически может снизиться.

Отраслевые аналитики из Creati.ai предполагают, что это дело может создать важный прецедент для «стиля» подачи. Хотя авторское право обычно не защищает «стиль» (вы не можете, например, защитить авторским правом музыкальный жанр), Право на публичность (Right of Publicity) создает щит для личной идентичности. Перед судом Санта-Клары встанет вопрос: принадлежит ли «голос общественного радио» жанру или человеку?

Технический контекст: Как работает NotebookLM

NotebookLM стал одной из неожиданных историй успеха Google в сфере ИИ. Работающий на модели Gemini 1.5 Pro, он позволяет пользователям загружать PDF-файлы, текстовые документы и другие источники, которые ИИ затем «читает» и обобщает. Функция Аудиообзоры (Audio Overview) делает еще один шаг вперед, создавая сценарий диалога между двумя ИИ-ведущими — мужчиной и женщиной — которые обсуждают материал в непринужденном формате, наполненном шутками.

Успех функции заключается в ее гиперреалистичной просодии. ИИ-ведущие перебивают друг друга, используют слова-паразиты, меняют высоту тона, чтобы выразить скептицизм или волнение, и «дышат» между предложениями. Именно этот высококачественный реализм и спровоцировал судебный иск. Грин утверждает, что специфический метод выражения любопытства ведущего-мужчины — восходящая интонация в конце предложений в сочетании с теплым тембром в нижнем регистре — является уникальным атрибутом его образа в «Morning Edition».

Последствия для индустрии ИИ

Как мы отмечаем на Creati.ai, исход дела Грин против Google может изменить процесс разработки синтетических голосовых агентов. Если суд вынесет решение в пользу Грина, компаниям, занимающимся ИИ, возможно, придется внедрить более строгие «негативные проверки», чтобы их голоса случайно не напоминали известных личностей.

Потенциальные последствия включают:

  • Более строгое лицензирование: Технологические компании могут быть вынуждены подписывать четкие соглашения с любыми дикторами, чей стиль они намерены имитировать, даже в общих чертах.
  • Аудит голоса: Могут появиться новые протоколы, согласно которым голоса ИИ будут проверяться по базам данных публичных фигур, чтобы избежать случайной ответственности.
  • «Роботизированные» мандаты: Компании могут намеренно проектировать голоса ИИ так, чтобы они звучали более роботизированно или обособленно, чтобы избежать обвинений в подражании журналистам-людям.

На данный момент голос NotebookLM остается активным, и Google не выказывает никаких признаков отказа от этой функции. По мере того как дело переходит к этапу предоставления доказательств, технологический мир будет следить за тем, замолкнут ли ведущие «Audio Overview» — или же определение того, кому принадлежит «голос», будет переписано для эпохи алгоритмов.

Рекомендуемые