AI News

전 NPR 호스트 데이비드 그린, NotebookLM 음성 도용 혐의로 구글 고소

인공지능(AI)과 개인 정체성이 교차하는 지점에서 NPR '모닝 에디션(Morning Edition)'의 전 호스트인 데이비드 그린(David Greene)이 구글을 상대로 소송을 제기하며 또 다른 법적 갈등이 발생했습니다. 산타클라라 카운티 상급법원에 제출된 소장에 따르면, 기술 거물 구글의 AI 기반 연구 도구인 NotebookLM의 '오디오 오버뷰(Audio Overviews)' 기능에 사용된 남성 음성이 그린의 허락이나 보상 없이 그의 독특한 목소리 개성을 불법적으로 복제했다고 주장하고 있습니다.

이번 세간의 이목을 끄는 법적 조치는 "합성 미디어(synthetic media)"와 제작자의 권리를 둘러싼 지속적인 논쟁에서 중요한 순간을 기록하고 있습니다. 이는 최근 스칼렛 요한슨(Scarlett Johansson)과 OpenAI 사이의 논란을 연상시키며, 음성 합성의 윤리적 및 법적 경계를 정의하도록 기술 산업을 더욱 압박하고 있습니다. AI 커뮤니티에게 그린의 소송은 단순히 한 남자의 목소리에 관한 것이 아닙니다. 이는 단순한 원음 녹음이 아닌 특정 목소리의 '스타일'과 '억양'이 법에 의해 어떻게 보호받는지에 대한 시금석입니다.

발견: '섬뜩한' 유사성

소장에 따르면, 그린은 2024년 가을 전 동료가 그에게 구글에 목소리 라이선스를 제공했는지 묻기 위해 연락을 해올 때까지 NotebookLM의 존재를 모르고 있었습니다. 해당 동료는 사용자가 업로드한 문서를 바탕으로 두 AI 에이전트 간의 대화형 팟캐스트를 생성하는 이 도구의 화제가 된 "오디오 오버뷰(Audio Overviews)" 기능 속 남성 호스트의 목소리가 그린과 "매우 비슷하게" 들린다고 언급했습니다.

생성된 오디오를 들은 후, 그린은 "완전히 겁이 났다"고 설명했습니다. 소장은 해당 AI 음성이 단순히 일반적인 남성 방송인처럼 들리는 것이 아니라, NPR에서 거의 13년 동안 다듬어진 그린 특유의 전달 방식의 미세한 뉘앙스를 포착했다고 상세히 기술하고 있습니다. 이러한 뉘앙스에는 그린이 자신의 고유한 방송 스타일의 일부라고 주장하는 독특한 문장 속도, 억양, 심지어 "uhhs"나 "likes"와 같은 특정 언어 습관까지 포함된 것으로 알려졌습니다.

그린은 소송 제기 후 인터뷰에서 "자신의 목소리를 직접 듣고 있는 것 같은 섬뜩한 순간이었습니다"라고 말했습니다. "제 목소리는 제 정체성에서 가장 중요한 부분입니다." 소송에서는 이 유사성이 친한 친구들과 그린의 아내까지 속일 정도로 강력했으며, 이는 AI 모델이 그린의 NPR 재직 시절과 현재 KCRW에서의 역할에서 얻을 수 있는 방대한 양의 공개 오디오 데이터로 학습되었을 가능성을 시사한다고 주장합니다.

핵심 혐의: 정체성 유용

이 소송은 구글이 캘리포니아 법에 따른 그린의 퍼블리시티권(right of publicity)을 침해했다고 비난합니다. 저작권이 창작물을 보호하는 것과 달리, 퍼블리시티권은 개인의 성명, 초상 또는 목소리가 동의 없이 상업적 목적으로 사용되는 것으로부터 개인을 보호합니다. 보이즈 쉴러 플렉스너(Boies Schiller Flexner)의 조슈아 미켈란젤로 스타인(Joshua Michelangelo Stein)이 이끄는 그린의 법률 팀은 구글이 자사의 AI 제품에 인간미를 더하기 위해 그린의 직업적 정체성을 사실상 "훔쳤다"고 주장합니다.

소장은 다음과 같이 주장합니다:

  1. 무단 학습: 구글이 NotebookLM 음성 모델을 학습시키기 위해 그린의 광범위한 공개 라디오 방송 코퍼스를 사용했을 가능성이 큼.
  2. 상업적 착취: 구글이 NotebookLM을 사용자들에게 더 매력적으로 만들기 위해 그린의 목소리와 연관된 "따뜻하고 전문적이며 신뢰할 수 있는" 특성으로부터 이득을 취함.
  3. 회복 불가능한 피해: 합성 클론의 존재는 그린의 실제 음성 작업의 가치를 희석시키며, 잠재적으로 그린이 결코 동의하지 않을 내용을 말하는 데 사용될 수 있음.

구글의 변론: "전문 배우" 논거

구글은 이러한 혐의를 "근거 없다"며 즉각 일축했습니다. 구글 대변인 호세 카스타녜다(José Castañeda)는 성명을 통해 문제의 음성이 특정 개인의 클론이 아니라 유료 전문 배우의 녹음을 기반으로 한 것이라고 해명했습니다.

카스타녜다는 "NotebookLM 오디오 오버뷰의 남성 음성은 구글이 고용한 유료 전문 배우의 목소리를 기반으로 합니다"라고 밝혔습니다. 구글의 변론은 해당 목소리가 그린이 대중화하는 데 기여한 "팟캐스트 스타일"의 억양을 가지고 있을 수는 있지만, 그린 자신의 디지털 복제본은 아니라는 주장에 의존하고 있습니다. 이 방어 논리는 OpenAI가 자사의 "Sky" 음성이 스칼렛 요한슨이 아니라 자연스럽게 비슷한 음색을 가진 다른 여배우라고 주장했을 때 사용한 것과 유사합니다.

그러나 법률 전문가들은 캘리포니아의 퍼블리시티권 법이 광범위하게 적용될 수 있다고 지적합니다. 배심원단이 해당 목소리가 혼란을 일으키거나 지지를 암시할 정도로 "유사하게 들린다(sound-alike)"고 판단할 경우, 구글은 다른 배우를 기반으로 사용했는지 여부와 관계없이 여전히 책임을 질 수 있습니다. 유명한 1988년 사건인 *미들러 대 포드 자동차 사건(Midler v. Ford Motor Co.)*은 목소리가 얼굴만큼이나 독특하며, 상업적 이득을 위해 이를 모방하는 것은 소송 사유가 될 수 있음을 확립했습니다.

비교: 그린 vs. NotebookLM의 주장

구체적인 쟁점을 이해하기 위해 대립하는 입장들을 아래와 같이 정리했습니다.

그린 대 구글 소송의 주장 비교

특징/측면 데이비드 그린(David Greene)의 주장 구글의 변론
음성 출처 동의 없이 수년간의 NPR 아카이브를 학습했을 가능성이 높음. 특정 유료 전문 성우로부터 유래함.
음성 특성 고유한 억양, 피치 및 특정 '습관'(예: "uhhs")과 일치함. 일반적인 "팟캐스트 호스트" 스타일이며, 유사성은 우연임.
대중의 인식 친구, 가족 및 동료들이 해당 목소리를 그린으로 식별함. 모방 의도 없음; 혼동을 의도하지 않음.
법적 근거 퍼블리시티권 위반 및 정체성 유용. 근거 없는 주장; 성우는 별개의 개인임.
원하는 결과 손해 배상 및 해당 음성 사용 중단 명령. 소송 기각; 기능의 지속적인 운영.

"Sky"의 잔상: 반복되는 음성 분쟁

이 소송은 스칼렛 요한슨과 OpenAI 사이의 세간의 이목을 끌었던 분쟁이 발생한 지 2년도 채 되지 않아 제기되었습니다. 당시 요한슨은 ChatGPT에 자신의 목소리를 사용하는 라이선스 제공을 거절했으나, 회사는 놀라울 정도로 유사한 "Sky"라는 이름의 음성을 출시했습니다. OpenAI는 모방이 아니라고 주장했으나 결국 반발로 인해 해당 음성의 사용을 중단했습니다.

그린의 소송은 그가 시각적 역할로 알려진 할리우드 배우가 아니라 목소리가 주요 직업적 자산인 언론인이라는 점에서 차이가 있습니다. 이러한 구별은 매우 중요합니다. 방송인에게 합성 클론은 직접적인 경쟁자이기 때문입니다. AI가 모든 기사나 문서에 대해 "데이비드 그린 스타일"의 내레이션을 생성할 수 있다면, 실제 데이비드 그린에 대한 시장 수요는 이론적으로 감소할 수 있습니다.

Creati.ai의 산업 분석가들은 이 사건이 전달의 "스타일"에 대한 중요한 선례를 남길 수 있다고 시사합니다. 저작권은 일반적으로 "스타일"을 보호하지 않지만(예를 들어 음악 장르를 저작권으로 보호할 수 없음), 퍼블리시티권은 개인의 정체성을 보호하는 방패 역할을 합니다. 산타클라라 법원의 질문은 다음과 같을 것입니다: "공영 라디오의 목소리"는 해당 장르에 속하는 것인가, 아니면 그 개인에게 속하는 것인가?

기술적 배경: NotebookLM의 작동 방식

NotebookLM은 AI 분야에서 구글의 놀라운 성공 사례 중 하나였습니다. Gemini 1.5 Pro 모델을 기반으로 하며, 사용자가 PDF, 텍스트 파일 및 기타 소스를 업로드하면 AI가 이를 "읽고" 요약해 줍니다. '오디오 오버뷰' 기능은 여기서 한 걸음 더 나아가 남성 한 명, 여성 한 명의 두 AI 호스트가 일상적인 대화 형식으로 해당 자료에 대해 토론하는 대본형 대화를 생성합니다.

이 기능의 성공 비결은 극도로 사실적인 운율(prosody)에 있습니다. AI 호스트들은 서로의 말을 가로막고, 추임새를 사용하며, 회의감이나 흥분을 표현하기 위해 피치를 바꾸고, 문장 사이사이에 "숨을 쉽니다." 소송을 촉발한 것은 바로 이러한 높은 수준의 사실감입니다. 그린은 문장 끝의 억양을 높이는 것과 따뜻하고 낮은 음역대의 음색이 결합된 남성 호스트의 특정한 호기심 표현 방식이 자신의 "모닝 에디션" 페르소나의 고유한 속성이라고 주장합니다.

AI 산업에 미치는 영향

Creati.ai에서 다루고 있듯이, 그린 대 구글 사건의 결과는 합성 음성 에이전트의 개발 방향을 재편할 수 있습니다. 법원이 그린의 손을 들어준다면, AI 기업들은 자사의 음성이 유명 인사와 우연히라도 닮지 않도록 더 엄격한 "네거티브 체크(negative checks)"를 구현해야 할 수도 있습니다.

잠재적 영향은 다음과 같습니다:

  • 엄격한 라이선싱: 기술 기업들은 조금이라도 모방하려는 스타일의 음성 재능 보유자와 명시적인 계약을 체결해야 할 수 있습니다.
  • 음성 감사: 우발적인 법적 책임을 피하기 위해 AI 음성을 공인 데이터베이스와 대조하여 스크리닝하는 새로운 프로토콜이 등장할 수 있습니다.
  • "일반적" 음성 의무화: 기업들이 인간 언론인을 모방한다는 비난을 피하기 위해 의도적으로 AI 목소리를 더 로봇처럼 들리게 하거나 뚜렷하게 구별되도록 설계할 수 있습니다.

현재 NotebookLM 음성은 여전히 활성화되어 있으며, 구글은 해당 기능을 철회할 조짐을 보이지 않고 있습니다. 사건이 증거 개시(discovery) 단계로 넘어가면서, 기술계는 '오디오 오버뷰' 호스트가 침묵하게 될지, 아니면 "목소리"의 소유권에 대한 정의가 알고리즘 시대에 맞게 재작성될지 주목하고 있습니다.

추천