컴퓨터 코더들, OpenAI와 Microsoft를 상대로 한 90억 달러 저작권 소송 항소

컴퓨터 프로그래머들, OpenAI와 마이크로소프트를 상대로 한 90억 달러 규모 저작권 소송 항소

생성형 AI（Generative AI） 산업의 중대한 기로에서, 한 무리의 컴퓨터 프로그래머들이 미국 제9 연방 항소 법원에 마이크로소프트(Microsoft), 깃허브(GitHub), OpenAI를 상대로 한 집단 소송을 재개해 줄 것을 촉구했습니다. 2026년 2월 11일에 변론이 진행된 이번 항소는 디지털 밀레니엄 저작권법（Digital Millennium Copyright Act, DMCA）에 따른 청구를 복구하여, 해당 거대 기술 기업들이 추산 90억 달러를 초과하는 법정 손해배상 책임에 노출되도록 하는 것을 목표로 합니다.

Doe v. GitHub, Inc. 사건은 수십억 줄의 공개 코드로 학습된 AI 기반 코딩 보조 도구인 깃허브 코파일럿(GitHub Copilot)을 중심으로 합니다. 분쟁의 핵심은 AI 결과물이 원본 저작물과 동일한 복사본이 아닐지라도, 학습 과정에서 저자 이름 및 라이선스 헤더와 같은 "저작권 관리 정보（Copyright Management Information, CMI）"를 제거할 때 AI 기업들이 저작권법을 위반하는지 여부입니다.

90억 달러의 판돈: DMCA 청구의 부활

익명의 소프트웨어 개발자들로 구성된 원고 측은 하급 법원이 자신들의 DMCA 제1202조 청구를 기각한 것이 잘못되었다고 주장합니다. 제1202조는 침해 사실을 은폐할 의도로 CMI를 고의적으로 제거하거나 변경하는 것을 금지합니다.

2024년 중반, 존 S. 티거(Jon S. Tigar) 미국 지방 법원 판사는 논란의 여지가 있는 "동일성（identicality）" 요건을 설정하며 이러한 특정 청구들을 기각했습니다. 티거 판사는 제1202조 위반이 성립하려면 AI가 CMI가 누락된 상태에서 원본 코드의 정확한 복사본을 생성했음을 원고가 증명해야 한다고 판결했습니다. 코파일럿과 같은 AI 모델은 일반적으로 정확한 블록을 그대로 내뱉기보다는 새로운 코드를 합성하기 때문에, 지방 법원은 위반 사항이 없다고 판단했습니다.

항소심에서 원고 측은 이러한 해석이 인공지능 시대에 DMCA를 사실상 무효화하는 것이라고 주장했습니다. 그들의 변호인단은 제9 항소 법원에서 해당 법안이 이후의 배포가 축자적인 복사본인지 아니면 2차적 저작물（derivative work）인지에 관계없이 저작권 귀속 표시의 무결성을 보호하기 위해 설계되었다고 변론했습니다.

만약 제9 항소 법원이 하급 법원의 판결을 뒤집는다면, 그 재정적 영향은 엄청납니다. DMCA는 위반 건당 2,500달러에서 25,000달러의 법정 손해배상을 허용합니다. 코파일럿의 사용자가 수백만 명에 달하고 매일 수많은 코드 줄을 생성하고 있다는 점을 감안할 때, 원고 측은 잠재적 책임 규모가 최대 90억 달러에 달할 수 있다고 추산하며, 이는 AI 개발의 경제 구조를 근본적으로 바꿀 수 있는 수치입니다.

"동일성"의 격전지

구두 변론에서는 저작권법을 머신러닝에 어떻게 적용해야 하는지에 대한 극명한 시각 차이가 드러났습니다. 피고인 마이크로소프트와 OpenAI는 하급 법원의 판결이 DMCA의 목적과 일치한다고 주장합니다. 그들은 동일성 요건이 없다면, 학습 데이터와 "닮았다"고 주장할 수 있지만 귀속 표시가 부족한 모든 결과물이 법적 책임을 유발할 수 있으며, 이는 혁신을 저해하고 AI 도구를 무제한적인 소송에 노출시킬 것이라고 주장합니다.

아래 표는 DMCA 제1202조 해석에 관해 양측이 제시한 핵심 법적 논거를 요약한 것입니다.

DMCA 제1202조에 관한 법적 논거
---|---|----
논거 측면|원고 측 입장 (프로그래머)|피고 측 입장 (마이크로소프트/OpenAI)
법률 해석|제1202조는 원본 저작물의 CMI 무결성을 보호합니다. "수집(ingestion)" 과정에서 이를 제거하는 것은 결과물에 관계없이 법 위반입니다.|책임은 CMI가 제거된 저작물의 동일한 복사본이 배포되는 경우에만 부과됩니다.
"동일성" 테스트|지방 법원은 법률 조항에 존재하지 않는 "동일성" 요건을 만들어냈습니다.|동일성을 요구하는 것은 과도한 법 적용을 방지합니다. 그렇지 않으면 공정 이용（fair use）과 변형적 저작물이 억제될 것입니다.
해악의 정의|해악은 귀속 표시가 제거되어 창작자와 저작물 간의 연결이 끊어질 때 발생하며, 이는 향후의 침해를 용이하게 합니다.|특정 원고의 코드가 CMI 없이 정확하게 재현되지 않는 한 해악은 증명되지 않습니다.
산업 영향|CMI 제거를 허용하는 것은 라이선스 조건(예: GPL, MIT)을 우회하기 위해 오픈 소스 코드를 "세탁"하도록 장려하는 것입니다.|AI 학습에 엄격한 CMI 책임을 부과하면 생성형 AI를 합법적으로 개발하는 것이 불가능해질 것입니다.

AI 시대의 CMI 이해

이번 항소의 중대성을 이해하려면 오픈 소스 소프트웨어가 어떻게 작동하는지 살펴보아야 합니다. MIT 라이선스나 GNU 일반 공중 라이선스(GPL)와 같은 오픈 소스 라이선스는 원작자에게 공로를 돌리고 라이선스 조건을 보존한다는 조건 하에 코드의 자유로운 사용을 허용합니다. 이 귀속 데이터인 CMI는 생태계의 준수와 신뢰에 있어 매우 중요합니다.

OpenAI의 코덱스(Codex) 모델(코파일럿의 기반)이 이 코드를 수집할 때, 텍스트를 토큰화하여 사실상 통계적 관계로 분해합니다. 이 과정에서 특정 라이선스 헤더와 저자 주석은 보존해야 할 법적 구속력이 있는 메타데이터가 아니라, 단순히 학습되거나 무시될 또 다른 패턴으로 취급되는 경우가 많습니다.

광범위한 AI 산업에 미치는 영향

제9 항소 법원이 원고의 손을 들어주는 판결을 내린다면 AI 분야에 엄청난 파장을 일으킬 것입니다. 이는 기업들이 다음과 같은 조치를 취하도록 강제할 가능성이 높습니다.

모델 재학습: AI 개발자는 결과물에서 CMI를 완벽하게 보존할 수 없는 모든 코드나 텍스트를 학습 데이터 세트에서 제거해야 할 수도 있습니다.
귀속 메커니즘 구현: 미래의 AI 모델은 "출처를 인용"해야 할 수도 있으며, 이는 현재 거대 언어 모델（LLM）에서 해결되지 않은 기술적 과제입니다.
소급적 책임 직면: 챗GPT(ChatGPT)와 같은 텍스트 생성기나 미드저니(Midjourney)와 같은 이미지 생성기를 포함한 다른 생성형 AI 모델들도 학습 데이터에서 CMI를 제거한 것으로 판명될 경우 유사한 소송에 직면할 수 있습니다.

향후 전망은?

제9 항소 법원 합의체는 올해 말에 판결을 내릴 것으로 예상됩니다. 1998년의 법률을 2026년의 기술에 적용하는 법적 질문의 참신함을 고려할 때, 결과에 관계없이 이 사건은 대법원까지 상고될 가능성이 높습니다.

현재로서는 개발자 커뮤니티가 이를 예의주시하고 있습니다. 이 사건은 단순히 금전적 분쟁 이상의 의미를 지닙니다. 이는 점점 더 자동화되는 세상에서 인간의 저작자로서의 가치에 대한 근본적인 이견을 나타냅니다. 프로그래머들이 승리한다면, 오픈 소스의 규칙이 알고리즘에 의해 재작성될 수 없음을 확인하는 계기가 될 것입니다. 만약 그들이 패배한다면, 데이터는 연료일 뿐이며 귀속 표시는 선택 사항인 현재의 산업 관행이 고착화될 수 있습니다.