
在生成式人工智慧(Generative AI)產業的關鍵時刻,一群電腦程式設計師已敦促美國第九巡迴上訴法院(U.S. Court of Appeals for the Ninth Circuit)重啟針對微軟(Microsoft)、GitHub 與 OpenAI 的集體訴訟。這項於 2026 年 2 月 11 日辯論的上訴,旨在恢復根據《數位千禧年著作權法》(Digital Millennium Copyright Act,DMCA)提出的主張,這可能使這些科技巨頭面臨估計超過 90 億美元的法定損害賠償。
此案名為 Doe v. GitHub, Inc.,核心在於 GitHub Copilot,這是一款使用數十億行公共程式碼訓練的人工智慧驅動編碼助手。爭議的焦點在於人工智慧公司在訓練過程中剝離「著作權管理資訊」(Copyright Management Information,CMI)——例如作者姓名和授權標頭——是否違反了著作權法,即使人工智慧的輸出並非原始作品的完全一致副本。
原告是一群匿名軟體開發者,他們主張初級法院在駁回其 DMCA 第 1202 條(Section 1202)主張時犯了錯誤。第 1202 條禁止故意刪除或竄改 CMI,其目的是隱瞞侵權行為。
2024 年年中,美國地區法官 Jon S. Tigar 駁回了這些特定主張,確立了一項具爭議的「一致性(identicality)」要求。Tigar 法官裁定,要構成違反 第 1202 條,原告必須證明人工智慧生成了其程式碼的精確副本且缺少 CMI。由於像 Copilot 這樣的人工智慧模型通常是合成新程式碼而非重複輸出精確區塊,地區法院認為沒有違法。
在上訴中,原告辯稱這種解釋在人工智慧時代實際上使 DMCA 失效。他們的法律團隊在 第九巡迴法院 辯論稱,該法規旨在保護著作權署名的完整性,無論後續分發的是逐字副本還是衍生作品(derivative work)。
如果第九巡迴法院推翻初級法院的裁決,其財務影響將是巨大的。DMCA 允許每次違規處以 2,500 至 25,000 美元的法定損害賠償。由於 Copilot 擁有數百萬用戶並每天生成無數行程式碼,原告估計潛在責任可能高達 90 億美元,這一數字將從根本上改變人工智慧開發的經濟模式。
口頭辯論突顯了著作權法應如何應用於機器學習的尖銳分歧。被告——微軟 與 OpenAI——堅持認為初級法院的裁決與 DMCA 的目的相符。他們辯稱,如果沒有一致性要求,任何可以說「類似於」訓練數據但缺乏署名的輸出都可能引發責任,從而抑制創新並使人工智慧工具面臨無限的訴訟。
下表概述了雙方針對 DMCA 第 1202 條解釋所提出的核心法律論點。
關於 DMCA 第 1202 條的法律論點
---|---|----
論點面向|原告立場(程式設計師)|被告立場(微軟/OpenAI)
法規解釋|第 1202 條保護原始作品上 CMI 的完整性。在「攝取」過程中將其刪除即屬違法,無論輸出結果如何。|僅當從隨後分發的作品一致副本中刪除 CMI 時,才負有責任。
「一致性」測試|地區法院發明了一項法規文本中並不存在的「一致性」要求。|要求一致性可防止過度擴張;否則,合理使用(fair use)和轉化性作品將受到壓制。
損害定義|當署名被剝離時即產生損害,這切斷了創作者與其作品之間的聯繫,為未來的侵權提供了便利。|除非特定原告的程式碼在沒有其 CMI 的情況下被精確複製,否則無法證明損害。
產業影響|允許刪除 CMI 會激勵「洗白」開源程式碼以繞過授權條款(例如 GPL、MIT)。|對人工智慧訓練施加嚴格的 CMI 責任,將使生成式人工智慧在法律上無法開發。
要理解這項上訴的嚴重性,必須觀察開源軟體的運作方式。開源授權(例如 MIT 授權或 GNU 通用公眾授權 (GPL))允許免費使用程式碼,前提 是署名原作者並保留授權條款。這些署名數據——即 CMI——對於生態系統的合規性和信任至關重要。
當 OpenAI 的 Codex 模型(Copilot 的核心)攝取這些程式碼時,它會將文本標記化(tokenize),有效地將其分解為統計關係。在這個過程中,特定的授權標頭和作者評論通常被視為僅是另一種待學習或忽略的模式,而非需要保留的具法律約束力的元數據。
原告辯稱,這一過程創造了一種工具,允許用戶在不知情的情況下,透過使用沒有所需署名的程式碼來侵犯著作權。他們斷言,微軟和 OpenAI 不僅是在「閱讀」程式碼,而且是在主動剝離旨在保護程式碼的機制。
第九巡迴法院若做出有利於原告的裁決,將在人工智慧領域引發震盪。這可能會迫使公司:
法律專家建議,第九巡迴法院的決定可能會為美國法律如何處理所有受著作權保護數據的「攝取」設定標準。雖然被告在使用內容方面很大程度上依賴「合理使用」原則,但 DMCA 主張透過專注於元數據的刪除來規避合理使用,這是一項獨立的法定違規行為。
第九巡迴法院小組預計將於今年晚些時候發布裁決。鑑於法律問題的新穎性——將 1998 年的法規應用於 2026 年的技術——無論結果如何,該裁決都可能會上訴至最高法院。
目前,開發者社群正密切關注。此案不僅僅是一場財務糾紛;它反映了在日益自動化的世界中,對於人類作者身份價值的根本分歧。如果程式設計師獲勝,它將確認開源規則不能被演算法重寫。如果他們失敗,則可能會鞏固目前的產業慣例,即數據是燃料,而署名是可選的。