西風 發自 凹非寺
量子位 | 公眾號 QbitAI
AI版權大戰,再度升級了。
手握《柳葉刀》《細胞》等頂刊,掌控全球海量核心科研成果的學術出版巨頭愛思唯爾(Elsevier)正式入局,加入集體訴訟團硬剛Meta——
控訴Meta非法爬取、復制受版權保護的科研論文,用于訓練自家大模型Llama。
![]()
在此之前,站出來起訴AI侵權的多是作家、媒體機構。
此番是頭一回,頂級學術出版商下場打響版權維權之戰。美國出版商協會也在聲明中給定調:
這是主流出版集團首次發起針對AI企業的訴訟,Meta明目張膽侵犯版權,出版商們將還原全部事實。
有意思的是,這場官司明面上矛頭對準Meta,可證據一攤開,與愛思唯爾糾纏十多年的兩大盜版學術庫——LibGen、Sci-Hub,再度被擺上臺面。
只能說Meta樹大錢多,比追責盜版平臺靠譜多了(手動狗頭)。
多方原告組團上陣,指控Meta侵權
這場訴訟于5月5日在紐約南區法院正式提交,被告直指Meta及其CEO扎克伯格。
而原告,不止愛思唯爾一家,還包括法國第一大出版集團阿歇特、源自英國的百年全球綜合性出版集團麥克米倫,以及美國小說家、執業律師Scott Turow等。
![]()
出版商方核心指控非常明確:Meta為訓練Llama大語言模型,未經任何授權,大量獲取、復制、盜用受版權保護的學術論文與出版物內容。
具體來看,訴狀里指出Meta訓練Llama主要靠兩大“不清白”的數據來源:
第一,Common Crawl通用爬蟲數據集。
這份數據集通過全網抓取生成,囊括數十億網頁內容。原告方稱,里面大概率混進了未經授權的版權內容,比如付費期刊的摘要和全文。
第二,兩大知名盜版學術平臺LibGen、Sci-Hub。
這兩個網站常年免費傳播海量付費論文、教材與學術著作,長期深陷全球版權訴訟。出版商指控,Meta通過磁力下載、文件共享等方式,從這些網站盜用學術資源。
值得一提的是,本案很多證據,還是從去年那樁“作家告Meta”(Kadrey v. Meta)案里流出來的內部員工郵件。
面對訴訟,Meta發言人表示:將全力積極應訴。
Meta這邊抗辯邏輯也十分清晰,打出了一張王牌:合理使用(Fair Use)。
據了解,根據美國版權法,“合理使用”屬于版權豁免情形,允許在特定條件下無需授權使用版權內容。
Meta發言人稱:“AI正為個人與企業帶來顛覆性創新、提升生產效率與創作活力,已有法院判例認定,使用版權內容訓練AI可構成合理使用。”
不得不說,這幾年AI圈的版權官司確實不少。像《紐約時報》、一堆知名作家都起訴過AI公司,有些案子已經和解了。
但整體而言,利用版權作品訓練大語言模型是否合法,目前仍未形成明確司法判例。
至于這次后續怎么發展……咱們先搬好小板凳,再蹲一波。
One More Thing
“合理使用”這張牌之前確實被成功使用過。
去年,美國法院裁決:允許Claude背后公司Anthropic在未經作者許可的情況下,使用合法購買的已出版書籍訓練AI。
法院參考了美國版權法中的“合理使用”(Fair Use)原則,認為AI訓練屬于“轉化性使用”(Transformative Use),即對原作品的新用途未取代原作市場,且有利于技術創新和公共利益。
![]()
這也是美國法院首次認可AI公司對書籍的使用權。
就在最近,有網友稱Anthropic正在大批量購入古籍,掃描收錄內容后就直接銷毀原書。這一說法也引發了不少網友關注。
![]()
參考鏈接:
[1]https://www.nature.com/articles/d41586-026-01481-0
[2]https://x.com/sivori/status/2052567312088047754
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.