在人工智能引發(fā)的版權(quán)風(fēng)暴中,學(xué)術(shù)出版界也正式下場。近日,旗下?lián)碛小读~刀》、《細(xì)胞》等刊物的科學(xué)出版巨頭愛思唯爾(Elsevier)與其它四家出版社聯(lián)合起訴Meta公司及其CEO馬克·扎克伯格,指控其在開發(fā)AI大模型過程中,未經(jīng)授權(quán)復(fù)制和使用大量受版權(quán)保護(hù)的書籍、教材和學(xué)術(shù)論文。
這是大型科學(xué)出版商首次就AI訓(xùn)練數(shù)據(jù)問題起訴科技公司。其他起訴者包括阿歇特出版集團(tuán)(Hachette)、麥克米倫(Macmillan)、圣智學(xué)習(xí)(Cengage Learning)、麥格勞·希爾(McGraw Hill)四家出版集團(tuán)以及一名暢銷書作家斯科特·圖羅(Scott Turow)。
這些原告指控Meta在開發(fā)“Llama”AI大語言模型時(shí),進(jìn)行了“歷史上最嚴(yán)重的版權(quán)侵權(quán)行為之一”。起訴書中指出,為了在AI軍備競賽中搶占先機(jī),Meta不僅使用了包含數(shù)十億網(wǎng)頁的網(wǎng)絡(luò)抓取數(shù)據(jù)集,還從Sci-Hub、LibGen等備受爭議的盜版網(wǎng)站上下載并傳播了數(shù)百萬本受版權(quán)保護(hù)的書籍和付費(fèi)學(xué)術(shù)期刊文章。此外,Meta還被指控刪除了作品中的版權(quán)聲明與作者信息,以掩蓋數(shù)據(jù)來源。
原告方披露的Meta內(nèi)部郵件顯示,Meta曾考慮過與出版商簽署合法的授權(quán)協(xié)議,但在扎克伯格的主導(dǎo)下,公司最終放棄了談判,轉(zhuǎn)而直接使用盜版數(shù)據(jù)庫。盡管內(nèi)部員工曾對(duì)其中的法律和倫理風(fēng)險(xiǎn)提出過明確擔(dān)憂,相關(guān)計(jì)劃依然被強(qiáng)行推進(jìn)。
《自然》雜志在今天的一篇報(bào)道中指出,對(duì)于AI公司而言,學(xué)術(shù)文獻(xiàn)和研究論文作為高質(zhì)量的語料,能夠極大提升大模型在科學(xué)領(lǐng)域的準(zhǔn)確性。然而,學(xué)術(shù)界對(duì)此的態(tài)度卻頗為微妙。有研究人員認(rèn)為,許多學(xué)者其實(shí)并不排斥自己的論文被用于訓(xùn)練AI,他們更在意的是生成式AI在輸出時(shí)是否剽竊了作者的寫作風(fēng)格,或者無法提供正確的引用信息。
與此同時(shí),科學(xué)出版商在這場博弈中正展現(xiàn)出雙重姿態(tài)——一方面在法庭上強(qiáng)硬維權(quán),另一方面又在私下與科技巨頭達(dá)成利潤豐厚的數(shù)據(jù)許可協(xié)議。《自然》援引一名研究者的觀點(diǎn)指出,這種限于出版商與大型AI公司之間的獨(dú)家交易,可能會(huì)進(jìn)一步壟斷數(shù)據(jù)資源,導(dǎo)致致力于構(gòu)建開源模型的開發(fā)者和獨(dú)立科研人員難以獲取高質(zhì)量的論文。
面對(duì)出版商的猛烈攻勢,Meta發(fā)言人予以否認(rèn),并表示將積極應(yīng)對(duì)訴訟。Meta的核心辯護(hù)理由依然是美國版權(quán)法中的“合理使用”原則,強(qiáng)調(diào)使用受版權(quán)保護(hù)的材料訓(xùn)練AI屬于“變革性創(chuàng)新”。
近年來,圍繞AI模型訓(xùn)練的法律爭議已成為科技界的常態(tài)。2025年,AI公司Anthropic就曾為平息作家的集體版權(quán)訴訟,同意支付高達(dá)15億美元達(dá)成和解。
Meta在2025年6月與作家理查德·卡德雷等人的官司中獲得階段性勝利。當(dāng)時(shí)美國法院裁定,由于原告未能充分證明AI生成的內(nèi)容對(duì)原創(chuàng)作品市場造成了實(shí)質(zhì)性損害,因此Meta的訓(xùn)練行為暫落入“合理使用”的范疇。但判決也強(qiáng)調(diào),強(qiáng)調(diào)若未來能證明AI對(duì)原創(chuàng)市場形成替代效應(yīng),侵權(quán)訴求依然成立。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.