最近X上有個帖子挺火的。
一個叫Sivori的博主發帖說,Anthropic正在購買數百萬本書籍,掃描并銷毀,因為從法律角度看銷毀是最安全的選擇。他還提到,這是他20年前讀過的Vernor Vinge小說《The Rainbow's End》里的情節。
![]()
推文瀏覽超百萬,轉發評論一大堆。
小紅書上也有人在聊這事,說法都是標題那個夸張風格,什么「A社把人類知識庫蒸餾了」「古籍全部沒了」。
![]()
這事吧,有真有假。真的部分遠比小說還魔幻,假的部分也確實被放大了不少。我翻了媒體報道和法院文件,給你們捋一捋。
真事,巴拿馬項目確實存在
2026年初,法庭文件曝光了Anthropic一個代號「Project Panama」的內部計劃。
中文翻譯過來叫巴拿馬項目。
這個項目的目標簡單粗暴,搞到世界上所有的書。2024年2月,Anthropic挖來了曾參與Google Books項目的Tom Turvey,交給他一個聽起來像反派臺詞的任務,獲取「世界上所有的書」。
怎么搞的呢?投入了大量資金,從二手書零售商和Strand這樣的實體書店,大量采購實體書。然后拉到倉庫里,切掉書脊進行破壞性高速掃描成PDF,剩下的紙質殘骸送去回收公司銷毀。
![]()
A社為什么敢這么干,不違法嗎?
Anthropic的法律論證部分依賴于「首次銷售原則」,你買了實體書,就有權對這個副本做任何處理,包括銷毀。再疊加「合理使用」的多因素判斷,合法取得副本、掃描后銷毀原件、數字文件僅內部使用不對外分發、且不替代原書市場——法官綜合評估了這幾條,最終認定構成合理使用。
法官整體傾向認為,這類模式具備較強的fair use抗辯基礎。相比直接去盜版網站扒書,法律風險確實低很多。
但 實際上,Anthropic也干了盜版的事。這事就復雜了。
巴拿馬項目之所以被曝光,是因為Anthropic同時被作家們起訴,他們早期就從LibGen(一個盜版電子書網站)下載了大量書籍用于訓練。CEO Dario Amodei管出版商的許可談判叫「法律/實踐/商業上的麻煩」,所以早期干脆用盜版。后來覺得風險太大,才轉頭搞了實體書破壞性掃描這套方案。
2025年,媒體曾報道Anthropic推進了一項規模約15億美元的和解方案,針對的是盜版數據集的集體訴訟。注意,這15億主要指向盜版那筆賬,不是為巴拿馬項目本身買單。這在AI版權領域被認為是金額最高的和解之一。
法官對「合法購買加掃描訓練」這個模式整體持支持態度,如果Anthropic從一開始就走這條路,他們的fair use抗辯會更有力。但先干盜版再轉正的做法,至少在道義和輿論上已經把自己的路子走窄了。當然話說回來,AI訓練的fair use在美國整體仍然沒有最終定論,Meta、OpenAI的案子都還在打,這個領域遠沒到蓋棺定論的時候。
真的和小說情節一毛一樣
這確實是最魔幻的部分。
Vernor Vinge在2006年寫的小說《The Rainbow's End》里,有一個名為Librareome Project的設定 :圖書館用破壞性掃描的方式數字化館藏,然后銷毀紙質書籍。
2026年,Anthropic在現實世界里做了高度相似的事。
科幻作家不是在預言未來,他只是在寫一個聽起來合理但又夠極端的故事。誰知道二十年后的AI公司看了一眼,覺得這是個好主意。
被夸張的部分
不過網上傳的那些說法,確實有不少需要糾正的。
第一,不是「珍稀古籍」。Anthropic采購的主要是流通量比較大的二手普通書籍,從大型零售商那里批量拿貨。不是孤本、善本,不是什么具有文物價值的東西。真正抗議的主要是作家和出版商協會,因為他們主張版權被侵犯,而不是文博界的文物保護單位——被銷毀的只是工業印刷品,不是不可再生的文化遺產。
第二,沒有「蒸餾了人類大部分知識庫」那么夸張。他們處理了幾百萬冊書沒錯,但人類歷史上出版的書籍以數十億計。幾百萬冊在這個量級面前,只是很小的一部分。更準確的說法是,他們獲取了一部分高質量文本用于訓練,不是把人類知識蒸餾了。
第三,做法雖然粗暴,但方向其實挺明確的。Anthropic的聯合創始人早在2023年就寫過,用書籍訓練模型能讓AI學會「如何寫得更好」,而不是去模仿那些質量參差不齊的網絡用語。這個動機本身沒什么問題,問題出在執行方式上。
Anthropic為了給AI喂書,雇人切書脊、高速掃描、然后銷毀。Claude學會寫那些漂亮句子的同時,上百萬本實體書變成了回收紙漿。
有用戶曾讓Claude評價這一事件,Claude給出過一段頗具文學性的回應:「這些銷毀行為幫助創造了能夠討論文學、幫人寫作、與人類知識對話的我,這層復雜性我還在消化當中。就像是用一座圖書館的灰燼建造起來的一樣。
這話說的,看起來確實像蒸餾了不少文學書籍。
但說真的,用灰燼堆積出來的智能,到底能在人類知識的廢墟上站多久,誰也不知道。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.