聽(tīng)雨 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI
上傳AI水論文,被查實(shí)者封禁一年
后續(xù)投稿須先通過(guò)同行評(píng)審,才有資格重新踏入arXiv。
這是arXiv計(jì)算機(jī)科學(xué)版塊主席Thomas Dietterich在X上剛剛公開的新規(guī),語(yǔ)氣干脆,不帶商量。
![]()
![]()
若論文中存在作者未核查L(zhǎng)LM生成內(nèi)容的確鑿證據(jù),所有署名作者一并受罰,沒(méi)有例外。
消息一出,陶哲軒也親自下場(chǎng)評(píng)論。
這位數(shù)學(xué)界最活躍的AI擁抱者,專門在Mathstodon發(fā)文,用自己此前提出的四條建議框架逐一對(duì)照新政,總結(jié)為一句話:
在生成論文比消化論文容易得多的時(shí)代,這個(gè)方向是對(duì)的。
![]()
網(wǎng)友則炸開了鍋,有人鼓掌,說(shuō)早就該這么干。
![]()
也有人反問(wèn):你會(huì)在2005年禁止用互聯(lián)網(wǎng)進(jìn)行研究的文章嗎?
![]()
還有人提出質(zhì)疑:這樣的連坐制度,是要求論文的每一位合著者都必須檢查每一條引用嗎?
![]()
arXiv最嚴(yán)新規(guī):簽名即擔(dān)責(zé)
物理、數(shù)學(xué)、計(jì)算機(jī)科學(xué)領(lǐng)域,絕大多數(shù)論文在進(jìn)入同行評(píng)審之前,都要先在arXiv掛出預(yù)印本。
它是全球?qū)W術(shù)流通最核心的基礎(chǔ)設(shè)施之一,正在推進(jìn)從康奈爾大學(xué)剝離、轉(zhuǎn)型獨(dú)立非營(yíng)利機(jī)構(gòu),有望獲得更多資源和動(dòng)力主動(dòng)出手治理。
arXiv這次出手,核心邏輯只有一句話:簽名即擔(dān)責(zé),無(wú)論內(nèi)容如何生成
Thomas Dietterich的原話是這樣的:
- 如果生成式AI工具產(chǎn)生了不當(dāng)語(yǔ)言、抄襲內(nèi)容、偏見(jiàn)內(nèi)容、錯(cuò)誤、錯(cuò)誤引用或誤導(dǎo)性內(nèi)容,且這些內(nèi)容被納入科學(xué)著作,責(zé)任由全體作者承擔(dān)。
我們最近對(duì)此類行為的懲罰標(biāo)準(zhǔn)進(jìn)行了明確。
注意,新政不是禁止用AI。用AI潤(rùn)色、用AI輔助查文獻(xiàn),都沒(méi)有問(wèn)題。
但arXiv卡的是另一條線:你有沒(méi)有認(rèn)真讀過(guò)自己署名的論文
什么算「確鑿證據(jù)」?Dietterich列了幾種典型情形。
幻覺(jué)引用,也就是引用了根本不存在的論文。
LLM元評(píng)論殘留,比如稿件里留著「這是一段200字摘要,是否需要修改?」之類的字樣。
占位符未填,比如表格里還寫著「請(qǐng)用實(shí)驗(yàn)真實(shí)數(shù)據(jù)填入此處」。
如果正式提交的論文里還存在這些低級(jí)錯(cuò)誤,只能說(shuō)明作者十分粗心,根本沒(méi)有認(rèn)真檢查自己的論文。
![]()
這樣的證據(jù)被抓到,也意味著論文中的其他內(nèi)容并不值得信任。
一旦被查實(shí),后果是被arXiv封禁一年,解封后的所有新投稿須先通過(guò)正規(guī)期刊同行評(píng)審才可上傳。
![]()
而且封號(hào)連坐,所有署名作者一起受罰。
Dietterich表示,這是個(gè)「一擊即止」的規(guī)定,但作者可以提出申訴。
內(nèi)部流程上也會(huì)先由版主記錄問(wèn)題,然后由分區(qū)主席確認(rèn)后才能實(shí)施處罰。
不得不說(shuō),arXiv這次雖然懲罰的都是低級(jí)錯(cuò)誤,但出手確實(shí)挺狠的。
陶哲軒附議:論文生成遠(yuǎn)比消化容易
新政太火,陶哲軒也聞?dòng)嵹s來(lái)建言獻(xiàn)策。
他在Mastodon上發(fā)了一組帖子回應(yīng)此事,用自己在一次演講中提出的四條建議作為框架,逐一對(duì)照arXiv新政。
![]()
這四條建議分別是:
1、在傳統(tǒng)工作流中明確并嚴(yán)格執(zhí)行AI輔助的許可邊界;
2、降低對(duì)「搶先發(fā)表」和「僅僅解決問(wèn)題」的強(qiáng)調(diào),轉(zhuǎn)而重視「消化成果」;
3、為重度使用AI的貢獻(xiàn)者設(shè)計(jì)新的挑戰(zhàn),使其仍然能產(chǎn)生真實(shí)學(xué)術(shù)價(jià)值;
4、無(wú)論傳統(tǒng)還是非傳統(tǒng)工作流,都要明確說(shuō)清項(xiàng)目目標(biāo)(包括顯性和隱性目標(biāo))及其背后的原因。
![]()
他的總體判斷是:新政與前兩條建議高度契合
arXiv這次劃定的責(zé)任邊界,正是建議一的落地,明確了什么叫「許可范圍內(nèi)的AI輔助」。
而整個(gè)新政背后的邏輯,對(duì)應(yīng)的正是建議二的核心主張。
他拋出了一個(gè)關(guān)鍵判斷:在這個(gè)時(shí)代,生成一篇論文遠(yuǎn)比消化一篇論文容易
任何將傳統(tǒng)科學(xué)機(jī)構(gòu)的平衡重新傾向于消化的努力,都是值得歡迎的。
![]()
至于建議三,陶哲軒認(rèn)為已經(jīng)有了自然出口。
viXra等平臺(tái)對(duì)AI輔助投稿幾乎不設(shè)限,可以作為未經(jīng)消化內(nèi)容的獨(dú)立存檔地。
但他的定性也很清楚:這類平臺(tái)專注于「生產(chǎn)」而非「消化」,不應(yīng)被納入正統(tǒng)學(xué)術(shù)引用鏈,不應(yīng)出現(xiàn)在arXiv或期刊的參考文獻(xiàn)里。
換句話說(shuō),想靠AI批量產(chǎn)出論文的人,有地方去,但別想進(jìn)正統(tǒng)學(xué)術(shù)體系。
不過(guò),有網(wǎng)友在帖子下留言指出,這個(gè)「出口」已經(jīng)堵死了。
viXra自己也禁止了AI生成論文,并另建了ai.viXra.org專門接收此類內(nèi)容。
![]()
建議四則指向了一個(gè)更根本的問(wèn)題:預(yù)印本平臺(tái)究竟為誰(shuí)服務(wù)?
陶哲軒的判斷是,作者和讀者的需求是共生的,必須同時(shí)照顧到。
他的原話是這樣的:
- 一個(gè)只服務(wù)于作者的平臺(tái)會(huì)被大量低質(zhì)量投稿填滿,而讀者并不愿意閱讀;一個(gè)只服務(wù)于讀者的平臺(tái)會(huì)勸退作者進(jìn)行繁瑣的投稿過(guò)程。
鑒于論文生成和理解之間出現(xiàn)了新的阻抗失配,質(zhì)量門檻現(xiàn)在必然要提高,但這最終對(duì)雙方都是有益的變化。
![]()
啥意思呢?
意思就是說(shuō),生成一篇論文的成本在急速下降,但消化一篇論文的成本并沒(méi)有改變。
兩端的落差越來(lái)越大,如果平臺(tái)不提高門檻,就只能眼睜睜看著讀者被淹沒(méi)在垃圾里。
但同時(shí),陶哲軒也點(diǎn)出了新政管不住的問(wèn)題。
「爭(zhēng)先為首」的文化是系統(tǒng)性病根,是整個(gè)學(xué)術(shù)評(píng)價(jià)體系造成的,arXiv單方面出手治不了根
從各方反饋來(lái)看,物理學(xué)界的問(wèn)題可能比數(shù)學(xué)界更嚴(yán)重。
AI論文泛濫有多嚴(yán)重
arXiv此次出手,是因?yàn)橛肁I寫論文已經(jīng)成為了普遍現(xiàn)象。
2025年發(fā)表于Nature Human Behaviour的一項(xiàng)研究示,計(jì)算機(jī)科學(xué)領(lǐng)域約五分之一的論文含有LLM修改的明顯痕跡,且ChatGPT發(fā)布后數(shù)月內(nèi)出現(xiàn)急劇攀升。
這還只是摘要,正文里的比例只會(huì)更高。
![]()
arXiv每個(gè)月收到的AI生成綜述論文,已達(dá)數(shù)百篇量級(jí)。
歷史上,綜述論文本是由領(lǐng)域內(nèi)資深學(xué)者撰寫的稀缺內(nèi)容。
現(xiàn)在,任何人用AI短時(shí)間內(nèi)就能生成一篇,批量投稿,讓志愿審稿人疲于奔命。
arXiv早在2025年10月就出過(guò)一記重拳,禁止計(jì)算機(jī)科學(xué)類未經(jīng)同行評(píng)審的綜述和立場(chǎng)論文直接上傳,要求先過(guò)期刊關(guān)。
![]()
此次封號(hào)政策,又是進(jìn)一步升級(jí)。
學(xué)術(shù)會(huì)議也沒(méi)能幸免。
2026年1月,AI檢測(cè)機(jī)構(gòu)GPTZero分析了NeurIPS 2025超過(guò)4000篇錄用論文,在至少53篇中發(fā)現(xiàn)了數(shù)百條AI幻覺(jué)引用,且這些論文全部通過(guò)了三位以上審稿人的評(píng)審。
![]()
此外,問(wèn)題也從論文蔓延到了考場(chǎng)。
普林斯頓大學(xué)最新宣布,廢除延續(xù)133年、允許學(xué)生無(wú)監(jiān)考參加考試的榮譽(yù)制度,從今年夏季起恢復(fù)現(xiàn)場(chǎng)監(jiān)考。
直接原因是,教務(wù)長(zhǎng)Michael Gordin來(lái)信,大量教授和學(xué)生反映「考試作弊已經(jīng)普遍化」。
![]()
如今,教授們將不得不監(jiān)考學(xué)生的考試,并報(bào)告任何違反學(xué)校學(xué)術(shù)誠(chéng)信政策的行為。
去年一項(xiàng)針對(duì)約500名普林斯頓高年級(jí)學(xué)生的調(diào)查數(shù)據(jù),觸目驚心:
超過(guò)27%的人承認(rèn)曾借助ChatGPT等AI模型作弊,約半數(shù)知悉有同學(xué)違反了榮譽(yù)準(zhǔn)則。
學(xué)生自己描述的作弊現(xiàn)場(chǎng)是:
「如果考試在筆記本上,隨時(shí)可以切到另一個(gè)窗口;如果是紙質(zhì)藍(lán)皮書,就躲在桌下用手機(jī)。」
133年的榮譽(yù)制度,信任學(xué)生,不設(shè)監(jiān)考。結(jié)果AI把這份信任直接擊穿了。
arXiv的封號(hào)令,和普林斯頓的監(jiān)考令,都有一個(gè)共同點(diǎn):
AI大幅壓低了「生產(chǎn)」的門檻,但也給了越來(lái)越多人偷懶和取巧的機(jī)會(huì)。
但這種偷懶和取巧,有著根本性損害。
當(dāng)AI開始水論文、開始替代學(xué)生作弊,人類科學(xué)和文明的黃昏似乎就要到來(lái)了。
AI的能力邊界,由它所消化的人類知識(shí)決定。水論文大量涌入訓(xùn)練數(shù)據(jù),AI學(xué)到的就是低質(zhì)量信息,然后生成更多水論文,再進(jìn)入下一輪訓(xùn)練。
這個(gè)循環(huán)一旦鎖死,那論文本身就不再是知識(shí)的載體,而成了信息的噪音。
發(fā)論文完全流為形式,AI輸入人類用AI水的論文,最后再輸出給更多人…
文明就被鎖死了。
科幻小說(shuō)《三體》里,外星文明為了阻止地球文明進(jìn)化,用智子鎖住了科學(xué)進(jìn)化的可能性。
而現(xiàn)在,如果AI水論文成為了普遍,何嘗不是人類自己鎖住了自己?
這是另一種智子,「這是人類的落日。」
[1]https://x.com/tdietterich/status/2055000956144935055
[2]https://mathstodon.xyz/@tao/116590271196962848
[3]https://futurism.com/future-society/princeton-shambles-ai-cheating
[4]https://www.404media.co/new-arxiv-rules-ai-generated-papers-ban/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.