網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

AI水論文封一年，署名連坐！arXiv最嚴(yán)新規(guī)來(lái)了，陶哲軒附議

2026-05-18 20:15:13　來(lái)源: 量子位

北京舉報(bào)

分享至

聽(tīng)雨發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI

上傳AI水論文，被查實(shí)者封禁一年

后續(xù)投稿須先通過(guò)同行評(píng)審，才有資格重新踏入arXiv。

這是arXiv計(jì)算機(jī)科學(xué)版塊主席Thomas Dietterich在X上剛剛公開的新規(guī)，語(yǔ)氣干脆，不帶商量。

若論文中存在作者未核查L(zhǎng)LM生成內(nèi)容的確鑿證據(jù)，所有署名作者一并受罰，沒(méi)有例外。

消息一出，陶哲軒也親自下場(chǎng)評(píng)論。

這位數(shù)學(xué)界最活躍的AI擁抱者，專門在Mathstodon發(fā)文，用自己此前提出的四條建議框架逐一對(duì)照新政，總結(jié)為一句話：

在生成論文比消化論文容易得多的時(shí)代，這個(gè)方向是對(duì)的。

網(wǎng)友則炸開了鍋，有人鼓掌，說(shuō)早就該這么干。

也有人反問(wèn)：你會(huì)在2005年禁止用互聯(lián)網(wǎng)進(jìn)行研究的文章嗎？

還有人提出質(zhì)疑：這樣的連坐制度，是要求論文的每一位合著者都必須檢查每一條引用嗎？

arXiv最嚴(yán)新規(guī)：簽名即擔(dān)責(zé)

物理、數(shù)學(xué)、計(jì)算機(jī)科學(xué)領(lǐng)域，絕大多數(shù)論文在進(jìn)入同行評(píng)審之前，都要先在arXiv掛出預(yù)印本。

它是全球?qū)W術(shù)流通最核心的基礎(chǔ)設(shè)施之一，正在推進(jìn)從康奈爾大學(xué)剝離、轉(zhuǎn)型獨(dú)立非營(yíng)利機(jī)構(gòu)，有望獲得更多資源和動(dòng)力主動(dòng)出手治理。

arXiv這次出手，核心邏輯只有一句話：簽名即擔(dān)責(zé)，無(wú)論內(nèi)容如何生成

Thomas Dietterich的原話是這樣的：

如果生成式AI工具產(chǎn)生了不當(dāng)語(yǔ)言、抄襲內(nèi)容、偏見(jiàn)內(nèi)容、錯(cuò)誤、錯(cuò)誤引用或誤導(dǎo)性內(nèi)容，且這些內(nèi)容被納入科學(xué)著作，責(zé)任由全體作者承擔(dān)。
我們最近對(duì)此類行為的懲罰標(biāo)準(zhǔn)進(jìn)行了明確。

注意，新政不是禁止用AI。用AI潤(rùn)色、用AI輔助查文獻(xiàn)，都沒(méi)有問(wèn)題。

但arXiv卡的是另一條線：你有沒(méi)有認(rèn)真讀過(guò)自己署名的論文

什么算「確鑿證據(jù)」？Dietterich列了幾種典型情形。

幻覺(jué)引用，也就是引用了根本不存在的論文。

LLM元評(píng)論殘留，比如稿件里留著「這是一段200字摘要，是否需要修改？」之類的字樣。

占位符未填，比如表格里還寫著「請(qǐng)用實(shí)驗(yàn)真實(shí)數(shù)據(jù)填入此處」。

如果正式提交的論文里還存在這些低級(jí)錯(cuò)誤，只能說(shuō)明作者十分粗心，根本沒(méi)有認(rèn)真檢查自己的論文。

這樣的證據(jù)被抓到，也意味著論文中的其他內(nèi)容并不值得信任。

一旦被查實(shí)，后果是被arXiv封禁一年，解封后的所有新投稿須先通過(guò)正規(guī)期刊同行評(píng)審才可上傳。

而且封號(hào)連坐，所有署名作者一起受罰。

Dietterich表示，這是個(gè)「一擊即止」的規(guī)定，但作者可以提出申訴。

內(nèi)部流程上也會(huì)先由版主記錄問(wèn)題，然后由分區(qū)主席確認(rèn)后才能實(shí)施處罰。

不得不說(shuō)，arXiv這次雖然懲罰的都是低級(jí)錯(cuò)誤，但出手確實(shí)挺狠的。

陶哲軒附議：論文生成遠(yuǎn)比消化容易

新政太火，陶哲軒也聞?dòng)嵹s來(lái)建言獻(xiàn)策。

他在Mastodon上發(fā)了一組帖子回應(yīng)此事，用自己在一次演講中提出的四條建議作為框架，逐一對(duì)照arXiv新政。

這四條建議分別是：

1、在傳統(tǒng)工作流中明確并嚴(yán)格執(zhí)行AI輔助的許可邊界；

2、降低對(duì)「搶先發(fā)表」和「僅僅解決問(wèn)題」的強(qiáng)調(diào)，轉(zhuǎn)而重視「消化成果」；

3、為重度使用AI的貢獻(xiàn)者設(shè)計(jì)新的挑戰(zhàn)，使其仍然能產(chǎn)生真實(shí)學(xué)術(shù)價(jià)值；

4、無(wú)論傳統(tǒng)還是非傳統(tǒng)工作流，都要明確說(shuō)清項(xiàng)目目標(biāo)（包括顯性和隱性目標(biāo)）及其背后的原因。

他的總體判斷是：新政與前兩條建議高度契合

arXiv這次劃定的責(zé)任邊界，正是建議一的落地，明確了什么叫「許可范圍內(nèi)的AI輔助」。

而整個(gè)新政背后的邏輯，對(duì)應(yīng)的正是建議二的核心主張。

他拋出了一個(gè)關(guān)鍵判斷：在這個(gè)時(shí)代，生成一篇論文遠(yuǎn)比消化一篇論文容易

任何將傳統(tǒng)科學(xué)機(jī)構(gòu)的平衡重新傾向于消化的努力，都是值得歡迎的。

至于建議三，陶哲軒認(rèn)為已經(jīng)有了自然出口。

viXra等平臺(tái)對(duì)AI輔助投稿幾乎不設(shè)限，可以作為未經(jīng)消化內(nèi)容的獨(dú)立存檔地。

但他的定性也很清楚：這類平臺(tái)專注于「生產(chǎn)」而非「消化」，不應(yīng)被納入正統(tǒng)學(xué)術(shù)引用鏈，不應(yīng)出現(xiàn)在arXiv或期刊的參考文獻(xiàn)里。

換句話說(shuō)，想靠AI批量產(chǎn)出論文的人，有地方去，但別想進(jìn)正統(tǒng)學(xué)術(shù)體系。

不過(guò)，有網(wǎng)友在帖子下留言指出，這個(gè)「出口」已經(jīng)堵死了。

viXra自己也禁止了AI生成論文，并另建了ai.viXra.org專門接收此類內(nèi)容。

建議四則指向了一個(gè)更根本的問(wèn)題：預(yù)印本平臺(tái)究竟為誰(shuí)服務(wù)？

陶哲軒的判斷是，作者和讀者的需求是共生的，必須同時(shí)照顧到。

他的原話是這樣的：

一個(gè)只服務(wù)于作者的平臺(tái)會(huì)被大量低質(zhì)量投稿填滿，而讀者并不愿意閱讀；一個(gè)只服務(wù)于讀者的平臺(tái)會(huì)勸退作者進(jìn)行繁瑣的投稿過(guò)程。
鑒于論文生成和理解之間出現(xiàn)了新的阻抗失配，質(zhì)量門檻現(xiàn)在必然要提高，但這最終對(duì)雙方都是有益的變化。

啥意思呢？

意思就是說(shuō)，生成一篇論文的成本在急速下降，但消化一篇論文的成本并沒(méi)有改變。

兩端的落差越來(lái)越大，如果平臺(tái)不提高門檻，就只能眼睜睜看著讀者被淹沒(méi)在垃圾里。

但同時(shí)，陶哲軒也點(diǎn)出了新政管不住的問(wèn)題。

「爭(zhēng)先為首」的文化是系統(tǒng)性病根，是整個(gè)學(xué)術(shù)評(píng)價(jià)體系造成的，arXiv單方面出手治不了根

從各方反饋來(lái)看，物理學(xué)界的問(wèn)題可能比數(shù)學(xué)界更嚴(yán)重。

AI論文泛濫有多嚴(yán)重

arXiv此次出手，是因?yàn)橛肁I寫論文已經(jīng)成為了普遍現(xiàn)象。

2025年發(fā)表于Nature Human Behaviour的一項(xiàng)研究示，計(jì)算機(jī)科學(xué)領(lǐng)域約五分之一的論文含有LLM修改的明顯痕跡，且ChatGPT發(fā)布后數(shù)月內(nèi)出現(xiàn)急劇攀升。

這還只是摘要，正文里的比例只會(huì)更高。

arXiv每個(gè)月收到的AI生成綜述論文，已達(dá)數(shù)百篇量級(jí)。

歷史上，綜述論文本是由領(lǐng)域內(nèi)資深學(xué)者撰寫的稀缺內(nèi)容。

現(xiàn)在，任何人用AI短時(shí)間內(nèi)就能生成一篇，批量投稿，讓志愿審稿人疲于奔命。

arXiv早在2025年10月就出過(guò)一記重拳，禁止計(jì)算機(jī)科學(xué)類未經(jīng)同行評(píng)審的綜述和立場(chǎng)論文直接上傳，要求先過(guò)期刊關(guān)。

此次封號(hào)政策，又是進(jìn)一步升級(jí)。

學(xué)術(shù)會(huì)議也沒(méi)能幸免。

2026年1月，AI檢測(cè)機(jī)構(gòu)GPTZero分析了NeurIPS 2025超過(guò)4000篇錄用論文，在至少53篇中發(fā)現(xiàn)了數(shù)百條AI幻覺(jué)引用，且這些論文全部通過(guò)了三位以上審稿人的評(píng)審。

此外，問(wèn)題也從論文蔓延到了考場(chǎng)。

普林斯頓大學(xué)最新宣布，廢除延續(xù)133年、允許學(xué)生無(wú)監(jiān)考參加考試的榮譽(yù)制度，從今年夏季起恢復(fù)現(xiàn)場(chǎng)監(jiān)考。

直接原因是，教務(wù)長(zhǎng)Michael Gordin來(lái)信，大量教授和學(xué)生反映「考試作弊已經(jīng)普遍化」。

如今，教授們將不得不監(jiān)考學(xué)生的考試，并報(bào)告任何違反學(xué)校學(xué)術(shù)誠(chéng)信政策的行為。

去年一項(xiàng)針對(duì)約500名普林斯頓高年級(jí)學(xué)生的調(diào)查數(shù)據(jù)，觸目驚心：

超過(guò)27%的人承認(rèn)曾借助ChatGPT等AI模型作弊，約半數(shù)知悉有同學(xué)違反了榮譽(yù)準(zhǔn)則。

學(xué)生自己描述的作弊現(xiàn)場(chǎng)是：

「如果考試在筆記本上，隨時(shí)可以切到另一個(gè)窗口；如果是紙質(zhì)藍(lán)皮書，就躲在桌下用手機(jī)。」

133年的榮譽(yù)制度，信任學(xué)生，不設(shè)監(jiān)考。結(jié)果AI把這份信任直接擊穿了。

arXiv的封號(hào)令，和普林斯頓的監(jiān)考令，都有一個(gè)共同點(diǎn)：

AI大幅壓低了「生產(chǎn)」的門檻，但也給了越來(lái)越多人偷懶和取巧的機(jī)會(huì)。

但這種偷懶和取巧，有著根本性損害。

當(dāng)AI開始水論文、開始替代學(xué)生作弊，人類科學(xué)和文明的黃昏似乎就要到來(lái)了。

AI的能力邊界，由它所消化的人類知識(shí)決定。水論文大量涌入訓(xùn)練數(shù)據(jù)，AI學(xué)到的就是低質(zhì)量信息，然后生成更多水論文，再進(jìn)入下一輪訓(xùn)練。

這個(gè)循環(huán)一旦鎖死，那論文本身就不再是知識(shí)的載體，而成了信息的噪音。

發(fā)論文完全流為形式，AI輸入人類用AI水的論文，最后再輸出給更多人…

文明就被鎖死了。

科幻小說(shuō)《三體》里，外星文明為了阻止地球文明進(jìn)化，用智子鎖住了科學(xué)進(jìn)化的可能性。

而現(xiàn)在，如果AI水論文成為了普遍，何嘗不是人類自己鎖住了自己？

這是另一種智子，「這是人類的落日。」

[1]https://x.com/tdietterich/status/2055000956144935055
[2]https://mathstodon.xyz/@tao/116590271196962848
[3]https://futurism.com/future-society/princeton-shambles-ai-cheating
[4]https://www.404media.co/new-arxiv-rules-ai-generated-papers-ban/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.