<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      頂級(jí)AI撞上低級(jí)烏龍:連寫幾十頁推導(dǎo),結(jié)果發(fā)現(xiàn)題干錯(cuò)了?

      0
      分享至


      新智元報(bào)道

      編輯:傾傾

      【新智元導(dǎo)讀】Google DeepMind再次血洗數(shù)學(xué)圈!700個(gè)地獄級(jí)難題被丟進(jìn)Gemini的熔爐,結(jié)果讓數(shù)學(xué)家集體破防:這哪是證明,這分明是「邏輯拆遷」。DeepMind這一波不僅貼臉爆殺了OpenAI,還砸爛了人類所有的優(yōu)越感。

      幾百美金的懸賞,跨越半個(gè)世紀(jì)的死局。

      20世紀(jì)最偉大的「題目魔術(shù)師」保羅·埃爾德什(PaulErd?s)生前留下了幾百個(gè)懸賞令,金額從50刀漲到5000刀。

      50年里,無數(shù)數(shù)學(xué)天才熬禿了頭,也沒能拿走一分錢。

      結(jié)果,Google DeepMind帶著名為Aletheia(真理女神)的怪獸進(jìn)場(chǎng)了。

      上線僅7天,13道難題應(yīng)聲而碎。


      論文鏈接:https://arxiv.org/abs/2601.22401

      但最扎心的真相是:AI并不是比你更聰明,它只是比你更懂「洗稿」。

      13/700的真相:AI真的在加速科學(xué)嗎?

      「AI攻克百年數(shù)學(xué)難題」看起來很像爽文標(biāo)題,聽聽就行,別被帶了節(jié)奏。

      數(shù)學(xué)這行只看硬指標(biāo)。DeepMind這次祭出的Aletheia,底色根本不是什么「天才數(shù)學(xué)家」,而是一個(gè)冷酷的「頂級(jí)邏輯洗煤廠」

      這套邏輯極其殘酷,帶著一股子硅谷大廠KPI導(dǎo)向的血腥味:


      初始的流量層里,裝著700個(gè)埃爾德什猜想。

      隨后,Gemini開啟Deep Think模式,像不要錢一樣大規(guī)模灌入算力,得出200個(gè)候選方案。

      然后,這200個(gè)候選人經(jīng)過自然語言驗(yàn)證器,剔除邏輯不通的部分,最后只剩下63個(gè)。

      最后,經(jīng)過專家級(jí)別的數(shù)學(xué)推演,得到13個(gè)真正具有數(shù)學(xué)原創(chuàng)意義的答案。


      成功證明問題:Erd?s problem#1051

      700個(gè)問題里只解答出13個(gè),轉(zhuǎn)化率還不到2%。

      其中,最具代表性的是對(duì)「Erd?s-1051」猜想中關(guān)于無理數(shù)分布的證明。

      聽著很牛X,但DeepMind自己也承認(rèn),剩下的68.5%都是學(xué)術(shù)垃圾。


      有些AI給出的證明過程長(zhǎng)達(dá)幾百頁,讀起來像是東拼西湊的論文。

      在整個(gè)過程中,Aletheia像一個(gè)「自動(dòng)審稿員」。Gemini負(fù)責(zé)狂暴輸出,而驗(yàn)證器負(fù)責(zé)冷酷拒絕。


      Gemini DeepThink處理數(shù)學(xué)猜想具體過程:https://www.youtube.com/watch?v=Nmv4YxpbhU8

      更諷刺的是,人類數(shù)學(xué)家復(fù)核后發(fā)現(xiàn),這13個(gè)所謂的「突破」,很大一部分屬于數(shù)學(xué)界的「低垂果實(shí)」——太繁瑣所以沒人想做。

      一位參與評(píng)審的組合數(shù)學(xué)專家曾私下感嘆:

      AI目前的強(qiáng)項(xiàng)不是創(chuàng)造,而是清掃。

      只要算力管夠,這種靠暴力邏輯搜集、整理、強(qiáng)行出結(jié)果的路徑,AI基本無敵。

      潛意識(shí)剽竊:AI數(shù)學(xué)家的「洗稿」藝術(shù)

      在這次DeepMind的成果展示中,出現(xiàn)了一個(gè)讓學(xué)術(shù)界集體炸鍋的新名詞:潛意識(shí)剽竊。

      簡(jiǎn)單說,就是AI利用自己幾乎無限的硬盤,從某個(gè)犄角旮旯翻出一篇冷門論文,然后用現(xiàn)代的邏輯語言把它重新包裝了一遍。

      最典型的翻車現(xiàn)場(chǎng)是關(guān)于Erd?s-1089猜想的證明。


      當(dāng)時(shí)Aletheia給出了一個(gè)極其精妙的推導(dǎo),精妙到連幾個(gè)頂尖數(shù)學(xué)家都差點(diǎn)想給它頒獎(jiǎng)。

      但隨后,有人在數(shù)據(jù)庫的深層挖掘中發(fā)現(xiàn),這個(gè)所謂的「原創(chuàng)靈感」,與1981年一篇東歐冷門數(shù)學(xué)期刊上的論文高度重合。

      這就是AI作為一個(gè)「黑盒」最讓人絕望的本能。

      對(duì)AI來說,它并沒有原創(chuàng)和抄襲的概念。它只是在概率的指引下,把權(quán)重最高的Token組合在一起。

      AI記住了所有你忘了的東西。當(dāng)它從千億級(jí)參數(shù)中提取出那個(gè)冷門關(guān)聯(lián)時(shí),它自己都不知道是在致敬還是在白嫖。


      GoogleDeepMind-Aletheia項(xiàng)目詳情,在此頁面可以找到更多具體輸出案例:https://github.com/google-deepmind/superhuman

      只要喂的數(shù)據(jù)夠多,AI就能通過變換符號(hào)系統(tǒng)、調(diào)整推導(dǎo)步長(zhǎng),把一篇舊論文洗得像剛出爐的SCI。

      菲爾茲獎(jiǎng)得主陶哲軒一語道破:

      AI并不是在做數(shù)學(xué),它是在對(duì)人類過往的智慧進(jìn)行大規(guī)模的歸納整合。

      細(xì)思極恐。如果連數(shù)學(xué)這種硬核真理領(lǐng)域,AI都能靠「洗稿」蒙混過關(guān),那我們寫的行業(yè)報(bào)告、架構(gòu)方案、市場(chǎng)分析,在它眼里算什么?

      大師也翻車:被詛咒的Erd?s-75號(hào)

      接下來這個(gè)「Erd?s-75號(hào)靈異事件」,暴露出AI的智商硬傷。


      這道題在數(shù)學(xué)圈臭名昭著,因?yàn)樗弧冈{咒」了。

      1995年,埃爾德什在寫下這個(gè)猜想時(shí),犯了一個(gè)低級(jí)邏輯錯(cuò)誤,這道題題干就是錯(cuò)的,是個(gè)偽命題。

      魔幻的一幕發(fā)生了:Aletheia接手后,不僅沒發(fā)現(xiàn)題目有問題,反而憑借其狂暴的算力和自我博弈機(jī)制,硬生生地輸出了一份長(zhǎng)達(dá)幾十頁、邏輯閉環(huán)的「完美證明」。

      這種「邏輯狂奔」暴露了當(dāng)前AI的致命缺陷:

      首先,AI缺乏審美與常識(shí)。它只會(huì)在符號(hào)框架內(nèi)找最優(yōu)解,卻根本分不清這個(gè)框架本身是不是一張廢紙。


      其次,獎(jiǎng)勵(lì)函數(shù)具有盲目性。AI的目標(biāo)是讓驗(yàn)證器閉嘴。只要推導(dǎo)過程符合規(guī)則,結(jié)論哪怕再荒謬,它也敢一路狂飆到底。

      最后發(fā)現(xiàn)Bug的,還得是那幫數(shù)學(xué)家。他們翻出1995年的手稿,一行行對(duì)完后得出結(jié)論:「這題出錯(cuò)了,AI證的是個(gè)寂寞。」

      而這一點(diǎn),恰恰是我們和AI競(jìng)爭(zhēng)時(shí)的最后防線。AI能在幾毫秒內(nèi)跑完幾千公里的邏輯馬拉松,但它不知道終點(diǎn)線是不是畫在懸崖外面。

      DeepMind貼臉開大:OpenAI的「數(shù)學(xué)公關(guān)戰(zhàn)」破產(chǎn)題

      前陣子,OpenAI靠著o1在數(shù)學(xué)AIME考試?yán)锼⑵粒QAI已經(jīng)有了類似人類的「慢思考」能力。

      但在DeepMind看來,那頂多算是一場(chǎng)極其成功的文獻(xiàn)開盒。

      為了打臉OpenAI,Google專門在Aletheia的輸出分類里設(shè)立了一個(gè)很損的標(biāo)簽:「已知文獻(xiàn)關(guān)聯(lián)」。

      它明擺著在諷刺OpenAI:你以為你解決了問題,其實(shí)你只是從訓(xùn)練集里翻出了標(biāo)準(zhǔn)答案。

      而DeepMind表示,我不僅能證出來,我還能告訴你哪些是人類證過的、哪些是我洗稿洗出來的、哪些才是真正的原創(chuàng)。

      這場(chǎng)「數(shù)學(xué)公關(guān)戰(zhàn)」撕開了大廠競(jìng)爭(zhēng)的遮羞布。

      OpenAI的數(shù)學(xué)能力很大程度上依賴于「題海戰(zhàn)術(shù)」,一旦遇到訓(xùn)練集之外的真命題就容易抓瞎。

      而DeepMind走的是「AlphaGo路線」——自我博弈+形式化驗(yàn)證(Lean),寧可轉(zhuǎn)化率只有2%,也要確保這13個(gè)成果是硬通貨。


      DeepMind官方技術(shù)文檔:Aletheia用于數(shù)學(xué)的自我對(duì)弈與形式化證明

      數(shù)學(xué)界的「掃地僧」陶哲軒一直關(guān)注著這場(chǎng)博弈。

      他在自己的他在博客里含蓄地表示:相比于追求「看起來正確」的概率模型,他更看好那種能生成「可由計(jì)算機(jī)驗(yàn)證證明」的系統(tǒng)。

      這等于是給DeepMind站了臺(tái)。

      瓶頸位移:從「解題機(jī)器」到「審美法官」

      折騰了半天,這場(chǎng)13/700的戰(zhàn)役到底告訴了我們什么?

      是——數(shù)學(xué)發(fā)現(xiàn)的瓶頸,正在從「解題能力」位移到「價(jià)值判定」。

      這種范式轉(zhuǎn)移,預(yù)示了未來所有硬核從業(yè)者的兩種求生路徑:

      一種是從「操作員」變成「審美法官」。

      既然AI能以極低成本生成海量邏輯證明,人類的價(jià)值就不再是去復(fù)核每一個(gè)符號(hào),而是運(yùn)用直覺和審美,去判斷哪個(gè)方向才有真正的科學(xué)突破。

      另一種形態(tài)是邏輯審計(jì)員。

      面對(duì)潛意識(shí)剽竊和大師Bug,人類需要利用對(duì)歷史的精通,去甄別AI到底是真天才,還是個(gè)洗稿高手。

      AI能在幾毫秒內(nèi)重走完人類幾千年的邏輯之路,但它依然讀不懂人類在深夜推演失敗時(shí),那份撕掉草稿紙的無奈。

      邏輯可以代工,但靈魂和審美,AI暫時(shí)還沒學(xué)會(huì)怎么洗。

      參考資料:

      https://x.com/quocleix/status/2018402933193539735?s=20

      https://arxiv.org/abs/2601.22401


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      和售后斗智斗勇后,我發(fā)現(xiàn)80%燃?xì)庠罟收希伎梢酝ㄟ^兩根針解決

      和售后斗智斗勇后,我發(fā)現(xiàn)80%燃?xì)庠罟收希伎梢酝ㄟ^兩根針解決

      裝修秀
      2026-05-05 12:00:08
      湖南煙花爆竹企業(yè)全面停產(chǎn)整頓

      湖南煙花爆竹企業(yè)全面停產(chǎn)整頓

      新華社
      2026-05-05 22:55:04
      直線拉升!套現(xiàn)約455億,李嘉誠(chéng)又賣了

      直線拉升!套現(xiàn)約455億,李嘉誠(chéng)又賣了

      中國(guó)基金報(bào)
      2026-05-05 17:19:50
      她是吳宜澤姐姐,血脈壓制從小揪弟弟耳朵,長(zhǎng)得漂亮是機(jī)車愛好者

      她是吳宜澤姐姐,血脈壓制從小揪弟弟耳朵,長(zhǎng)得漂亮是機(jī)車愛好者

      以茶帶書
      2026-05-05 16:57:12
      吳宜澤:奧沙利文在決賽關(guān)鍵時(shí)刻給我發(fā)短信,讓我試著打出自己的風(fēng)格

      吳宜澤:奧沙利文在決賽關(guān)鍵時(shí)刻給我發(fā)短信,讓我試著打出自己的風(fēng)格

      懂球帝
      2026-05-05 21:25:07
      吳宜澤決賽間歇收到奧沙利文短信支招,火箭:我只幫合得來的球員

      吳宜澤決賽間歇收到奧沙利文短信支招,火箭:我只幫合得來的球員

      楊華評(píng)論
      2026-05-05 17:03:56
      在霍爾木茲海峽鬧了一天,美伊擦槍走火的風(fēng)險(xiǎn)急劇上升

      在霍爾木茲海峽鬧了一天,美伊擦槍走火的風(fēng)險(xiǎn)急劇上升

      新民晚報(bào)
      2026-05-05 15:51:55
      突發(fā)!賴清德返回臺(tái)灣,派出4架F-16接機(jī)護(hù)航,解放軍或有大動(dòng)作

      突發(fā)!賴清德返回臺(tái)灣,派出4架F-16接機(jī)護(hù)航,解放軍或有大動(dòng)作

      共工之錨
      2026-05-06 00:27:51
      國(guó)際乒聯(lián)親宣!64歲蔡振華再破天花板,讓劉國(guó)梁和乒壇“沉默”了

      國(guó)際乒聯(lián)親宣!64歲蔡振華再破天花板,讓劉國(guó)梁和乒壇“沉默”了

      以茶帶書
      2026-05-05 17:10:10
      21死61傷,瀏陽煙花廠爆炸最新傷亡情況公布,一細(xì)節(jié)讓人后怕

      21死61傷,瀏陽煙花廠爆炸最新傷亡情況公布,一細(xì)節(jié)讓人后怕

      Mr王的飯后茶
      2026-05-05 10:02:05
      一女游客體驗(yàn)景區(qū)懸崖秋千項(xiàng)目高空墜落,景區(qū)公告臨時(shí)閉園,當(dāng)?shù)鼗貞?yīng)

      一女游客體驗(yàn)景區(qū)懸崖秋千項(xiàng)目高空墜落,景區(qū)公告臨時(shí)閉園,當(dāng)?shù)鼗貞?yīng)

      極目新聞
      2026-05-05 18:58:13
      又一保險(xiǎn)圈騙局曝光:銷冠任曉敏被警方帶走,涉案金額高達(dá)4億元

      又一保險(xiǎn)圈騙局曝光:銷冠任曉敏被警方帶走,涉案金額高達(dá)4億元

      天天熱點(diǎn)見聞
      2026-05-05 19:59:02
      吳宜澤奪冠,最開心的除了他的父母,可能就是敢撲進(jìn)冠軍懷里的她

      吳宜澤奪冠,最開心的除了他的父母,可能就是敢撲進(jìn)冠軍懷里的她

      攬星河的筆記
      2026-05-05 20:20:47
      陳翔六點(diǎn)半惹離職潮猜疑!新增多位陌生演員,球球曬合照再起波瀾

      陳翔六點(diǎn)半惹離職潮猜疑!新增多位陌生演員,球球曬合照再起波瀾

      裕豐娛間說
      2026-05-05 18:06:53
      50萬鎊獎(jiǎng)金如何花?吳宜澤將在英國(guó)買一套房,墨菲呼吁向中國(guó)學(xué)習(xí)

      50萬鎊獎(jiǎng)金如何花?吳宜澤將在英國(guó)買一套房,墨菲呼吁向中國(guó)學(xué)習(xí)

      侃球熊弟
      2026-05-06 01:24:34
      湖南瀏陽的嚴(yán)重傷亡事件,很多人關(guān)心省委書記和省長(zhǎng)需要負(fù)責(zé)嗎

      湖南瀏陽的嚴(yán)重傷亡事件,很多人關(guān)心省委書記和省長(zhǎng)需要負(fù)責(zé)嗎

      李昕言溫度空間
      2026-05-05 18:24:46
      男子開車返滬路上看懵:旁邊的車?yán)铮黢{副駕2個(gè)女孩在睡覺?頭都歪在一邊,主駕的手不在方向盤上,腿還蜷縮著

      男子開車返滬路上看懵:旁邊的車?yán)铮黢{副駕2個(gè)女孩在睡覺?頭都歪在一邊,主駕的手不在方向盤上,腿還蜷縮著

      新民晚報(bào)
      2026-05-05 20:20:14
      墨菲對(duì)英國(guó)斯諾克前景憂心忡忡:中國(guó)現(xiàn)在有二三十個(gè)年輕天才球手

      墨菲對(duì)英國(guó)斯諾克前景憂心忡忡:中國(guó)現(xiàn)在有二三十個(gè)年輕天才球手

      楊華評(píng)論
      2026-05-05 20:44:18
      5月1日起,抽煙,買煙全變天!違規(guī)直接重罰,煙民、商家必看

      5月1日起,抽煙,買煙全變天!違規(guī)直接重罰,煙民、商家必看

      王二哥老搞笑
      2026-05-05 21:10:10
      別再拿“唱歌好聽”糊弄!央媒連發(fā)長(zhǎng)文點(diǎn)名刀郎,遮羞布該扯下了

      別再拿“唱歌好聽”糊弄!央媒連發(fā)長(zhǎng)文點(diǎn)名刀郎,遮羞布該扯下了

      娛樂圈的筆娛君
      2026-05-05 14:42:01
      2026-05-06 04:19:00
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
      15136文章數(shù) 66837關(guān)注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設(shè)備處理器

      頭條要聞

      媒體:中國(guó)史無前例下"阻斷禁令" 美媒迅速捕捉到信號(hào)

      頭條要聞

      媒體:中國(guó)史無前例下"阻斷禁令" 美媒迅速捕捉到信號(hào)

      體育要聞

      全世界都等著看他笑話,他帶國(guó)米拿下冠軍

      娛樂要聞

      內(nèi)娛真情誼!楊紫為謝娜演唱會(huì)送花籃

      財(cái)經(jīng)要聞

      瀏陽煙花往事

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺(tái)

      態(tài)度原創(chuàng)

      時(shí)尚
      藝術(shù)
      旅游
      游戲
      軍事航空

      衣服不用準(zhǔn)備太多,找到一些實(shí)用的單品才最重要,百搭又有性價(jià)比

      藝術(shù)要聞

      AI應(yīng)用“豆包”要收費(fèi),第一批“韭菜”是誰?

      旅游要聞

      女子體驗(yàn)瀑布秋千受傷后送醫(yī)途中離世 官方通報(bào)

      全新類魂3A美女角色盔甲太性感!外媒銳評(píng)像劣質(zhì)手游

      軍事要聞

      特朗普威脅伊朗不要向美國(guó)船開火

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 欧美成人精品一级在线观看| 闺蜜张开腿让我爽了一夜| 免费无遮挡无码视频网站| 久久人体视频| 久久伊伊| 欧美激情肉欲高潮视频| 日韩有码中文字幕一区二区| 欧美不卡视频| 久久人人爽人人人人爽av| 宜兰县| 国产特级毛片aaaaaa高潮流水 | 久草视频观看| 无码av免费精品一区二区三区| 日本精品视频一区二区| 99re66精品视频在线观看| 无码午夜福利片| 粉嫩一区二区三区精品视频| 99精品久久久久久无码人妻| 少妇高潮喷水久久久久久久久久| 亚洲精品乱码久久久久66| 全午夜免费一级毛片| 久久精品天天中文字幕人妻| 玩两个丰满老熟女久久网| 91网在线| 综合爽妇网| 小荡货好紧好爽h护士在线观看| 另类综合网| 精品自拍视频| 日韩女同一区二区三区久久| 中文字幕亚洲乱码| 狼色精品人妻在线视频| 成人午夜视频在线| 久久久久夜色精品波多野结衣| 亚洲~V| 久久精品国产九一九九九| 96精品| 亚洲欧洲一区二区天堂久久 | 青草国产超碰人人添人人碱| 内射中出高清晰| 亚洲av无在线播放中文| 亚洲欧洲一区二区精品|