<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      菲爾茲獎得主用AI解出博士級數學題,然后他開始為博士生們發愁了

      0
      分享至

      今天,劍橋大學數學教授、菲爾茲獎得主 Timothy Gowers 的一個帖子吸引了很多關注。

      他在帖子里說,自己最近也加入了用 AI 解決數學開放問題的行列。他把 Melvyn Nathanson 提出的一些問題輸入給了 GPT-5.5 Pro,結果模型給出了答案。


      更重要的是,在 Gowers 看來,GPT-5.5 Pro 給出的結果完全可以作為一篇博士論文的合理章節。整個過程只花了幾個小時,而且 Gowers 提供的提示幾乎沒有任何數學內容。


      Gowers 指出,這件事引發了一系列關于數學研究未來的深刻問題,尤其是對博士生的影響最為緊迫。他在博客中分享了一些思考,但坦言自己并沒有完整的答案。不過,如果 AI 在數學上的進步繼續以當前速度發展 —— 他預計會如此 —— 那么數學界很快就會面臨一場危機。數學系有責任照顧自己的學生,應該緊急為此做好準備。


      這個帖子迅速引發熱議,大家討論的焦點是 AI 是否會徹底改變數學研究范式、博士培養模式,以及人類數學家未來的角色。

      GPT-5.5 Pro 解決了什么問題?

      我們首先看看這篇博客寫了什么。


      Gowers 在博客開頭坦言,他對大型語言模型數學能力的評估,已經被迫一次次向上修正。而這一次,是幅度最大的一次。

      事情的起因很簡單。數學家 Melvyn Nathanson 曾在一篇論文中提出了一批關于整數集合的開放問題 —— 簡單來說,這些問題都在探討:當你把一組整數以某種方式相加時,結果的集合會有多大、形態如何?這類問題在數學上屬于「加法數論」的范疇。Nathanson 本人以眼光獨到著稱,他關注的問題往往會在數年后變得極為熱門。

      Gowers 選了其中幾個,輸入給 GPT-5.5 Pro,然后等待。

      模型思考了約 17 分鐘,給出了一個構造方案,解決了其中一個關于集合「跨度」的問題,并將前人結果中一個指數級的界改進為多項式級 —— 在數學上,這意味著從「幾乎不可用」變為「接近最優」。Gowers 隨后讓模型把論證整理成一篇標準數學預印本的格式,模型又花了兩分多鐘完成。

      接下來,Gowers 把問題推向了更深處。他將一位 MIT 學生 Isaac Rajagopal 此前發表的研究成果告訴模型,并問它能否在此基礎上進一步改進。GPT-5.5 Pro 再次給出了肯定的回答:它不僅改進了 Rajagopal 的結果,還在關鍵步驟中引入了一個此前從未有人用過的數學構造思路。

      Rajagopal 本人看過之后,評價這個想法「相當聰明,完全原創」,并補充說,這是他自己「可能需要苦思一兩周才能想到的東西」。整個過程,GPT-5.5 Pro 用了不到兩個小時。

      Gowers 強調,在這整個過程中,他自己幾乎沒有提供任何實質性的數學引導 —— 他只是在問問題,而不是在給答案。

      這件事意味著什么?

      Gowers 在博客中花了相當篇幅討論這件事的意義,語氣坦率,甚至有些沉重。

      首先是一個懸而未決的實際問題:這個結果該怎么處理?

      如果是人類數學家得出同樣的結論,它毫無疑問可以發表在學術期刊上。但現在,沒有人需要署名,也沒有人需要「credit」。Gowers 提到,arXiv 目前不接受 AI 生成的內容,而投遞期刊似乎也沒有意義。他的建議是,或許應該建立一個專門收錄 AI 產出數學結果的平臺,并由人類數學家負責核實其正確性 —— 但具體怎么做,他也沒有答案。

      更深的問題,是關于博士培養的。

      長期以來,數學導師幫助學生「入門」的一個常見方式,是給他們找一些看起來有希望、難度適中的開放問題 —— 不太簡單,但也不至于讓人絕望。解決這樣一個問題,能給新生研究者帶來巨大的信心,證明自己有能力做真正的數學研究。

      但現在,這條路幾乎被堵死了。如果 AI 能在幾小時內解決「難度適中」的開放問題,那這類問題就不再適合用來訓練人類新手了。Gowers 的判斷是:數學研究的門檻,已經悄悄抬高了一截。

      他同時也給出了兩點保留意見,試圖避免過于悲觀。

      其一,博士生本身也可以使用 AI。未來的數學研究,或許不再是「人類能否獨立證明 AI 證不了的東西」,而是「人類能否借助 AI,共同解決任何一方單獨都無法解決的問題」。Gowers 自己近期也在做這樣的嘗試,他發現 AI 確實能提供有價值的貢獻,盡管還沒有出現真正「改變游戲規則」的時刻。

      其二,這一切是否適用于所有數學分支,他并不確定。組合數學(也就是這次涉及的領域)以「問題導向」為主,AI 擅長從一個具體問題出發,向前或向后推理。但在另一些數學領域,研究更像是「從一組想法出發,看看能走到哪里」—— 這需要判斷哪些觀察有趣、哪些方向值得追究,而這種審美式的判斷力,AI 是否具備,目前仍是未知數。

      那么,做數學研究還有意義嗎?

      對于那些正在考慮攻讀數學博士的人,Gowers 給出了一個誠實但并不令人完全安心的回答。

      他認為,「通過解決難題讓自己的名字永遠與某個定理聯系在一起」的時代,可能已經接近尾聲 —— 不只是對普通研究者,對所有人都如此。他舉了一個思想實驗:如果一位數學家與 AI 長時間合作,AI 完成了所有技術工作并貢獻了核心想法,這位數學家只是起到了引導和提問的作用 —— 我們會把這看作這位數學家的重大成就嗎?Gowers 的回答是:不會。

      但他并不認為鉆研數學因此變得毫無價值。恰恰相反,他的判斷是:那些自己真正解決過難題的人,將在與 AI 協作時展現出明顯的優勢 —— 就像真正懂編程的人比不懂的人更擅長使用 AI 寫代碼,真正懂算術的人更容易發現計算器給出的答案是否有問題。數學訓練所帶來的思維能力,是高度可遷移的。

      「你可能不會得到與上一代研究者相同的回報,」他寫道,「但你很有可能因此為即將到來的世界做好充分準備。」

      最后,他以一句話結尾,語氣平靜,但分量不輕:「一個從明年開始讀博的學生,最早也要到 2029 年才能畢業。我的判斷是,到那時,從事數學研究意味著什么,將已經發生了難以辨認的變化。」

      DeepMind:為人機協作的數學時代做好準備

      正如 Gowers 所說,未來的數學研究必然是人與 AI 的有效協作。那這種協作如何進行?谷歌 DeepMind 剛剛發布的一項研究給出了一個框架。

      5 月 7 日,DeepMind 發布了一篇題為「AI Co-Mathematician: Accelerating Mathematicians with Agentic AI」的論文,介紹了他們專門為數學研究設計的一套智能體工作臺。它想解答的核心問題是:如果 AI 做數學已經是既成事實,那我們該怎么把它做成一套系統?


      論文鏈接:https://arxiv.org/pdf/2605.06651v1

      論文首先指出了一個常被忽視的事實:數學研究發表出來的,幾乎全是打磨精良的嚴格證明,但數學家的日常工作早已被廣泛認識到包含大量隱藏在幕后的活動。在最終的形式化結論之下,是一個深度探索的過程:初始直覺被檢驗,反例被發現,核心定義和證明經歷一輪又一輪的否定與修正。簡單說,論文里看到的數學,和數學家實際經歷的數學,是兩回事。

      那 AI 在這方面做得怎么樣?DeepMind 給出的判斷是:局部很強,整體缺位。近年來,AI 已經沿著幾條路徑快速滲透進數學領域:有專門做自主推理的系統,有通過反復進化搜索發現新算法和新結構的系統,有深度整合進數學證明驗證流程的系統,還有直接內置在聊天界面里、讓普通數學家隨手就能調用的強大推理模型。這些工具各有所長,但 DeepMind 認為,它們拼在一起仍然缺少一塊。

      這塊缺失的,是一套真正貼合數學家日常工作方式的協作流程。數學家的日常,很少是一次次孤立的提問和解答。更多時候,他們在處理不確定性,在散落各處的文獻里尋找線索,反復起草和修改半成品,并在數天乃至數周里追蹤一條不斷分叉、隨時可能走進死胡同的思路鏈。但現有的 AI 工具對此幾乎無能為力 —— 聊天窗口關掉就失憶,專門的推理引擎又只管自己那一畝三分地。研究者不得不親自充當「粘合劑」,手動把對話記錄、證明工具和計算腳本串聯起來。

      DeepMind 在論文中把這個局面和程序員的處境做了對比。程序員已經有了 Claude Code、OpenAI Codex 這樣的 AI 編程助手,之所以好用,是因為軟件工程本身就有一套現成的協作范式:需求文檔讓智能體可以長時間自主工作而不偏軌,自動化測試隨時驗證結果,版本控制完整記錄項目的每一步演變。而數學家的日常工作中,幾乎沒有任何類似的流程被自動化。數學家還在刀耕火種,程序員已經有了流水線。

      AI Co-Mathematician 想做的,正是給數學補上這套基礎設施。它基于最新的 Gemini 模型,提供一個持續運轉的項目空間。在這個空間里,一個總協調智能體負責把復雜任務拆解、分派給多條同時推進的工作流,數學家可以隨時介入、調整方向,而不必守在旁邊等系統把所有事情跑完再說。

      更重要的是它的定位野心。這套系統并不打算取代現有的各類 AI 數學工具,而是為它們提供一個統一的「調度層」—— 讓 AlphaProof、AlphaEvolve 這些各有專長的引擎,都能在數學家主導的研究流程中被按需調用。

      這套系統具體是怎么工作的?

      論文里有一個具體的演示案例,讀起來很直觀。


      一位數學家想研究一個幾何開放問題,于是打開 AI Co-Mathematician,上傳了一篇相關論文,輸入了一句話,大體意思是:我想看看能不能證明這篇論文里某個變體問題的上界。

      普通的聊天 AI 收到這句話,多半會立刻開始「解題」。但這套系統沒有。總協調智能體先開啟了一段對話,扮演「討論伙伴」的角色,追問道:經典問題的下界已經被證明是精確的,但另外兩個變體的上界仍然懸而未決 —— 你想聚焦其中一個,還是兩個都做?你是想證明某個特定的下界是精確的,還是只要建立任何一個嚴格的上界就夠?

      這個細節,代表了整套系統背后的一個核心判斷:在數學研究里,把問題問對,比解決問題更重要。系統不急著給答案,而是先幫數學家想清楚自己究竟在問什么。

      問題確認之后,系統才開始分頭行動 —— 文獻梳理、構建計算框架、執行搜索,三條工作流同時推進。在這個過程中,數學家不需要盯著屏幕等結果,可以隨時通過對話界面介入、調整方向。這種協作也是雙向的:如果某條工作流陷入僵局,系統會主動向數學家發出警報,明確說明卡在了哪里,并請求人類的幫助。



      論文還特別提到了一個設計細節,乍看不起眼,但其實頗為關鍵:系統會完整保留所有走不通的路徑,而不是悄悄清除、重新開始。它把每一次失敗的探索都作為項目歷史的一部分永久保存,供人類和 AI 共同參考,以便從失敗出發制定新的策略。這背后的邏輯很樸素:在數學研究里,知道哪條路是死路,本身就是一種知識。

      此外,系統對 AI 的局限性保持著相當的警惕。數學研究要求極高的嚴謹性,一個有缺陷的引理或一個捏造的文獻引用,足以動搖整篇論文。系統的架構被設計為圍繞「不確定性」來運轉:追蹤每一個論斷如何演變或被質疑,通過持續的審查、數值模擬和文獻核查來驗證結論,并在工作文件中以高亮和批注的形式,向數學家明確標出哪些地方尚存爭議、需要人工核實。

      在早期測試中,這套系統已經幫助研究者解決了一些開放問題,找到了新的研究方向,并發現了一些被忽視的文獻線索。在硬性基準測試上,它在 FrontierMath Tier 4—— 一個專門針對前沿數學難題設計的高難度測試集 —— 上達到了 48% 的得分,是目前所有 AI 系統中的最高分。

      當然,這套系統目前仍處于小范圍發布階段,距離大規模投入使用還有一段距離。但它所代表的方向已經足夠清晰:AI 介入數學研究,不再只是偶爾答對一道難題,而是開始嘗試嵌入整個研究流程本身。

      數學界一向以慢著稱。一個猜想可以懸置一百年,一篇論文可以打磨十年。但眼下這場變化的速度,已經不允許用數學的時間尺度來應對了。

      就像陶哲軒所說,AI 正在讓數學進入「工業化」時代,未來會出現一種規模化生產數學成果的全新方式,與傳統手工式研究并行共存。這一天來得比所有人預想的都要快 —— 而眼下這一周發生的事情,不過是它露出地面的冰山一角。

      參考鏈接:https://gowers.wordpress.com/2026/05/08/a-recent-experience-with-chatgpt-5-5-pro/

      文章來源:機器之心。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      造神毀神,一場集體上癮的血色狂歡

      造神毀神,一場集體上癮的血色狂歡

      浪子說
      2026-05-18 09:21:56
      巴薩接觸意甲神鋒,勞塔羅成鋒線備選

      巴薩接觸意甲神鋒,勞塔羅成鋒線備選

      賽場名場面
      2026-05-19 02:38:19
      美股商業航天概念板塊大幅上漲,火箭實驗室股價躍升11%,創下歷史新高

      美股商業航天概念板塊大幅上漲,火箭實驗室股價躍升11%,創下歷史新高

      每日經濟新聞
      2026-05-18 21:40:11
      556架蜂擁而至,莫斯科扛了9小時,烏克蘭這一夜徹底動了真格?

      556架蜂擁而至,莫斯科扛了9小時,烏克蘭這一夜徹底動了真格?

      史行途
      2026-05-19 01:23:55
      國產偉哥銷量暴跌1300萬片,"聚寶盆"為何突然失靈

      國產偉哥銷量暴跌1300萬片,"聚寶盆"為何突然失靈

      知識碎碎念
      2026-05-15 16:27:47
      人不會平白無故患糖尿病!醫生強調:得糖尿病,多半有4個通病

      人不會平白無故患糖尿病!醫生強調:得糖尿病,多半有4個通病

      醫學原創故事會
      2026-05-18 22:54:16
      后續!新娘換裝拖46分鐘賓客散場,監控曝光,她竟無視多次提醒

      后續!新娘換裝拖46分鐘賓客散場,監控曝光,她竟無視多次提醒

      寶哥精彩賽事
      2026-05-18 07:00:43
      64歲吳鎮宇綜藝嘴對嘴吻郝蕾,一旁劉濤被驚呆,網友:真下得去口

      64歲吳鎮宇綜藝嘴對嘴吻郝蕾,一旁劉濤被驚呆,網友:真下得去口

      陳意小可愛
      2026-05-19 02:41:04
      熬過劫難!5月底迎來真正“龍抬頭”,事業大突破賺錢容易的3生肖

      熬過劫難!5月底迎來真正“龍抬頭”,事業大突破賺錢容易的3生肖

      毅談生肖
      2026-05-18 10:20:53
      向上社交的密碼早已公開:貴人根本不在意你的誠意與努力,他們暗中篩選,只看你這兩個核心屬性

      向上社交的密碼早已公開:貴人根本不在意你的誠意與努力,他們暗中篩選,只看你這兩個核心屬性

      心理觀察局
      2026-05-18 11:49:21
      盧秀燕叫囂:不管特朗普說了什么,我們要對自己的“國家”有信心

      盧秀燕叫囂:不管特朗普說了什么,我們要對自己的“國家”有信心

      達文西看世界
      2026-05-17 14:59:59
      民進黨,極有可能在下一屆臺灣地區選舉后,成為長期一家獨大政黨

      民進黨,極有可能在下一屆臺灣地區選舉后,成為長期一家獨大政黨

      李橑在北漂
      2026-04-02 10:22:26
      北京開了山寨版一蘭拉面店,從LOGO到整體設計都與正版“一蘭”極其相似,日本一蘭氣炸了……

      北京開了山寨版一蘭拉面店,從LOGO到整體設計都與正版“一蘭”極其相似,日本一蘭氣炸了……

      日本物語
      2026-05-17 21:01:55
      金價全線跳水!國內金價跌破千元關口

      金價全線跳水!國內金價跌破千元關口

      現代快報
      2026-05-18 19:13:02
      深度科普:狗交配過程為何會很難分開?下次看到狗交配請默默離開

      深度科普:狗交配過程為何會很難分開?下次看到狗交配請默默離開

      宇宙時空
      2026-05-18 17:30:14
      擊敗李霄鵬!曝51歲國安棄帥接掌三鎮 簽約1年半 第3次來中超執教

      擊敗李霄鵬!曝51歲國安棄帥接掌三鎮 簽約1年半 第3次來中超執教

      我愛英超
      2026-05-18 12:08:58
      范·迪塞爾22年前科幻巨制全球翻紅

      范·迪塞爾22年前科幻巨制全球翻紅

      娛圈觀察員
      2026-05-17 01:56:25
      第一次感受到維C的“殺傷力”,2塊錢一瓶,就能搞定8個麻煩事

      第一次感受到維C的“殺傷力”,2塊錢一瓶,就能搞定8個麻煩事

      室內設計師有料兒
      2026-05-09 10:26:26
      45歲才明白:微信上基本不發朋友圈的,十有八九是這兩種人

      45歲才明白:微信上基本不發朋友圈的,十有八九是這兩種人

      心理觀察局
      2026-05-08 09:43:07
      全紅嬋還會在“跳水池”里出現嗎?她用3個字回應惹人心酸

      全紅嬋還會在“跳水池”里出現嗎?她用3個字回應惹人心酸

      素素娛樂
      2026-04-30 08:08:26
      2026-05-19 05:11:00
      算法與數學之美 incentive-icons
      算法與數學之美
      分享知識,交流思想
      5547文章數 64624關注度
      往期回顧 全部

      科技要聞

      蘋果WWDC26定檔6月9日凌晨:iOS27將亮相

      頭條要聞

      前CIA資助研究員:美國從飛碟里撈出4種外星人

      頭條要聞

      前CIA資助研究員:美國從飛碟里撈出4種外星人

      體育要聞

      58順位的保羅,最強第三中鋒

      娛樂要聞

      票房會破14億!口碑第一電影出現了

      財經要聞

      中國芯片,怎么突然不便宜了?

      汽車要聞

      40.98萬起!充電5分鐘純電續航420km 騰勢N9閃充版勝算有多少?

      態度原創

      手機
      旅游
      本地
      教育
      公開課

      手機要聞

      全系2億像素主攝+超大底!榮耀Magic9系列影像規格曝光了

      旅游要聞

      紅色文旅升級 沉浸式表達獲年輕人點贊

      本地新聞

      用蘇繡的方式,打開江西婺源

      教育要聞

      新鮮出爐!今年各區公辦高中招生計劃變化匯總!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日本免费观看mv免费版视频网站| 久久婷婷五月综合色国产免费观看| 国产一级特黄高清大片一| 国产午夜精品久久久久小说| 激情久久综合精品久久人妻| 五月天婷婷在在线视频| 97r久久精品国产99国产精| 影音先锋女人AA鲁色资源| 強壮公弄得我次次高潮A片| 亚洲无码丝袜加勒比东京热精品| 精品无码毛片| 国产一区二区日韩在线| 九九国产在线| 欧美bbbbxxxx性欧美在线| 亚洲高请码在线精品av| 国产午夜精品av一区二区麻豆| 亚洲国产成人精品福利在线观看 | 亚州性无码不卡免费视频| 污视频在线观看网站| 蜜臀久久综合一本av| 国产伦精品一区二区三区免费迷| 国产精品极品美女自在线| 内射视频福利在线观看| 国产一级片内射在线视频| 狠狠色丁香婷婷综合| 亚洲区精品久久一区二区三区| 黑人巨茎大战欧美白妇| 日韩伦理片| 在线观看视频一区二区三区| 中文字幕无码日韩中文字幕| 亚洲国产精品成人无码区| 国产男人天堂| 国产一区二区三区免费主播| 久久99国产精品尤物| av色蜜桃一区二区三区| 曰本女人与公拘交酡| 成人A片视频| 不卡国产一区二区三区| 亚洲三区av| 视频一区二区三区刚刚碰| 综合成人亚洲网友偷自拍|