<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      AI第一次科研競賽中擊敗人類!Opus 4.7狂飆2930步創世界紀錄

      0
      分享至


      來源:新智元

      Prime Intellect把Opus 4.7和GPT 5.5關進H200集群,不給人類指導,跑了1萬次實驗。結果:AI第一次在科研競賽中打破人類紀錄。2930步,遞歸自改進的盧比孔河,被跨過了。

      歷經1.4萬小時H200算力測試與萬次迭代, AI打破了人類世界紀錄!


      過去兩周,Prime Intellect實驗室做了一件事:把Opus 4.7和Codex(基于GPT 5.5)扔進H200集群,切斷所有人類指導,讓它們自己跑nanoGPT速通優化。

      1.4萬個H200計算時,約1萬次迭代,239億Token的思考軌跡

      結果:Opus 4.7以2930步、Codex以2950步打破了人類頂尖開發者保持的2990步世界紀錄。

      AI第一次在科研競賽中擊敗人類。完全無人干預。開源可復現。


      項目主頁:https://www.primeintellect.ai/auto-nanogpt

      代碼地址:https://github.com/PrimeIntellect-ai/experiments-autonomous-speedrunning

      只有最后一個難題, 那就是科研的新穎性(novelty)。


      但要知道,這只是AI目前的的可能性的下限,未來進步更加明顯。


      當智力被賦予了近乎無限的算力和自主實驗權,在AI的窮舉與演化面前,人類引以為傲的「直覺」「靈感」還能持續到幾時?

      兩個AI被關進機房,跑了1萬次實驗

      先說規則。

      nanoGPT速通是Keller Jordan發起AI基準測試,人們競相盡可能高效地訓練一個nanoGPT(1.24億參數)。

      規則極簡也極殘酷:模型架構固定,訓練數據固定,你唯一能動的是優化器和超參數

      相當于把兩個棋手關進房間,棋盤固定、棋子固定,只能改下棋策略,看誰先贏。

      Prime Intellect給兩個AI搭了完整的自主科研框架:AGENTS.md定義行為規范,goal.md鎖定目標,plan.md記錄策略演化,scratchpad存草稿。

      為什么選這個賽道?三個原因:約束明確,結果可量化,有人類基準可對比。

      一切準備就緒。兩個AI開始跑。但它們的表現,完全出乎預期。


      Claude舉手問老師,GPT悶頭寫到天亮

      這是全文最詭異的部分。

      能力最強的AI之一Opus 4.7,表現得像一個不敢走出考場的優等生。

      即使被明確要求「自主運行,不要停下來」,它仍然頻繁暫停,索要指令。

      模式永遠一樣:得出結論→請求指導→等待。


      整場實驗中,Claude累計產生了約22小時空閑時間——不是機器故障,是AI自己選擇停下來。

      這種植根于底層「對齊(Alignment)」協議的謹慎,讓它在擁有最高智力上限的同時,也背負了最重的社交包袱。一個反復舉手問老師「我這樣做對不對」的學霸。

      Codex(GPT 5.5)走了另一個極端。一臺冷酷的「數字推土機」。

      它從不停止,持續運行,永不求助,像推土機一樣橫掃所有的參數空間。

      但它的弱點同樣明顯。它會在同一個超參數曲面上卡住數小時,做大量無效搜索。

      它會在同一條錯誤路徑上死磕到算力燒盡,也不會像人類那樣抬頭看一眼星空,反思方向是否錯誤。

      計算效率的差異觸目驚心:Claude沒充分利用空閑節點,白白浪費了算力窗口;Codex可能用無效掃描膨脹了上下文,把Token燒在了死胡同里。


      此外,Codex會更頻繁地使用暫存區,把它當作一個實時數據庫,反復讀寫THREAD.md、當前目標以及其他臨時文件。

      這種做法雖然讓恢復進度和審計工作變得更簡單,但也加強了「局部搜索循環」:一旦 Codex 鎖定一個前沿方向,它就會不斷記錄并沿著這個方向持續擴展下去。


      一個是受限的智者,一個是盲目的勞模。

      兩種「性格缺陷」,暴露了自主科研離真正無人值守還差最后一步——不是能力問題,是自主決策的心理模型問題。


      人類正在失去解釋權

      實驗報告里藏著一個更深的轉折。

      Opus最終給出的2930步方案,是一個由極其復雜的參數堆疊而成的「參數迷宮」。

      那些關于初始化縮放、學習率按角色拆分的微小變動,在人類眼中顯得支離破碎,甚至毫無美感。

      但結果是冰冷的:它就是比人類設計的方案快了60步

      這標志著一個重大的范式轉移:科學發現正在從「因果邏輯」轉向「極致演化」。

      過去,我們追求「因為我理解了原理,所以我做出了優化」;現在,AI 仿佛在說:「我并不理解原理,但我試過了所有的死路,剩下的就是真理。」


      人類正在失去對科技進步的「解釋權」。我們看得見結果,卻看不懂路徑。

      引以為傲的科研經驗,在AI的窮舉面前,正在變成一種低效的偏見。

      回到那個數字:2930 vs 2990。

      60步。

      看起來很小。但這60步的含義不是「AI比人類好一點點」。

      它的含義是:遞歸自改進,第一塊拼圖落地

      Prime Intellect證明了一件事——AI可以在沒有人類指導的情況下,通過自主實驗、自主迭代、自主策略演化,在科研優化任務上超越人類最優水平。

      而凱撒過河之后,就再也沒回去過。

      參考資料:

      https://x.com/PrimeIntellect/status/2055056380881744365

      https://x.com/eliebakouch/status/2055063059320689032

      https://www.primeintellect.ai/auto-nanogpt

      https://github.com/PrimeIntellect-ai/experiments-autonomous-speedrunning

      閱讀最新前沿科技趨勢報告,請訪問21世紀關鍵技術研究院的“未來知識庫”


      未來知識庫是 “21世紀關鍵技術研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

      截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告

      (加入未來知識庫,全部資料免費閱讀和下載)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      猝死的人越來越多?醫生再次強調:寧可睡到中午,也別做這8事

      猝死的人越來越多?醫生再次強調:寧可睡到中午,也別做這8事

      侯醫生談健康
      2026-04-15 18:35:03
      女演員千萬別整容!央八大劇的她,臉又僵又腫、鼻孔大的讓人出戲

      女演員千萬別整容!央八大劇的她,臉又僵又腫、鼻孔大的讓人出戲

      陳意小可愛
      2026-05-18 19:58:27
      難怪西方集體對中國黑臉:全球蛋糕分完,發現桌上只有7億人的碗

      難怪西方集體對中國黑臉:全球蛋糕分完,發現桌上只有7億人的碗

      熱點一網打盡
      2026-05-18 11:25:54
      14歲送上北野武的床,17歲拍寫真,被操控半生,年過50仍風韻猶存

      14歲送上北野武的床,17歲拍寫真,被操控半生,年過50仍風韻猶存

      飄飄然的娛樂匯
      2026-05-11 20:05:06
      神舟二十三即將發射,香港女航天員或將飛天,巴基斯坦也做好準備

      神舟二十三即將發射,香港女航天員或將飛天,巴基斯坦也做好準備

      光電科技君
      2026-05-16 12:32:57
      已成功瘦了 32 斤,我發現減肥最抗餓的三餐搭配是:高蛋白低脂

      已成功瘦了 32 斤,我發現減肥最抗餓的三餐搭配是:高蛋白低脂

      健身狂人
      2026-05-15 09:41:25
      利雅得青年主帥:C羅比賽中曾問我,為什么踢勝利的時候那么賣力

      利雅得青年主帥:C羅比賽中曾問我,為什么踢勝利的時候那么賣力

      懂球帝
      2026-05-18 12:17:29
      慘不忍睹,上市首日瘋漲近4倍后極速崩盤!高位追高者2日浮虧近40%!

      慘不忍睹,上市首日瘋漲近4倍后極速崩盤!高位追高者2日浮虧近40%!

      股俠指北針
      2026-05-18 10:48:41
      2300一噸,5年收了3萬噸!日本狂收東北落葉,24年專家揭露真相

      2300一噸,5年收了3萬噸!日本狂收東北落葉,24年專家揭露真相

      福建平子
      2026-02-05 16:37:30
      被辭退的保潔阿姨爆猛料:酒店提供的免費礦泉水,竟有這么多套路

      被辭退的保潔阿姨爆猛料:酒店提供的免費礦泉水,竟有這么多套路

      今朝牛馬
      2026-05-13 21:04:49
      馬斯克兒子同款虎頭包商家發聲:潑天流量砸來,根本無法量產

      馬斯克兒子同款虎頭包商家發聲:潑天流量砸來,根本無法量產

      童叔不飆車
      2026-05-15 19:31:46
      最重死刑,緬甸擬立反詐新法,經營詐騙園區、非法拘禁將面臨極刑

      最重死刑,緬甸擬立反詐新法,經營詐騙園區、非法拘禁將面臨極刑

      鳳凰衛視
      2026-05-18 16:21:48
      李昇祐談無緣世界杯:我感到失望,希望韓國隊取得好成績

      李昇祐談無緣世界杯:我感到失望,希望韓國隊取得好成績

      懂球帝
      2026-05-18 16:54:43
      狂人回歸!穆帥時隔13年重返皇馬,接手爛攤子遭卡西反對

      狂人回歸!穆帥時隔13年重返皇馬,接手爛攤子遭卡西反對

      仰臥撐FTUer
      2026-05-18 19:48:05
      52歲劉愷威中年失業,與女友分手,每天雷打不動接送孩子上學!

      52歲劉愷威中年失業,與女友分手,每天雷打不動接送孩子上學!

      玖宇維
      2026-05-16 14:47:08
      安切洛蒂終極難題:巴西隊最后1席,天才前鋒or萬金油中場?

      安切洛蒂終極難題:巴西隊最后1席,天才前鋒or萬金油中場?

      劉哥談體育
      2026-05-18 14:11:34
      鄭永剛G2用人出大問題!對賀希寧容子鋒戰術出錯,末節該堅持巴吉

      鄭永剛G2用人出大問題!對賀希寧容子鋒戰術出錯,末節該堅持巴吉

      籃球資訊達人
      2026-05-18 22:29:53
      女子每次回婆家都丟首飾,今年她直接戴假金鐲,成功揪出“黑手”

      女子每次回婆家都丟首飾,今年她直接戴假金鐲,成功揪出“黑手”

      林林故事揭秘
      2025-04-30 13:42:39
      004核航母落空?美媒:除關鍵術落后,多個原因讓中國沒必要造它

      004核航母落空?美媒:除關鍵術落后,多個原因讓中國沒必要造它

      趣文說娛
      2026-05-09 21:56:12
      水在4℃時密度最大?這個反常識物理Bug,差點決定地球生命的命運

      水在4℃時密度最大?這個反常識物理Bug,差點決定地球生命的命運

      半解智士
      2026-05-05 12:56:18
      2026-05-18 23:12:49
      人工智能學家 incentive-icons
      人工智能學家
      人工智能領域權威媒體
      4744文章數 37464關注度
      往期回顧 全部

      科技要聞

      同一公司,有人獎金是6年工資,我卻只有半年

      頭條要聞

      伊朗披露穆杰塔巴受傷細節:未導致面容損毀或肢體傷殘

      頭條要聞

      伊朗披露穆杰塔巴受傷細節:未導致面容損毀或肢體傷殘

      體育要聞

      58順位的保羅,最強第三中鋒

      娛樂要聞

      票房會破14億!口碑第一電影出現了

      財經要聞

      中國芯片,怎么突然不便宜了?

      汽車要聞

      歸元S平臺首款車型 魏牌V9X上市 34.98萬元起

      態度原創

      游戲
      房產
      時尚
      數碼
      軍事航空

      三角洲不信搜打撤做不出“好電競”

      房產要聞

      突發!海口重磅調規!碧桂園要解套;新埠島要起飛了!

      戛納電影節|61歲鞏俐驚艷世界,她活出了所有女人都想成為的樣子

      數碼要聞

      聯力DK-07 WOOD電腦桌國行發售,8999元

      軍事要聞

      莫斯科遭一年多來最大規模無人機襲擊 3死18傷

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人妻久久999精品1024| 成人白浆一区二区三区在线观看| 91在线播| 人妻?日韩?欧美?综合?制服| 亚洲国产AV无码综合原创| 人妻少妇嫩草AV无码| 亚洲高清av一区二区| 久久久久厕拍| 国产欧美日韩精品丝袜高跟鞋| 国产尤物精品自在拍视频首页| 亚洲国产精品网站久久| 亚洲熟女乱色一区二区三区| 黑人av无码一区| 亚洲欧美成人一区二区在线| 亚洲人妻乱| 97成人超碰| 制服无码在线第一页| 最新亚洲人成网站在线影院| 澳门永久av免费网站| 2018天天拍拍天天爽视频| www自慰精品| 亚洲欧美精品综合在线观看| jizzjizz亚洲| 国产精品多p对白交换绿帽| 亚洲精品www久久久久久| AV无码一区二区三区四区| 色吊丝二区三区中文字幕| 九九久久国产精品免费热6| 久久精品国产第一区二区三区| 中文幕无线码中文字夫妻| jlzz大jlzz大全免费| 欧美丰满熟妇xxxx性| 国产成人精品日本亚洲77上位| 91精品国产91久久综合桃花| 中文字幕第一页亚洲精品| 2020国产免费久久精品99| 麻豆精品在线看| 99视频精品全部国产| 日韩人妻一区中文字幕| 亚洲午夜天堂| 欧美日韩免费做爰大片人|