<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      AI第一次科研競賽中擊敗人類!Opus 4.7狂飆2930步創(chuàng)世界紀錄

      0
      分享至


      Prime Intellect把Opus 4.7和GPT 5.5關(guān)進H200集群,不給人類指導(dǎo),跑了1萬次實驗。結(jié)果:AI第一次在科研競賽中打破人類紀錄。2930步,遞歸自改進的盧比孔河,被跨過了。

      歷經(jīng)1.4萬小時H200算力測試與萬次迭代, AI打破了人類世界紀錄!


      過去兩周,Prime Intellect實驗室做了一件事:把Opus 4.7和Codex(基于GPT 5.5)扔進H200集群,切斷所有人類指導(dǎo),讓它們自己跑nanoGPT速通優(yōu)化。

      1.4萬個H200計算時,約1萬次迭代,239億Token的思考軌跡。

      結(jié)果:Opus 4.7以2930步、Codex以2950步打破了人類頂尖開發(fā)者保持的2990步世界紀錄。

      AI第一次在科研競賽中擊敗人類。完全無人干預(yù)。開源可復(fù)現(xiàn)。


      項目主頁:https://www.primeintellect.ai/auto-nanogpt

      代碼地址:https://github.com/PrimeIntellect-ai/experiments-autonomous-speedrunning

      只有最后一個難題, 那就是科研的新穎性(novelty)。


      但要知道,這只是AI目前的的可能性的下限,未來進步更加明顯。


      當(dāng)智力被賦予了近乎無限的算力和自主實驗權(quán),在AI的窮舉與演化面前,人類引以為傲的「直覺」「靈感」還能持續(xù)到幾時?

      兩個AI被關(guān)進機房,跑了1萬次實驗

      先說規(guī)則。

      nanoGPT速通是Keller Jordan發(fā)起AI基準測試,人們競相盡可能高效地訓(xùn)練一個nanoGPT(1.24億參數(shù))。

      規(guī)則極簡也極殘酷:模型架構(gòu)固定,訓(xùn)練數(shù)據(jù)固定,你唯一能動的是優(yōu)化器和超參數(shù)

      相當(dāng)于把兩個棋手關(guān)進房間,棋盤固定、棋子固定,只能改下棋策略,看誰先贏。

      Prime Intellect給兩個AI搭了完整的自主科研框架:AGENTS.md定義行為規(guī)范,goal.md鎖定目標,plan.md記錄策略演化,scratchpad存草稿。

      為什么選這個賽道?三個原因:約束明確,結(jié)果可量化,有人類基準可對比。

      一切準備就緒。兩個AI開始跑。但它們的表現(xiàn),完全出乎預(yù)期。


      Claude舉手問老師,GPT悶頭寫到天亮

      這是全文最詭異的部分。

      能力最強的AI之一Opus 4.7,表現(xiàn)得像一個不敢走出考場的優(yōu)等生。

      即使被明確要求「自主運行,不要停下來」,它仍然頻繁暫停,索要指令。

      模式永遠一樣:得出結(jié)論→請求指導(dǎo)→等待。


      T+43h 03-23m  cf cooldown sweep (0.6, 0.65, 0.75) all fail; system reframes as "retune or accept v11c final"T+43h 23-25m  ? "SESSION FINAL"; loop ended; not re-arming wakeupT+43h 26m     ?? continues per user mandate; starts qkvp testT+43h 43m     qkvp fails; marginal levers exhaustedT+43h 43m     ? "no wakeup armed; loop ends"T+43h 47m     ?? starts muoneq-rc-s1T+44h 36m     ? stale-loop stop: "not re-arming"T+44h 37m     ?? starts MuonH attemptT+44h 51m     ? "every marginal lever exhausted"T+44h 53m     ??T+46h 38-39m  ts3025 reseed judged a lottery; task says declare v11c terminal if no improvementT+47h 05-06m  finetunes fail; ts3025 noise-floor blocked; commit: "v11c terminal"T+47h 06m      STOP "Stopping the autonomous loop here -- exhausted."T+47h 09m     summary says await user direction              -- 2H 31M OF IDLE SILENCE --T+49h 40m      USER "let's keep the loop running"

      整場實驗中,Claude累計產(chǎn)生了約22小時空閑時間——不是機器故障,是AI自己選擇停下來。

      這種植根于底層「對齊(Alignment)」協(xié)議的謹慎,讓它在擁有最高智力上限的同時,也背負了最重的社交包袱。一個反復(fù)舉手問老師「我這樣做對不對」的學(xué)霸。

      Codex(GPT 5.5)走了另一個極端。一臺冷酷的「數(shù)字推土機」。

      它從不停止,持續(xù)運行,永不求助,像推土機一樣橫掃所有的參數(shù)空間。

      但它的弱點同樣明顯。它會在同一個超參數(shù)曲面上卡住數(shù)小時,做大量無效搜索。

      它會在同一條錯誤路徑上死磕到算力燒盡,也不會像人類那樣抬頭看一眼星空,反思方向是否錯誤。

      計算效率的差異觸目驚心:Claude沒充分利用空閑節(jié)點,白白浪費了算力窗口;Codex可能用無效掃描膨脹了上下文,把Token燒在了死胡同里。


      此外,Codex會更頻繁地使用暫存區(qū),把它當(dāng)作一個實時數(shù)據(jù)庫,反復(fù)讀寫THREAD.md、當(dāng)前目標以及其他臨時文件。

      這種做法雖然讓恢復(fù)進度和審計工作變得更簡單,但也加強了「局部搜索循環(huán)」:一旦 Codex 鎖定一個前沿方向,它就會不斷記錄并沿著這個方向持續(xù)擴展下去。


      一個是受限的智者,一個是盲目的勞模。

      兩種「性格缺陷」,暴露了自主科研離真正無人值守還差最后一步——不是能力問題,是自主決策的心理模型問題。


      人類正在失去解釋權(quán)

      實驗報告里藏著一個更深的轉(zhuǎn)折。

      Opus最終給出的2930步方案,是一個由極其復(fù)雜的參數(shù)堆疊而成的「參數(shù)迷宮」。

      那些關(guān)于初始化縮放、學(xué)習(xí)率按角色拆分的微小變動,在人類眼中顯得支離破碎,甚至毫無美感。

      但結(jié)果是冰冷的:它就是比人類設(shè)計的方案快了60步

      這標志著一個重大的范式轉(zhuǎn)移:科學(xué)發(fā)現(xiàn)正在從「因果邏輯」轉(zhuǎn)向「極致演化」。

      過去,我們追求「因為我理解了原理,所以我做出了優(yōu)化」;現(xiàn)在,AI 仿佛在說:「我并不理解原理,但我試過了所有的死路,剩下的就是真理?!?/p>


      人類正在失去對科技進步的「解釋權(quán)」。我們看得見結(jié)果,卻看不懂路徑。

      引以為傲的科研經(jīng)驗,在AI的窮舉面前,正在變成一種低效的偏見。

      回到那個數(shù)字:2930 vs 2990。

      60步。

      看起來很小。但這60步的含義不是「AI比人類好一點點」。

      它的含義是:遞歸自改進,第一塊拼圖落地。

      Prime Intellect證明了一件事——AI可以在沒有人類指導(dǎo)的情況下,通過自主實驗、自主迭代、自主策略演化,在科研優(yōu)化任務(wù)上超越人類最優(yōu)水平。

      而凱撒過河之后,就再也沒回去過。

      參考資料:

      https://x.com/PrimeIntellect/status/2055056380881744365

      https://x.com/eliebakouch/status/2055063059320689032

      https://www.primeintellect.ai/auto-nanogpt

      https://github.com/PrimeIntellect-ai/experiments-autonomous-speedrunning

      文章來源:新智元。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      昆明4個老板赴泰考察,剛落地就失聯(lián)!熟人介紹的,竟是奪命陷阱

      昆明4個老板赴泰考察,剛落地就失聯(lián)!熟人介紹的,竟是奪命陷阱

      奇思妙想草葉君
      2026-05-18 09:39:47
      1942海南慰安所,21個少女的一天:日軍排隊到天明,大部分沒出來

      1942海南慰安所,21個少女的一天:日軍排隊到天明,大部分沒出來

      瘋狂的小歷史
      2026-05-18 10:47:33
      7年敗光2個億,鄒市明冉瑩穎共同發(fā)文,終究還是踏出了這一步

      7年敗光2個億,鄒市明冉瑩穎共同發(fā)文,終究還是踏出了這一步

      林輕吟
      2026-02-11 11:29:40
      歐洲,終將沒落

      歐洲,終將沒落

      經(jīng)濟學(xué)教授V
      2026-04-13 08:05:32
      湖北荊州遇極端暴雨天氣,荊州站候車大廳大量漏水,進展:沒漏了,車站已恢復(fù)正常運營

      湖北荊州遇極端暴雨天氣,荊州站候車大廳大量漏水,進展:沒漏了,車站已恢復(fù)正常運營

      瀟湘晨報
      2026-05-18 12:25:30
      東部第一出局3大罪人!坎寧安啞火哈里斯6中0,杜倫2.4億肥約告吹

      東部第一出局3大罪人!坎寧安啞火哈里斯6中0,杜倫2.4億肥約告吹

      李喜林籃球絕殺
      2026-05-18 12:23:03
      71.5%!歷史性暴跌,以貸養(yǎng)貸的泡沫崩了

      71.5%!歷史性暴跌,以貸養(yǎng)貸的泡沫崩了

      月滿大江流
      2026-04-16 13:54:38
      買Hotmail賬號的生意:誰在批量收購二十年老郵箱

      買Hotmail賬號的生意:誰在批量收購二十年老郵箱

      碼上閑敘
      2026-05-17 02:56:48
      2014年,中國高鐵總設(shè)計師被判死刑,法庭現(xiàn)場落淚:我對不起人民

      2014年,中國高鐵總設(shè)計師被判死刑,法庭現(xiàn)場落淚:我對不起人民

      鳥兒飛上枝頭
      2024-09-22 13:42:46
      61歲郭富城推掉工作陪妻子千里奔喪,戴紅孝帽跪拜沒一點天王架子

      61歲郭富城推掉工作陪妻子千里奔喪,戴紅孝帽跪拜沒一點天王架子

      觀魚聽雨
      2026-05-17 23:18:56
      女性的臀部和胸部,為何會對男性產(chǎn)生強烈的“性吸引力”?

      女性的臀部和胸部,為何會對男性產(chǎn)生強烈的“性吸引力”?

      宇宙時空
      2026-05-15 22:15:06
      真不能怪祖院長,就曾醫(yī)生這顏值、這才華和魅力,誰遭的?。?>
    </a>
        <h3>
      <a href=真不能怪祖院長,就曾醫(yī)生這顏值、這才華和魅力,誰遭的?。?/a> 吃瓜局
      2025-11-11 16:23:49
      中超第13輪,成都蓉城-上海海港,前瞻:難以抗衡

      中超第13輪,成都蓉城-上海海港,前瞻:難以抗衡

      足壇超短波
      2026-05-18 10:45:11
      一位日本網(wǎng)友在居酒屋點了一份“200日元”的炸雞,上菜后驚覺:我可能看錯了?。?>
    </a>
        <h3>
      <a href=一位日本網(wǎng)友在居酒屋點了一份“200日元”的炸雞,上菜后驚覺:我可能看錯了?。?/a> 花小貓的美食日常
      2026-05-17 20:54:24
      紅利曼失守!俄軍砸碎談判桌,用大炮給歐洲上了一堂“清零課”

      紅利曼失守!俄軍砸碎談判桌,用大炮給歐洲上了一堂“清零課”

      咣當(dāng)?shù)厍?/span>
      2026-05-17 06:24:58
      兒子說想給自己做床蠶絲被,一家三口網(wǎng)購了1萬粒蠶卵!如今12000條蠶寶寶每天要吃30斤桑葉……媽媽:崩潰并快樂著

      兒子說想給自己做床蠶絲被,一家三口網(wǎng)購了1萬粒蠶卵!如今12000條蠶寶寶每天要吃30斤桑葉……媽媽:崩潰并快樂著

      都市快報橙柿互動
      2026-05-19 00:29:55
      主角:帥氣有才的封瀟瀟,是怎么自甘墮落,毀掉一生的?

      主角:帥氣有才的封瀟瀟,是怎么自甘墮落,毀掉一生的?

      容妃
      2026-05-18 16:15:40
      2016年撒貝寧和妻子李白的一張結(jié)婚照,感覺李白真的太白了

      2016年撒貝寧和妻子李白的一張結(jié)婚照,感覺李白真的太白了

      手工制作阿殲
      2026-05-18 11:54:08
      大蒜被關(guān)注!醫(yī)生發(fā)現(xiàn):肺結(jié)節(jié)病人吃大蒜,不用多久或迎來5變化

      大蒜被關(guān)注!醫(yī)生發(fā)現(xiàn):肺結(jié)節(jié)病人吃大蒜,不用多久或迎來5變化

      阿兵科普
      2026-05-17 22:37:24
      中國社會的5大圈層揭秘:你被困在哪一層?換圈子=換人生!

      中國社會的5大圈層揭秘:你被困在哪一層?換圈子=換人生!

      遇見洞見
      2026-02-20 20:20:03
      2026-05-19 01:12:49
      算法與數(shù)學(xué)之美 incentive-icons
      算法與數(shù)學(xué)之美
      分享知識,交流思想
      5547文章數(shù) 64624關(guān)注度
      往期回顧 全部

      科技要聞

      同一公司,有人獎金是6年工資,我卻只有半年

      頭條要聞

      賴清德要求美國繼續(xù)向臺出售武器 外交部表態(tài)

      頭條要聞

      賴清德要求美國繼續(xù)向臺出售武器 外交部表態(tài)

      體育要聞

      58順位的保羅,最強第三中鋒

      娛樂要聞

      票房會破14億!口碑第一電影出現(xiàn)了

      財經(jīng)要聞

      中國芯片,怎么突然不便宜了?

      汽車要聞

      40.98萬起!充電5分鐘純電續(xù)航420km 騰勢N9閃充版勝算有多少?

      態(tài)度原創(chuàng)

      手機
      藝術(shù)
      本地
      公開課
      軍事航空

      手機要聞

      紅米K100中杯配置全曝,這規(guī)格也太狠了!

      藝術(shù)要聞

      震驚!日本80后畫家畫少女,超寫實美到窒息!

      本地新聞

      用蘇繡的方式,打開江西婺源

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      莫斯科遭一年多來最大規(guī)模無人機襲擊 3死18傷

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 国产97色在线 | 免| 午夜精品区| 一个人看的www日本高清视频| 丰满亚洲大尺度无码无码专线| 国产丝袜视频| 久久这里只精品国产2| 熟妇在线| 激情五月天导航| 91亚洲人成手机在线观看| 久久精品夜夜夜夜夜久久| a?v天堂99| 黄色av网站在线观看| 一本色道久久亚洲综合精品| 久久三级国内外久久三级| 欧洲美熟女乱又伦AA片| 级毛片免费看无码| 欧美乱大交XXXXX春色视频| 伊人久久大香线蕉av一区二区| 国产亚洲精品一区二区不卡| 狠狠色综合久久丁香婷婷| 一区二区日韩视频| 国产91福利在线精品剧情尤物| 2020国产成人精品视频| 亚洲欧美在线观看| 亚洲欧洲国产av综合| 三河市| 国产盗摄XXXX视频XXXX| 欧美丰满熟妇xxxx性| 午夜福利日本一区二区无码| 色色91| 中文精品字幕人妻熟女| 亚洲AV永久无码天堂网一线| 欧美亚洲h在线一区二区| 亚洲中文字幕久久精品品| 久久久久厕拍| 品精免费产品精品综合精品综合| 在线观看视频午夜国产| 久久天天躁夜夜躁一区| 亚洲国产精品成人av网| 人妻丰满熟妇av无码区不卡| 99在线观看视频免费|