<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      我們正在嚴(yán)重低估AI的進(jìn)展!AlphaGo締造者罕見發(fā)聲:2026年AI自主上崗8小時(shí)

      0
      分享至

        

        來源:新智元

        【導(dǎo)讀】當(dāng)我們還在調(diào)侃「AI寫錯(cuò)代碼」時(shí),實(shí)驗(yàn)室里的科學(xué)家卻看到它能獨(dú)立完成幾個(gè)小時(shí)的復(fù)雜任務(wù)。AlphaGo作者Julian罕見發(fā)聲:公眾對AI的認(rèn)知,至少落后一個(gè)世代。最新數(shù)據(jù)更顯示,AI正以指數(shù)速度逼近專家水準(zhǔn),2026或許就是臨界點(diǎn)。我們,是在見證未來,還是在自欺欺人?

        AlphaGo、AlphaZero的核心作者——Julian拋出了一個(gè)尖銳的比喻:人們今天對AI的態(tài)度,很像當(dāng)初面對新冠疫情早期的反應(yīng)。

        Julian的意思很直接:我們正在嚴(yán)重低估AI的進(jìn)展。

        

        很多人還在笑它寫錯(cuò)代碼,抱怨它沒法替代人類;但在實(shí)驗(yàn)室里,研究者早已看到另一幅景象——AI已經(jīng)能獨(dú)立完成幾個(gè)小時(shí)的復(fù)雜任務(wù),并且還在按指數(shù)速度進(jìn)化。

        這就是他決定站出來發(fā)聲的原因:公眾的認(rèn)知,和前沿的現(xiàn)實(shí),之間至少隔著一個(gè)世代的落差。

        

        科學(xué)家不忍再沉默:AI為何被大眾低估?

        Julian Schrittwieser的名字,或許不像馬斯克、奧特曼那樣家喻戶曉,但在AI圈,他是響當(dāng)當(dāng)?shù)拇嬖凇?/p>

        

        作為AlphaGo、AlphaZero、MuZero的核心作者之一,他親歷了AI從「圍棋科幻」到「現(xiàn)實(shí)碾壓」的全過程。

        也正因如此,當(dāng)他在個(gè)人博客寫下那段話時(shí),格外刺耳:

        人們注意到AI還會犯錯(cuò),就急著下結(jié)論:它永遠(yuǎn)不可能達(dá)到人類水準(zhǔn),或者影響有限。可別忘了——就在幾年前,讓AI寫程序、設(shè)計(jì)網(wǎng)站還完全是科幻!

        在他看來,今天的輿論氛圍有點(diǎn)荒謬。

        大眾盯著模型出錯(cuò)的細(xì)節(jié),就斷言「AI不過如此」;記者拿兩代模型的閑聊對比,覺得「沒啥變化」,就認(rèn)定「進(jìn)步停滯」;政策討論里,AI被當(dāng)成遙遠(yuǎn)的、虛浮的「泡沫」。

        

        然而,實(shí)驗(yàn)室里的研究者看到的,卻是另一幅畫面:AI的能力曲線正在以指數(shù)型躍升。

        Julian bluntly指出,公眾與前沿之間的認(rèn)知差距,至少滯后了一個(gè)世代

        他之所以站出來發(fā)聲,不是為了渲染危機(jī),而是為了提醒:如果連科學(xué)家眼前清晰可見的趨勢都被忽視,真正的臨界點(diǎn)到來時(shí),我們幾乎沒有準(zhǔn)備。

        指數(shù)曲線下的震撼

        AI「獨(dú)立上班」的時(shí)間在翻倍

        Julian提出的第一個(gè)關(guān)鍵證據(jù),來自一家專門研究模型能力的機(jī)構(gòu)——METR (Model Evaluation and Threat Research)

        他們的思路很直白:不再只看模型答題對錯(cuò),而是衡量它們能自主完成多長時(shí)間的真實(shí)任務(wù)。

        在今年早些時(shí)候的研究里,METR給出的答案是:Claude 3.7 Sonnet能在約1小時(shí)長度的軟件工程任務(wù)中保持50%的成功率

        

        這意味著,它已經(jīng)具備獨(dú)立撐起一段「實(shí)打?qū)嵉墓ぷ鲿r(shí)長」的能力。

        Julian指出,更令人震驚的是——這條曲線呈現(xiàn)出指數(shù)增長趨勢,每7個(gè)月翻一倍

        Sonnet 3.7已經(jīng)是7個(gè)月前的模型,正好對應(yīng)METR統(tǒng)計(jì)出的翻倍周期。

        他隨即給出最新的對照:在METR官網(wǎng)更新的圖表里,可以看到Grok 4、Claude Opus 4.1、GPT-5已經(jīng)排在右上角。

        

        Julian博文引用的METR數(shù)據(jù),橫軸為時(shí)間,縱軸為可完成任務(wù)的時(shí)長。可以看到GPT-5、Opus 4.1已經(jīng)突破兩小時(shí)大關(guān)。

        它們不再是「1小時(shí)工作」,而是能夠支撐超過2小時(shí)的任務(wù)。指數(shù)并沒有放緩,反而略超預(yù)期

        這條線的含義不止是「2小時(shí)」,而是它所暗示的外推未來

        如果趨勢不變,2026年年中,模型將能連續(xù)完成8小時(shí)工作;再往后,2027年,模型可能在不少復(fù)雜任務(wù)上超越人類專家

        Julian的意思很明確:你也許不必喜歡這種預(yù)測,但忽視它的代價(jià)極高

        跨行業(yè)評測:AI已逼近人類專家

        如果說METR的研究證明了AI在軟件工程任務(wù)上的「時(shí)間地平線」不斷拉長,那么另一項(xiàng)研究——OpenAI的GDPval則把這個(gè)趨勢帶進(jìn)了現(xiàn)實(shí)經(jīng)濟(jì)。

        GDPval的設(shè)計(jì)非常直接:找來44個(gè)職業(yè)、9大行業(yè)的任務(wù),每個(gè)職業(yè)挑選30個(gè)真實(shí)工作樣本,總共1320項(xiàng)任務(wù)。

        

        GDPval任務(wù)覆蓋9大行業(yè),44個(gè)職業(yè),模型表現(xiàn)已與人類差距極小。Claude Opus 4.1在多個(gè)維度甚至領(lǐng)先GPT-5。

        這些任務(wù)由平均14年經(jīng)驗(yàn)的行業(yè)專家設(shè)計(jì),再交給模型去完成,最后由盲評打分:只看結(jié)果,不看作者是誰。

        Julian在博文里寫道:

        最新的結(jié)果顯示,GPT-5在許多職業(yè)任務(wù)上已經(jīng)接近人類水準(zhǔn)。更令人意外的是,Claude Opus 4.1(發(fā)布時(shí)間甚至早于 GPT-5),在GDPval上的表現(xiàn)顯著優(yōu)于GPT-5,幾乎追平了行業(yè)專家。

        這不是某個(gè)孤立benchmark的「漂亮成績」,而是在跨越法律、金融、工程、醫(yī)療、創(chuàng)意等行業(yè)的真實(shí)檢驗(yàn)中,AI開始逼近人類平均水平。

        

        OpenAI GDPval評測結(jié)果(2024–2025)。縱軸為模型在真實(shí)職業(yè)任務(wù)中的勝率(對比有多年經(jīng)驗(yàn)的行業(yè)專家),深色為純勝率,淺色為勝或平局。可以看到GPT-5已逼近「行業(yè)專家水平線」。

        更值得注意的是:OpenAI在這份報(bào)告中,并沒有刻意凸顯自家模型,反而坦誠承認(rèn)友商Claude的表現(xiàn)更好

        

        Julian特別稱贊這一點(diǎn),認(rèn)為這是行業(yè)少見的「科研誠信」:

        在追求安全和有益結(jié)果時(shí),比拼輸贏反而不是最重要的。

        當(dāng)然,GDPval的設(shè)計(jì)也并非完美。

        Julian也提醒,許多任務(wù)依然相對「整潔」(messy程度不高),沒有模擬長周期、多輪反饋的復(fù)雜工作環(huán)境。

        但即便如此,趨勢已經(jīng)足夠說明問題——AI不只是能寫點(diǎn)小程序,而是在真實(shí)的職業(yè)場景里,正一步步靠近甚至超越人類。

        質(zhì)疑聲出現(xiàn):趨勢真的可靠嗎?

        在Julian的博文下,不少讀者認(rèn)同「AI沒有泡沫」,但也有人提出尖銳的質(zhì)疑。

        其中,Atharva Raykar的評論獲得了高贊。他指出:

        把AI的進(jìn)展直接類比成指數(shù)曲線,其實(shí)很危險(xiǎn)。疫情的指數(shù)傳播有明確機(jī)制支撐,而AI的提升并不是必然的。

        

        他的觀點(diǎn)是:AI的進(jìn)步更像是摩爾定律,靠整個(gè)行業(yè)不斷疊加創(chuàng)新與工程突破。

        如果沒有推理模型等關(guān)鍵節(jié)點(diǎn)的突破,能力曲線可能早就「撞墻」。所以,單純外推曲線,未必能保證未來必然繼續(xù)加速。

        Atharva還提到另一個(gè)問題:評測任務(wù)不夠「messy」

        METR的任務(wù)平均「復(fù)雜度得分」只有3/16,相當(dāng)于結(jié)構(gòu)清晰的小型工程任務(wù);而現(xiàn)實(shí)世界中的軟件項(xiàng)目、科研探索,往往在7–16的區(qū)間,遠(yuǎn)比benchmark混亂。

        也就是說,現(xiàn)在的評測結(jié)果可能高估了AI在真實(shí)世界中的適用性。

        Julian在后續(xù)回復(fù)中承認(rèn)了這些提醒的合理性,但也強(qiáng)調(diào):

        我類比的重點(diǎn)并不是AI一定會像病毒傳播那樣加速,而是公眾和決策層正在忽視已經(jīng)發(fā)生的增長。

        短期(1–2 年)的趨勢依然很清晰——在這種尺度上,外推往往比專家預(yù)測更靠譜。

        在他看來,問題的關(guān)鍵不是曲線未來是否會「拐彎],而是:如果趨勢真的繼續(xù),而社會卻沒有準(zhǔn)備,那代價(jià)將會極其沉重。

        未來是替代,還是百倍增幅的協(xié)作?

        Julian 在文章的最后給出了他最具沖擊力的預(yù)測:

        2026年中,至少有一款頂級模型能連續(xù)自主完成8小時(shí)的工作任務(wù)——這意味著它不再只是一個(gè)「對話工具」,而是能真正以「全職員工」的形式參與工作流。

        2026年底,在多個(gè)行業(yè)任務(wù)中,會有模型的表現(xiàn)正式達(dá)到人類專家的平均水平

        2027年之后,在不少垂直任務(wù)里,AI的表現(xiàn)將頻繁超越專家,并逐步成為生產(chǎn)力的主力。

        這不是科幻,而是從當(dāng)前曲線直接外推出的「保守版本」。

        

        Julian直言,忽視這種趨勢,比過度擔(dān)憂更危險(xiǎn)。

        但他同時(shí)也強(qiáng)調(diào),AI的未來不一定意味著「替代」。在他設(shè)想的畫面里,更有可能出現(xiàn)的是這樣一種場景:

        人類依舊是指揮者,但身邊會有幾十個(gè)、上百個(gè)超強(qiáng)助手。人機(jī)協(xié)作下的效率提升,不是1倍,而是10倍、100倍。

        這種模式不僅能避免大規(guī)模失業(yè)的恐慌,還可能釋放前所未有的創(chuàng)造力。

        科研、設(shè)計(jì)、醫(yī)療、法律、金融……幾乎所有行業(yè)都會因此重組。

        Julian把這種可能性稱為「更安全、更有益的道路」:讓AI成為超強(qiáng)工具,而不是對手。

        這幅未來圖景令人震撼:或許在不遠(yuǎn)的2026或2027,你不是被AI取代,而是帶著一支「AI 團(tuán)隊(duì)」去上班

        Julian的提醒,其實(shí)很簡單:我們正在低估AI

        不是說它完美無缺,而是它的曲線比多數(shù)人想象的更快、更陡。

        按照當(dāng)前的趨勢,2026或許就是關(guān)鍵轉(zhuǎn)折點(diǎn)——AI可能不再是「實(shí)驗(yàn)室的奇觀」,而是走進(jìn)每一個(gè)普通行業(yè),真正改寫經(jīng)濟(jì)的底層邏輯。

        這不是危言聳聽,而是一個(gè)事實(shí):未來兩三年內(nèi),我們都將直面一個(gè)被低估的臨界點(diǎn)。

        而當(dāng)那一刻到來時(shí),每個(gè)人都要回答同一個(gè)問題:你會抵抗、觀望,還是率先和你的AI團(tuán)隊(duì)并肩上崗?

        參考資料:

        https://x.com/polynoamial/status/1972167347088904371

        https://www.julian.ac/blog/2025/09/27/failing-to-understand-the-exponential-again/

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      廁紙是丟紙簍好,還是直接扔馬桶沖走好?原來兩個(gè)差別這么大!

      廁紙是丟紙簍好,還是直接扔馬桶沖走好?原來兩個(gè)差別這么大!

      室內(nèi)設(shè)計(jì)師有料兒
      2026-05-08 11:49:43
      吳彥祖妻子素顏真實(shí)模樣曝光,完全沒女人味,一眼看著像硬漢

      吳彥祖妻子素顏真實(shí)模樣曝光,完全沒女人味,一眼看著像硬漢

      調(diào)侃國際觀點(diǎn)
      2026-05-05 08:32:47
      5000萬英鎊報(bào)價(jià)敲定!巴黎全力挖阿森納邊鋒,歐冠決賽趁機(jī)談判

      5000萬英鎊報(bào)價(jià)敲定!巴黎全力挖阿森納邊鋒,歐冠決賽趁機(jī)談判

      夜白侃球
      2026-05-09 08:50:12
      突然確診癌癥!男子當(dāng)場急了:我不痛不癢,能吃能睡……很多人發(fā)現(xiàn)已是中晚期

      突然確診癌癥!男子當(dāng)場急了:我不痛不癢,能吃能睡……很多人發(fā)現(xiàn)已是中晚期

      福建衛(wèi)生報(bào)
      2026-05-09 20:53:54
      至少在已經(jīng)過去的25年里,中國的“財(cái)神”不是趙公明,而是WTO!

      至少在已經(jīng)過去的25年里,中國的“財(cái)神”不是趙公明,而是WTO!

      細(xì)雨中的呼喊
      2026-02-21 06:59:07
      中年男性破產(chǎn)被“斬殺”四件套:陽痿、失業(yè)、老婆出軌離婚和心梗

      中年男性破產(chǎn)被“斬殺”四件套:陽痿、失業(yè)、老婆出軌離婚和心梗

      黯泉
      2026-05-09 20:15:36
      朱辰杰拯救申花!8分鐘頭球雙響,中超生涯首次,創(chuàng)單季進(jìn)球紀(jì)錄

      朱辰杰拯救申花!8分鐘頭球雙響,中超生涯首次,創(chuàng)單季進(jìn)球紀(jì)錄

      奧拜爾
      2026-05-09 21:21:53
      不老神話!41歲C羅賽季通殺沙特聯(lián)對手,達(dá)成聯(lián)賽百球大關(guān)

      不老神話!41歲C羅賽季通殺沙特聯(lián)對手,達(dá)成聯(lián)賽百球大關(guān)

      星耀國際足壇
      2026-05-09 22:14:18
      名記:如果米切爾今夏進(jìn)入交易市場,火箭將積極爭取將其引進(jìn)

      名記:如果米切爾今夏進(jìn)入交易市場,火箭將積極爭取將其引進(jìn)

      懂球帝
      2026-05-09 12:00:08
      德云社弟子大洗牌!3人自斷后路,岳云鵬邊緣,燒餅一哥地位穩(wěn)了

      德云社弟子大洗牌!3人自斷后路,岳云鵬邊緣,燒餅一哥地位穩(wěn)了

      笑談歷史阿晡
      2026-05-08 10:07:35
      小米“YU9”胎死腹中,將被全新獨(dú)立子品牌“尋天”替代

      小米“YU9”胎死腹中,將被全新獨(dú)立子品牌“尋天”替代

      新浪財(cái)經(jīng)
      2026-05-09 00:52:13
      籃球名宿鄭永剛現(xiàn)狀:定居廣東,是一線教練,1.8米女兒顏值很高

      籃球名宿鄭永剛現(xiàn)狀:定居廣東,是一線教練,1.8米女兒顏值很高

      素衣讀史
      2026-05-09 22:17:07
      自民黨高層訪華無果后,日媒:高市打算親自訪華,中方態(tài)度堅(jiān)決

      自民黨高層訪華無果后,日媒:高市打算親自訪華,中方態(tài)度堅(jiān)決

      說歷史的老牢
      2026-05-08 14:20:33
      陜西這個(gè)“石破天驚”的發(fā)現(xiàn),將要改寫歷史?它比夏朝還早幾百年

      陜西這個(gè)“石破天驚”的發(fā)現(xiàn),將要改寫歷史?它比夏朝還早幾百年

      娛樂圈的嗶嗶王
      2026-05-09 13:38:28
      妹子,你露個(gè)大白胸脯,在這兒干什么呢?

      妹子,你露個(gè)大白胸脯,在這兒干什么呢?

      飛娛日記
      2026-04-18 10:48:09
      上汽奧迪高管炮轟行業(yè)亂象:很多品牌用特調(diào)車刷圈速 輪胎換過、懸掛改過、軟件單獨(dú)寫

      上汽奧迪高管炮轟行業(yè)亂象:很多品牌用特調(diào)車刷圈速 輪胎換過、懸掛改過、軟件單獨(dú)寫

      快科技
      2026-05-09 15:40:14
      莫拉蒂:坎通納飛踹球迷后我內(nèi)心竊喜,以為國米能簽下他了

      莫拉蒂:坎通納飛踹球迷后我內(nèi)心竊喜,以為國米能簽下他了

      懂球帝
      2026-05-09 22:33:14
      其他方面的表現(xiàn)都相當(dāng)不錯(cuò),但馬刺強(qiáng)力投手的手感依然沒有恢復(fù)?

      其他方面的表現(xiàn)都相當(dāng)不錯(cuò),但馬刺強(qiáng)力投手的手感依然沒有恢復(fù)?

      稻谷與小麥
      2026-05-09 22:58:42
      19時(shí)48分27秒,我國正式進(jìn)入……

      19時(shí)48分27秒,我國正式進(jìn)入……

      譚老師地理大課堂
      2026-05-06 14:52:48
      U17國足對決日本!董路:上去就干拼到抽筋 像爺們戰(zhàn)死沙場不要慫

      U17國足對決日本!董路:上去就干拼到抽筋 像爺們戰(zhàn)死沙場不要慫

      風(fēng)過鄉(xiāng)
      2026-05-09 08:18:32
      2026-05-09 23:48:49
      互聯(lián)網(wǎng)思想 incentive-icons
      互聯(lián)網(wǎng)思想
      AI時(shí)代,互聯(lián)網(wǎng)思想觀察
      2450文章數(shù) 16909關(guān)注度
      往期回顧 全部

      科技要聞

      美國政府強(qiáng)力下場 蘋果英特爾達(dá)成代工協(xié)議

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現(xiàn)身

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現(xiàn)身

      體育要聞

      成立128年后,這支升班馬首奪頂級聯(lián)賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認(rèn)不出!

      財(cái)經(jīng)要聞

      多地號召,公職人員帶頭繳納物業(yè)費(fèi)

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態(tài)度原創(chuàng)

      房產(chǎn)
      手機(jī)
      本地
      數(shù)碼
      軍事航空

      房產(chǎn)要聞

      低價(jià)甩賣!海口這個(gè)地標(biāo)商業(yè),無人接盤!

      手機(jī)要聞

      華為Mate 90首發(fā)!鴻蒙7定檔6月:和iOS安卓三分天下

      本地新聞

      用蘇繡的方式,打開江西婺源

      數(shù)碼要聞

      有鴻蒙·更美的——全球首臺鴻蒙智選美的智能空調(diào)上市

      軍事要聞

      美伊突然再次交火 伊朗外長:戰(zhàn)爭準(zhǔn)備程度是1000%

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: av黄色| 免费播放岛国影片av| 河北真实伦对白精彩脏话| 日本乱子人伦在线视频| 国产SUV精品一区二区33| 欧美日韩国产在线人成app| 日韩?人妻?无码?制服| 国产中文字幕精品视频| 亚洲午夜性猛春交XXXX| 乱人伦人妻中文字幕不卡| 中文字幕无码视频手机免费看| 精品人妻中文无码av在线| 欧美人与动牲交a免费| 久久中文字幕国产精品| 免费无码观看的AV在线播放| 亚洲精品无码日韩国产不卡av| 国产精品自在线拍国产| 67194欧洲女人| 无码天堂成人| 国产熟妇按摩3p高潮大叫| 欧美怡春院一区二区三区 | 人人狠狠久久亚洲综合88| 六十路老熟妇乱子伦视频| 人人添人人妻人人爽夜欢视频| 潮喷在线播放| 国产日韩精品欧美一区灰| 国产精品999在线| 日韩视频一区二区三区| 中文字幕无码人妻| 熟妇人妻任你躁在线视频| 国产刺激爽爽在线视频| 欧洲精品一二三在线| 尤物在线观看视频免费| 欧洲精品亚洲精品日韩专区| 午夜A理论片在线播放| 欧美成人黄在线观看| 男女做爱网站| 国内不卡一区二区三区| 成人福利午夜A片公司| 日韩,人妻,制服,综合| 8av国产精品爽爽ⅴa在线观看|