<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      統(tǒng)治AI十年的Transformer,要被親爹親手砸碎?

      0
      分享至


      新智元報(bào)道


      【新智元導(dǎo)讀】80分鐘的拳擊式辯論!Transformer聯(lián)合發(fā)明人親自下場(chǎng)為自己的作品辯護(hù),對(duì)面三位挑戰(zhàn)者直指五大死穴。這是AI架構(gòu)十年來(lái)最硬的一次正面交鋒。統(tǒng)治AI黃金十年的架構(gòu),地基是不是已經(jīng)松了?

      Transformer憑什么統(tǒng)治AI這么久?

      長(zhǎng)上下文、記憶、推理這些短板,新架構(gòu)真能突破嗎?

      所謂「后Transformer」,到底是更強(qiáng)的記憶機(jī)制、更高效的序列建模,還是從訓(xùn)練到系統(tǒng)都得換一套?

      5月5日,舊金山,Pathway搞了場(chǎng)拳擊擂臺(tái)式的辯論賽。

      這不是比喻,是真擂臺(tái)。


      一邊是Transformer的共同發(fā)明人?ukasz Kaiser,另一邊是主張「后Transformer時(shí)代」的新架構(gòu)派。


      注意一個(gè)細(xì)節(jié):注意力機(jī)制的兩位聯(lián)合發(fā)明人,「Transformer八子」之一Llion Jones,坐在了Kaiser的對(duì)立面。。

      話題就一個(gè):下一代AI架構(gòu)到底長(zhǎng)什么樣。

      現(xiàn)場(chǎng)坐滿研究者、創(chuàng)業(yè)者和投資人。輸贏不靠投票,靠「clapometer」——拍手計(jì)分器,誰(shuí)掌聲響誰(shuí)贏。

      這是一場(chǎng)刀刀見紅、指名道姓的硬碰硬。

      當(dāng)裁判宣布比賽開始,統(tǒng)治了全球AI架構(gòu)近十年的神話,第一次被它的締造者親自拉上了被告席進(jìn)行自衛(wèi)辯護(hù)。

      這場(chǎng)思想界的重量級(jí)對(duì)決,從Transformer的五大死穴開始。

      苦Transformer久矣

      五大死穴

      ?ukasz Kaiser的身份讓這場(chǎng)辯論的分量直接拉滿。

      他是Transformer的聯(lián)合發(fā)明人。

      2017年那篇改變整個(gè)AI格局的論文「Attention Is All You Need」,他是作者之一。之后他參與了ChatGPT、GPT系列和o1的實(shí)際工程開發(fā)。

      他是當(dāng)事人。他今天坐在這里,是為自己的作品做辯護(hù)。

      對(duì)面的三位挑戰(zhàn)者,來(lái)頭同樣不小。

      Llion Jones,Transformer的另一位聯(lián)合發(fā)明人,Sakana AI聯(lián)合創(chuàng)始人。

      Adrian Kosowski,Pathway首席科學(xué)官,BDH架構(gòu)的發(fā)明人。

      Matthias Lechner,Liquid AI首席技術(shù)官,MIT液態(tài)神經(jīng)網(wǎng)絡(luò)的共同發(fā)明人。


      這本身就是技術(shù)史上極其罕見的畫面。創(chuàng)造同一個(gè)東西的人,對(duì)它的未來(lái)產(chǎn)生了根本性分歧。

      Kaiser開場(chǎng)用了一個(gè)類比。

      他說(shuō)Transformer的注意力機(jī)制,就像圖書管理員的卡片索引系統(tǒng)

      你走進(jìn)圖書館,說(shuō)出你要找的內(nèi)容(query),管理員翻開卡片目錄(key),找到對(duì)應(yīng)的書架位置,把書取出來(lái)交給你(value)。


      簡(jiǎn)潔。高效。全局檢索。

      但挑戰(zhàn)者們要問的是:如果這個(gè)圖書館有一億本書呢?每次查詢都要翻遍所有卡片,這個(gè)系統(tǒng)還能撐住嗎?

      這就是O(n2),懸在Transformer頭上的達(dá)摩克利斯之劍。

      三位挑戰(zhàn)者沒有籠統(tǒng)地說(shuō)「Transformer不行了」。他們拆出了五個(gè)具體的、當(dāng)前Transformer架構(gòu)無(wú)法在設(shè)計(jì)層面解決的開放難題。

      每一個(gè)都直指要害。


      挑戰(zhàn)者們最尖銳的隱喻,直指Transformer的記憶與持續(xù)學(xué)習(xí)缺陷:「土撥鼠之日」

      在電影《土撥鼠之日》中,主角每天醒來(lái),世界都會(huì)重置,昨天的記憶蕩然無(wú)存。


      目前,Transformer也是如此。

      每一次推理(Forward Pass),它的權(quán)重(Weights)都是完全凍結(jié)的。

      哪怕你今天跟它聊了十個(gè)小時(shí),它學(xué)到了絕妙的新知識(shí),在下一次會(huì)話啟動(dòng)時(shí),它依然是一個(gè)失憶的白癡。

      現(xiàn)在工業(yè)界為了解決這個(gè)問題,拼命往里塞RAG(檢索增強(qiáng)生成)、長(zhǎng)上下文(KV Cache)。

      但這根本不是架構(gòu)級(jí)的解法,而是用昂貴的算力在傷口上貼創(chuàng)可貼。

      五大死穴,每一個(gè)單拎出來(lái)都不是小事。合在一起,構(gòu)成了一張完整的起訴書。

      但起訴書不等于判決書。

      Kaiser的底牌

      你行你上,拿曲線說(shuō)話

      面對(duì)五大攻擊,Kaiser沒有一一辯駁。

      他沒說(shuō)O(n2)不是問題,沒說(shuō)災(zāi)難性遺忘不存在,沒說(shuō)Transformer完美無(wú)缺。

      他拋出了一句話,成了整場(chǎng)辯論的核心:

      除非Post-Transformer證明更好的scaling曲線,否則Transformer仍然是主流。


      這句話的殺傷力在于,它把舉證責(zé)任推回了挑戰(zhàn)者。

      什么是scaling曲線?

      簡(jiǎn)單說(shuō),就是「投入更多算力和數(shù)據(jù),AI能力提升多少」。


      Transformer統(tǒng)治近十年,最核心的原因不是它沒缺陷,而是它的scaling曲線至今沒被任何架構(gòu)超越。

      這是OpenAI敢砸?guī)资畠|美元訓(xùn)練GPT、Anthropic持續(xù)擴(kuò)大Claude規(guī)模的底氣。

      Kaiser的邏輯極其清晰:

      你說(shuō)Transformer有五個(gè)問題?我同意。

      但有問題的東西和應(yīng)該被替換的東西之間,有一道鴻溝??邕^它,你需要的不是五篇論文,是一條更好的scaling曲線。

      然后,他展開了更具體的辯護(hù),而且?guī)еこ态F(xiàn)場(chǎng)的鐵銹味。

      并行性是硬道理。

      上周,在最新的Nvidia硬件上,Kaiser重新實(shí)現(xiàn)了Transformer和幾個(gè)老式RNN,并做了對(duì)比。

      非常小的GRU,比一個(gè)大得多的Transformer還要慢50倍。


      RNN確實(shí)優(yōu)美,但它的順序執(zhí)行特性在當(dāng)前硬件上就是一場(chǎng)災(zāi)難。

      如果真存在一種更好的架構(gòu),你需要用50倍的時(shí)間去證明它——而大多數(shù)實(shí)驗(yàn)室沒有這個(gè)耐心。

      十年的工程積累。

      不只是GPU優(yōu)化,編譯器、訓(xùn)練框架(PyTorch、JAX)、推理引擎(vLLM、TensorRT-LLM)、量化工具——整個(gè)AI工程棧都圍繞Transformer搭建。


      換架構(gòu)意味著這一切都要重來(lái)。

      隱式的「持續(xù)學(xué)習(xí)」,早已發(fā)生。

      Kaiser指出,Transformer在大規(guī)模預(yù)訓(xùn)練后,前向傳播中表現(xiàn)出的上下文學(xué)習(xí)(In-Context Learning),在數(shù)學(xué)上其實(shí)完美模擬了反向傳播中的梯度下降。


      換句話說(shuō),你們說(shuō)它不會(huì)學(xué),它其實(shí)在以另一種方式偷偷地學(xué)。

      他的辯護(hù)不是「Transformer永遠(yuǎn)是最優(yōu)解」,而是「Transformer現(xiàn)在是最優(yōu)解,除非你證明不是」。

      然后他甩出一句讓對(duì)面啞口無(wú)言的話:

      也許找到下一個(gè)架構(gòu)的,恰恰會(huì)是Transformer本身——而不是你們。

      全場(chǎng)笑聲。

      但大家都聽出來(lái)了:這是認(rèn)真的。

      AI:無(wú)人可擋的光明未來(lái)

      Kaiser的結(jié)束陳詞,沒有說(shuō)「Transformer永遠(yuǎn)是最優(yōu)解」。他說(shuō)的是:「目前,Transformer仍然贏?!?/p>

      「目前」這個(gè)詞,是他留給挑戰(zhàn)者的唯一縫隙。

      更微妙的是,他親手交出了一件本屬于自己陣營(yíng)的武器。

      后Transformer陣營(yíng)此前最大的短板,是「缺乏大算力的工程和硬件驗(yàn)證」——新架構(gòu)跑得慢、沒人愿意為它改芯片。但Kaiser自己承認(rèn),這道壁壘正在被瓦解:

      現(xiàn)在,AI Agent已經(jīng)學(xué)會(huì)了寫極高難度的CUDA和Triton核函數(shù)。


      即便一個(gè)新架構(gòu)最初運(yùn)行慢50倍,你只需要把代碼丟給Agent,它就能在短時(shí)間內(nèi)幫你優(yōu)化出幾乎能榨干GPU算力的專用內(nèi)核。

      硬件彩票的壁壘,正在被智能體開發(fā)生態(tài)自己砸碎。


      這意味著,一旦有人在百萬(wàn)Token、千萬(wàn)Token的極長(zhǎng)上下文任務(wù)上,用Post-Transformer架構(gòu)跑出一條更漂亮的困惑度曲線,哪怕只有一點(diǎn)點(diǎn)優(yōu)勢(shì),也會(huì)在scaling的放大鏡下,形成對(duì)舊帝國(guó)的致命一擊。

      Kaiser甚至主動(dòng)提議:應(yīng)該建立一個(gè)統(tǒng)一的測(cè)試標(biāo)準(zhǔn)——用困惑度衡量所有架構(gòu)在同等條件下的學(xué)習(xí)能力。

      「我們應(yīng)該在這件事上達(dá)成共識(shí),然后各自去證明自己的架構(gòu)更好?!?/p>

      這句話的潛臺(tái)詞是:挑戰(zhàn)賽正式開始。

      而Jones的最后一句話更直接:

      今天我沒有得到任何理由讓我懷疑自己的信念:有更好的東西存在。當(dāng)那個(gè)突破到來(lái),我們所有人都會(huì)進(jìn)入后Transformer時(shí)代,?ukasz也不例外——因?yàn)樗麑脮r(shí)別無(wú)選擇。

      這場(chǎng)「拳擊賽」看似戲謔,但它的勝負(fù)直接決定了Claude、ChatGPT等硅谷雙雄的底層地基是否需要被全部推倒重建。

      如果后Transformer(Post-Transformer)陣營(yíng)擁有更優(yōu)越的Scaling Law(縮放定律)曲線,整個(gè)人類通往AGI的物理路線圖都將被改寫。

      參考資料:

      https://x.com/probnstat/status/2057522470760914957?s=20

      https://www.youtube.com/watch?v=hCjoMLuCuLQ

      編輯:大衛(wèi)

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      白玉蘭提名名單炸鍋:3人實(shí)至名歸,2人成功翻身,1人爭(zhēng)議最大

      白玉蘭提名名單炸鍋:3人實(shí)至名歸,2人成功翻身,1人爭(zhēng)議最大

      橙星文娛
      2026-05-27 09:46:15
      山西沁源礦難背后:淪為空文的141項(xiàng)煤礦安全標(biāo)準(zhǔn),與“通風(fēng)報(bào)信”式檢查

      山西沁源礦難背后:淪為空文的141項(xiàng)煤礦安全標(biāo)準(zhǔn),與“通風(fēng)報(bào)信”式檢查

      大風(fēng)新聞
      2026-05-26 17:48:27
      向華強(qiáng)揭向太老底,做手術(shù)前將隱藏資產(chǎn)全都告知老公,事后又要回

      向華強(qiáng)揭向太老底,做手術(shù)前將隱藏資產(chǎn)全都告知老公,事后又要回

      嫹筆牂牂
      2026-05-27 07:45:08
      錢從哪里來(lái)?拆解追覓科技的資本謎局

      錢從哪里來(lái)?拆解追覓科技的資本謎局

      YOUNG財(cái)經(jīng)
      2026-05-26 21:55:18
      這跟不穿有啥區(qū)別?戛納閉幕式,女星下垂、副乳突出,露的好辣眼

      這跟不穿有啥區(qū)別?戛納閉幕式,女星下垂、副乳突出,露的好辣眼

      天馬幸福的人生
      2026-05-26 11:05:02
      新出行幫你選 | 總有一個(gè)配置為你而來(lái) 華境 S 保姆級(jí)購(gòu)車指南

      新出行幫你選 | 總有一個(gè)配置為你而來(lái) 華境 S 保姆級(jí)購(gòu)車指南

      新出行
      2026-05-27 10:00:00
      “從6元跌到1元,還是賣不出”

      “從6元跌到1元,還是賣不出”

      南方都市報(bào)
      2026-05-26 22:17:30
      越扒越有,景甜又被曝猛料,富商要求2億和解費(fèi),張繼科太無(wú)辜

      越扒越有,景甜又被曝猛料,富商要求2億和解費(fèi),張繼科太無(wú)辜

      八斗小先生
      2026-05-26 11:25:19
      張雪:攝像師出去,就咱倆。臺(tái)灣館長(zhǎng):你這是要把我當(dāng)自己人啊

      張雪:攝像師出去,就咱倆。臺(tái)灣館長(zhǎng):你這是要把我當(dāng)自己人啊

      童叔不飆車
      2026-05-27 12:22:48
      航天員黎家盈年收入多少?回來(lái)后享受什么待遇?

      航天員黎家盈年收入多少?回來(lái)后享受什么待遇?

      混沌錄
      2026-05-26 22:05:52
      雷軍回應(yīng)武契奇說(shuō)小米車很漂亮但買不起:總統(tǒng)先生 YU7標(biāo)準(zhǔn)版定價(jià)23.35萬(wàn)

      雷軍回應(yīng)武契奇說(shuō)小米車很漂亮但買不起:總統(tǒng)先生 YU7標(biāo)準(zhǔn)版定價(jià)23.35萬(wàn)

      快科技
      2026-05-27 01:13:07
      雷霆3-2馬刺,一場(chǎng)丑陋的勝利!亞歷山大32+9,文班空砍20分6板

      雷霆3-2馬刺,一場(chǎng)丑陋的勝利!亞歷山大32+9,文班空砍20分6板

      籃球掃地僧
      2026-05-27 12:18:56
      神操作!印度近50℃高溫下電工給變壓器澆水降溫:半小時(shí)一次

      神操作!印度近50℃高溫下電工給變壓器澆水降溫:半小時(shí)一次

      快科技
      2026-05-26 19:36:07
      血債驚全球!47條人命炸穿底線!中方怒斥:這事沒完!

      血債驚全球!47條人命炸穿底線!中方怒斥:這事沒完!

      達(dá)文西看世界
      2026-05-26 15:42:43
      咱們的治安水平,在藍(lán)星上來(lái)說(shuō),其實(shí)是不正常的

      咱們的治安水平,在藍(lán)星上來(lái)說(shuō),其實(shí)是不正常的

      占理兒
      2026-05-25 20:10:03
      上海最燥拆遷大爺:夜夜笙歌女友不斷,70歲還一年下400次歌廳…

      上海最燥拆遷大爺:夜夜笙歌女友不斷,70歲還一年下400次歌廳…

      媒體人溪婉
      2026-05-27 12:25:28
      四年一到必須走人,這才是中國(guó)最“狠”的鐵飯碗

      四年一到必須走人,這才是中國(guó)最“狠”的鐵飯碗

      復(fù)轉(zhuǎn)這些年
      2026-05-26 19:09:41
      中國(guó)被曝限制AI人才出境,阿里DeepSeek核心人員出國(guó)要先獲批

      中國(guó)被曝限制AI人才出境,阿里DeepSeek核心人員出國(guó)要先獲批

      桂系007
      2026-05-26 23:43:08
      泳渡賽女選手隱私照被直播,當(dāng)事人最新發(fā)聲:正處于哺乳期,很震驚

      泳渡賽女選手隱私照被直播,當(dāng)事人最新發(fā)聲:正處于哺乳期,很震驚

      19樓
      2026-05-27 08:16:56
      當(dāng)務(wù)之急不是撤離外交人員,而是通過外交制止俄方暴行

      當(dāng)務(wù)之急不是撤離外交人員,而是通過外交制止俄方暴行

      李未熟擒話2
      2026-05-27 09:11:43
      2026-05-27 14:28:49
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
      15317文章數(shù) 66892關(guān)注度
      往期回顧 全部

      科技要聞

      韜定律:全球在卷納米數(shù) 華為換了一把尺子

      頭條要聞

      258畝薺菜地遭數(shù)百人哄搶造成損失約70萬(wàn) 種植戶發(fā)聲

      頭條要聞

      258畝薺菜地遭數(shù)百人哄搶造成損失約70萬(wàn) 種植戶發(fā)聲

      體育要聞

      這群老阿姨,是最硬核的馬刺球迷

      娛樂要聞

      小S曬歸寧宴舊照,大S穿吊帶裙扎丸子頭

      財(cái)經(jīng)要聞

      ST巖石退市背后:A股“炒殼”時(shí)代終結(jié)

      汽車要聞

      極狐問道V9今日將正式上市 搭載華為雪鸮增程系統(tǒng)

      態(tài)度原創(chuàng)

      手機(jī)
      旅游
      本地
      房產(chǎn)
      公開課

      手機(jī)要聞

      非洲Q1排名:傳音持續(xù)稱王,小米第三,榮耀第四

      旅游要聞

      暑期入境游訂單漲超兩成 這個(gè)夏天外國(guó)人不再滿足于“到此一游”

      本地新聞

      用剪紙的方式,打開江蘇揚(yáng)州

      房產(chǎn)要聞

      終極塔尖資產(chǎn)!這可能是海南今年最出圈的豪宅!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 99视频在线精品国自产拍 | 亚洲成在人天堂一区二区| 亚洲精品综合在线| 国产欧美在线观看一区| 无码人妻精品一区二区三区夜夜嗨| 国产精品中文字幕观看| 国产白浆一区二区三区| 日韩人妻久久中文字幕| 综合人妻久久一区二区精品| 亚洲成A人片在线观看WWW| 免费AA片在线观看视频| 深夜在线观看免费av| 欧美精品国产综合久久| 久久毛片少妇高潮| av制服丝袜白丝国产网站| 欧美777| 亚洲精品色哟哟一区二区| 久久久久青草线综合超碰| 九九热视频精品在线| 久久精品丝袜高跟鞋| 亚洲AV国产福利精品在现观看| 欧美一区二区日韩国产| 亚洲成AV人不卡无码影片| 国产亚洲无日韩乱码| 三级电影网址| 亚洲a成人无m网站在线| 性一交一乱一伦一| 91九色在线观看| 久久精品视频只有这里| 18禁免费无码无遮挡不卡网站| 日本高清在线观看WWW色| 99精品视频在线| 中文字幕人妻熟女在线| 强伦姧人妻三上悠亚中文字幕| 99久久婷婷国产综合精品青草漫画| 国内无码| 欧美日韩一区免费高清| 亚洲 自拍 另类小说综合图区| 亚洲91视频| av在线日韩| 无码伊人久久大杳蕉中文无码|