<ruby id="9ue20"></ruby>

国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线

<del id="xseay"></del>

<pre id="xseay"><option id="xseay"></option></pre>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

伯克利神作背刺OpenAI：持續學習才是真神！

2026-05-19 06:58:08　來源: 新智元

北京舉報

0

分享至

新智元報道

【新智元導讀】伯克利等發布FST框架：通過快慢分層解決大模型持續學習死局。

AI工程師Dan McAteer大膽預言，2026年持續學習（continual learning）即將爆發！

通過記憶/上下文快速適應+權重緩慢調整的分層機制，模型保留可塑性避免災難性遺忘，這一突破遠超推理變革1000倍。

這是最近的伯克利等機構的AI實驗給他的勇氣。

他們讓同一個大語言模型連續學三個任務：

先學需要多跳檢索的事實核驗HoVer；再學代碼推理CodeIO；最后學物理題Physics。

每個任務訓200步就切換，模擬真實世界里「任務在不斷變化」的學習場景。

用主流的強化學習(RL)范式訓練，模型在第一關HoVer上學會了。到了第二關CodeIO完全卡住。學不動。

換上他們提出的新框架FST（Learning，Fast and Slow），同一個模型，三關都能學會。

這是AI行業過去兩年集體押注的某個方向，第一次顯露出它的天花板。

標題：Learning, Fast and Slow: Towards LLMs That Adapt Continually

預印本：https://arxiv.org/abs/2605.12484

項目主頁：https://gepa-ai.github.io/gepa/blog/2026/05/11/learning-fast-and-slow/

如果我們集體押注的那條路，正在讓模型變成「會做題但學不會新東西的天才」，那我們押的到底是AI，還是一只越來越精致的鸚鵡？

「推理」成了AI圈的全部敘事

過去兩年，幾乎所有頭部實驗室都在做同一件事：讓模型想得更深。

OpenAI的o系列、DeepSeek的R1、Claude的思考模式這些產品形態各異，但內核都是一個共識：推理能力是AI的下一關。

這個共識強到什么程度？

強到你今天去一線投資人那里，如果不能講清楚自己怎么「做推理」（reasoning），連第一輪的門都進不去。

強到我們已經忘了去問：推理，到底是什么？

打一個比方，一個學生能把任何一道高考題想得無比深，推理鏈條無懈可擊，邏輯結構滴水不漏。

但有一個前提，他從初中畢業那天起，就沒再學過任何新知識。所有的知識儲備，都停留在他16歲那年的狀態。

你愿意把他的能力，稱為「智能」嗎？

這個比方可不是修辭。這是當前最先進LLM的真實處境。

GPT-5、Claude、Gemini等所有這些你今天能用上的模型，它們在每一次新對話開始時，都是一個昨天畢業、今天醒來、忘了一切的天才。

它們可以在一道題上推理得越來越深，但只要對話框一關，記憶就會清空，回到出廠設置般的「天才狀態」。

它們是在推理的巨石上反復攀爬的數字西西弗斯——爬得越來越高，起點卻永遠是山腳。

問題是，為什么我們一直沒察覺？

在AI歷史上失敗了30年，大家不敢再期待

為什么GPT不會從你和它的對話里學到任何東西？為什么你昨天教它的東西，今天打開一個新對話，它就完全不記得？

這是一堵30年沒人推倒的墻。

AI領域的「持續學習」(Continual Learning)，研究怎么讓模型像人一樣，不斷「溫故知新，吐故納新」。

這個問題從1990年代就在被研究，然后在三個老對手面前反復失?。?/p>

第一個對手叫「首因偏差」（primacy bias），早期數據會主導模型最終的策略。

模型學會的第一件事，會頑固地塑造它后面學所有事情的方式。

第二個對手叫「損失函數彈性」（loss of plasticity），即模型每多學一個任務，可塑性就降低一分。

到某個臨界點，它就再也學不會任何新東西了。

第三個對手最有名，叫「災難性遺忘」(catastrophic forgetting)——你教模型學新任務，它的舊能力「啪」地一下塌掉。

教它做數學題，它就忘了怎么寫代碼。教它寫代碼，它就忘了怎么對話。

這三個問題，在小模型時代就存在。

到了大模型時代，它們沒有變小，只是變得不那么醒目。

因為我們干脆放棄了讓模型「持續學習」，只在訓練時灌一次知識，部署后就凍結。

我們今天用的所有LLM，本質上都是凍結的天才。

聰明，但不能再聰明。強大，但活在一個永恒的當下。

這就是為什么大模型時代，持續學習一直是個「聽上去很美但誰也不敢碰」的話題。

試過的人都被這堵墻撞回來過。

但最近，這堵墻被一組研究者推了一道縫——他們沒有發明新算法，他們做了一件更根本的事：重新分工。

讓模型像大腦一樣，快慢分層

這是Databricks工程力+伯克利系統派+經典ML學派綁在一起的項目。

作者豪華，值得一看：Matei Zaharia(Databricks聯合創始人，Apache Spark作者)、Joseph Gonzalez(伯克利，vLLM作者之一)、Inderjit Dhillon(UT Austin與Google，ML領域元老級人物)——以及一群伯克利的博士。

當這三股力量同時押注一個方向，你就該認真看一眼。

他們提出的框架叫FST(Fast-Slow Training，快慢訓練)。核心思想極其樸素：

不要讓一組參數同時承擔兩個矛盾職能。

傳統RL訓練里，模型只有一組參數。

它既要「快速適應當前任務的特殊性」，又要「保留通用的推理能力」。

這兩件事天然沖突：前者要漂移，后者要穩定。

FST的做法是：把這兩件事分到兩套「權重」上。

兩者交替更新——每隔一段時間用RL調一下慢權重，同時用一個叫GEPA的prompt優化器自動演化快權重。

你的大腦，正是這樣運作的。

在博客里，GEPA團隊直接引用了「互補學習系統」理論(Complementary Learning Systems)：

你的海馬體，是大腦的「快權重」，它在幾分鐘內就能記住今天下午開會時同事說的那句話；

你的新皮層，是「慢權重」，它用幾個月甚至幾年的時間，慢慢把這些細節里真正值得納入長期結構的東西沉淀下來。

新記憶，從來沒有直接寫進大腦長期結構。

它先在海馬體里「暫存」，在睡眠中被反復回放，最終只有極小一部分被慢慢滲透進新皮層——剩下的，你忘了。

FST第一次讓大模型擁有了這種分層結構。

數字也很漂亮。

FST在CodeIO任務上達到RL同等性能，只用了1/3的訓練步數——數據效率3倍。

在匹配準確率的情況下，FST訓出來的模型與基礎模型的KL散度(衡量分布偏移)比RL低70%——遺忘減少70%。

最關鍵的是可塑性測試：訓完Math任務后，再訓HoVer-hard，RL訓過的模型幾乎完全學不動新任務(可塑性塌縮到近0)，FST訓過的模型，幾乎恢復到基礎模型水平繼續學。

這是數量級躍遷。

當然，FST不是一個完美的算法。GEPA和CISPO可以被任何其他的prompt優化器和RL算法替換，它的工程實現還很初步。

重要的不是FST這個具體方法能不能跑通——重要的是它提出的"快慢分工"作為一種范式語言，第一次讓持續學習從空想變成可工程化的方向。

還沒形成的共識

共識正在形成，但還沒形成。

這才是真實狀態。

業界給的時間表是另一套。

Ilya Sutskever認為：超級智能應被重新定義為持續學習器，而非已完成的AGI。

他估算continual learning還要5到20年。

Ilya一向比業界共識慢，但每次保守判斷都比業界更精準。5到20年的區間意味著，即使是 Ilya 也承認這件事會被解決，分歧只在節奏。

Karpathy更微妙。

在他看來，continual learning是真問題，用現有路徑解決還不夠。他的懷疑停在執行層面，方向層面沒有反對。

但事情已經動了。

推理時代是2024年開局、2026 年收尾。

持續學習時代是2026年開局，下一輪博弈不會等到2027年。

參考資料：

https://arxiv.org/pdf/2605.12484

https://gepa-ai.github.io/gepa/blog/2026/05/11/learning-fast-and-slow/

https://x.com/daniel_mac8/status/2055975372345274519

編輯：KingHZ David

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Clawdbot進化速度離譜：突然開口說話，給自己捏臉，還能炒股砍價

DeepTech深科技 2026-01-29 18:14:10
600 跟貼 600
00后小孩哥10天AI編程，陳天橋24小時砸3000萬！靠大四作業當上CEO

36氪 2026-03-08 17:24:08
26 跟貼 26

當工程師拒絕更聰明的模型：AI推理大戰，OpenAI換了一把"槍"

華爾街見聞官方 2026-05-18 20:08:00
0 跟貼 0

世界模型的門檻，谷歌可能邁過去了

鈦媒體APP 2026-05-18 15:14:36
15 跟貼 15
當AI從租GPU走向賣Token，誰會賺到真正的錢？

虎嗅APP 2026-05-19 00:08:10
11 跟貼 11

王云鶴眼中的Harness：復雜優化問題，AGI靈魂爭奪之戰

機器之心Pro 2026-05-18 18:15:52
0 跟貼 0

馬斯克訴OpenAI敗訴，陪審團裁定起訴超時效

華爾街見聞官方 2026-05-19 06:51:29
0 跟貼 0
安心養蝦！從OpenClaw 看云上AI安全落地路徑

量子位 2026-04-18 19:55:39
0 跟貼 0

LLM數據量大管飽，機器人數據卻連1%的起跑線都沒夠到？

量子位 2026-04-13 20:54:19
0 跟貼 0
亦莊機器人馬拉松現場名場面合集

量子位 2026-04-20 00:34:54
0 跟貼 0
Anthropic的AI讀心術，讓人類讀懂大模型在想啥

量子位 2026-05-10 23:00:57
1 跟貼 1
百度沈抖自曝：老忘吃藥，用AI做了個小程序

量子位 2026-03-27 11:25:23
0 跟貼 0
大模型的魅力在于突發涌現的能力

量子位 2025-12-11 03:38:02
0 跟貼 0
荒野求生（機器狗全自主版），2025ATEC挑戰真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
讓你的龍蝦秒變電影《Her》里的Samantha

量子位 2026-03-23 20:37:07
0 跟貼 0
MIT研究生用NotebookLM兩天學完一學期課程

量子位 2026-03-22 10:50:49
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
Agent輸出到底該用誰？卡帕西轉發：試試讓AI輸出HTML

量子位 2026-05-13 07:19:50
0 跟貼 0
大神程序員蒸餾自己，用16個skill給AI注入軟件工程之魂

量子位 2026-05-12 03:08:58
0 跟貼 0
如何點亮小龍蝦的牛馬技能包?

量子位 2026-03-18 12:51:26
0 跟貼 0
AI Agent是科技革命中的一次真正的范式轉移

量子位 2026-04-03 22:52:35
0 跟貼 0
這個時代必須以Agent為中心：三個趨勢回顧

量子位 2026-04-05 02:14:15
0 跟貼 0
博士生如何用龍蝦做知識管理？歡迎圍觀！

量子位 2026-03-26 23:23:30
0 跟貼 0
對談樓天城：Harness會成為AI時代最關鍵的能力之一

量子位 2026-05-06 15:41:08
0 跟貼 0
陶哲軒：AI不能全用，深度思考不行

量子位 2026-03-19 01:35:49
0 跟貼 0
早報｜蘋果開啟WWDC邀請，將公布蘋果AI新進展/問界M9設計師點贊理想L9內飾/國家反詐中心App上線「AI內容鑒定」

愛范兒 2026-05-19 08:15:32
0 跟貼 0
ICML 2026 | 只用少量Thinking Tokens，大模型依然能深度思考

機器之心Pro 2026-05-18 18:13:02
0 跟貼 0
LLM 僅靠自身就能增強推理？SePT 給出簡潔在線自訓練范式

機器之心Pro 2026-04-22 11:01:55
0 跟貼 0
讓大模型邊想邊說：這篇文章把「何時開口」變成可學習策略

機器之心Pro 2026-05-18 14:49:11
0 跟貼 0
天壇竟是古代宇宙模型？建筑里藏著千年哲學密碼

開著車去流浪 2026-05-17 00:36:37
7 跟貼 7
現在的小學題真難，和以前的算法不一樣！

娛糖主 2026-05-17 19:36:32
1 跟貼 1
Claude Code 源碼泄露了，有人用Python復刻了一個極簡版

機器之心Pro 2026-04-02 11:30:10
0 跟貼 0
比比皆是的下一個創新點：Prompt Learning進化到SIPDO閉環自進化

機器之心Pro 2026-02-28 11:17:43
0 跟貼 0
武漢一公司推出“包車送學”服務，一個月398元另需承擔實時打車費

南陽日報 2026-05-18 18:21:29
43 跟貼 43
數學天才輕松解出6+6-6-6×6=？

狂戰獠牙 2026-05-15 02:46:52
1 跟貼 1
哈登拿9分也贏了，有4個正確策略，一招效果翻倍，要沖冠了

體壇大辣椒 2026-05-18 13:04:02
25 跟貼 25
“賣一度電，虧一度電” ！廣西146家售電企業，平均每家虧損442萬元

中國能源網 2026-05-18 11:34:14
2793 跟貼 2793
從“假努力”到伯克利！南外仙林學子宋忻翼的“去模板化”逆襲之路

937江蘇新聞廣播 2026-05-15 20:34:16
0 跟貼 0
把機器人關節裝在自己腿上，男子做出了賽博朋克假肢

心開動漫 2026-05-19 01:02:33
1 跟貼 1
云深處：擬IPO募資約25.03億元投資于具身算法及模型研發等項目

每日經濟新聞 2026-05-18 22:34:18
0 跟貼 0

天降橫財，世界杯補貼砸中浙江隊：至少進賬170萬人民幣

天降橫財，世界杯補貼砸中浙江隊：至少進賬170萬人民幣

姜大叔侃球

2026-05-18 11:03:51

你最接近生理極限的一次經歷是什么？網友分享讓人目瞪口呆！

你最接近生理極限的一次經歷是什么？網友分享讓人目瞪口呆！

夜深愛雜談

2026-04-09 19:39:13

2026世界杯巴西隊前瞻：安切洛蒂的桑巴軍團，能否在摘下第六星

2026世界杯巴西隊前瞻：安切洛蒂的桑巴軍團，能否在摘下第六星

林子說事

2026-05-18 19:28:14

看完劉浩存《主角》，再看楊紫《家業》，我想說沒比較就沒傷害

看完劉浩存《主角》，再看楊紫《家業》，我想說沒比較就沒傷害

一娛三分地

2026-05-18 14:53:42

張帥雙線出局因凱斯退賽喜進正賽，鄭欽文落選亞洲十大明星引熱議

張帥雙線出局因凱斯退賽喜進正賽，鄭欽文落選亞洲十大明星引熱議

網球之家

2026-05-18 23:35:03

醫生發現：過了六十歲，凡是白發少的老人，大多都有這2個共性

醫生發現：過了六十歲，凡是白發少的老人，大多都有這2個共性

垚垚分享健康

2026-05-03 15:25:09

大批楊梅果農哭訴喊冤：不知情，完全無辜，反遭全網集體怒懟

大批楊梅果農哭訴喊冤：不知情，完全無辜，反遭全網集體怒懟

譚談社會

2026-05-17 22:45:07

廣東公認的“排濕最強省湯”，連喝了5天，整個人都清爽了??！

寶哥精彩賽事
2026-05-18 00:45:02

合資團滅！4月車市銷量前五驚變，小米把誰擠下去了？

合資團滅！4月車市銷量前五驚變，小米把誰擠下去了？

凡兮說

2026-05-17 14:01:36

白天住院晚上回家的好日子結束了！全國統一執行

白天住院晚上回家的好日子結束了！全國統一執行

觀星賞月

2026-05-19 06:11:54

戛納這天，當53歲李冰冰秒了全智賢，才發現骨相、皮相老的區別

戛納這天，當53歲李冰冰秒了全智賢，才發現骨相、皮相老的區別

星宿影視鴨

2026-05-18 14:21:59

陜西男子用2條毒蛇泡酒，12年后打開本想品嘗美酒，誰知釀成慘劇

陜西男子用2條毒蛇泡酒，12年后打開本想品嘗美酒，誰知釀成慘劇

紅豆講堂

2025-03-26 10:05:43

10萬億一砸，躺平的時代結束了.....

10萬億一砸，躺平的時代結束了.....

Mask的小酒館

2026-05-18 11:45:55

5月19日：屬兔人要大哭！全是老天安排。

5月19日：屬兔人要大哭！全是老天安排。

糖逗在娛樂

2026-05-19 00:24:31

曝55歲瓜帥離任！英超末輪后官宣執教曼城10年奪20冠繼任者揭曉

曝55歲瓜帥離任！英超末輪后官宣執教曼城10年奪20冠繼任者揭曉

我愛英超

2026-05-19 06:15:52

17年恩愛抵不過殘酷現實，65歲徐威年老色衰，45歲張怡寧花樣年華

17年恩愛抵不過殘酷現實，65歲徐威年老色衰，45歲張怡寧花樣年華

臨云史策

2026-05-18 11:21:06

1-0！阿森納離奪冠只差1步：豪取4連勝+先賽5分領跑最快明天捧杯

1-0！阿森納離奪冠只差1步：豪取4連勝+先賽5分領跑最快明天捧杯

風過鄉

2026-05-19 05:47:05

問界M9加長版預售超預期，四成用戶選頂配

問界M9加長版預售超預期，四成用戶選頂配

Ping值焦慮

2026-05-19 05:50:17

2007年，一臺灣商人來到沈陽大帥府，對售票員說：我就不買票了吧

2007年，一臺灣商人來到沈陽大帥府，對售票員說：我就不買票了吧

浩渺青史

2026-05-15 02:58:03

誰能想到，天不怕地不怕的特朗普，從中國回去后居然傷感了。

誰能想到，天不怕地不怕的特朗普，從中國回去后居然傷感了。

葉老四

2026-05-18 15:09:08

AI產業主平臺領航智能+時代

15245文章數 66876關注度

往期回顧全部

科技要聞

蘋果WWDC26定檔6月9日凌晨：iOS27將亮相

頭條要聞

兒子說想給自己做蠶絲被家人網購1萬粒蠶卵媽媽崩潰

頭條要聞

兒子說想給自己做蠶絲被家人網購1萬粒蠶卵媽媽崩潰

體育要聞

58順位的保羅，最強第三中鋒

娛樂要聞

票房會破14億！口碑第一電影出現了

財經要聞

從賣流量到賣Token，運營商算力生意破局

汽車要聞

40.98萬起！充電5分鐘純電續航420km 騰勢N9閃充版勝算有多少？

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

手機

游戲

家居

公開課

旅游要聞

2026年國際博物館日暨中國旅游日煙臺主場活動啟動

手機要聞

先來曝點光：蘋果官宣北京時間6月9日舉辦WWDC26活動

日本玩家買二手馬里奧游戲打開竟是成人光碟

家居要聞

觀山隱秀心靈沉淀

110㎡淡而有致的生活表達
精神奢享對話塔尖需求
內在自敘，無域有方

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：最新国产精品拍自在线播放| 日韩欧美综合在线| 永久免费观看美女裸体的网站 | 青草青青高清影院在线观看| 正在播放国产对白孕妇作爱| 国产精品成人中文字幕| 五月天综合网亚洲综合天堂网| 亚洲中文av| 国产成人一区二区免av| 免费人成在线观看网站| 久久婷婷成人综合色综合| 精品一区精品二区制服| 欧美大香线蕉线伊人久久| 热99re久久精品国产首页免费| 日韩国产亚洲欧美成人图片| 色色资源网| 成人精品人妻一区| 国产成人AV区一区二区三| 欧美视频二区欧美影视| 在线视频亚洲色图| 亚洲AV秘无码一区二区三区一| 波多野结衣av88综合| 一区二区三区四区激情视频| 欧洲熟妇色xxxxx欧美老妇伦| 成人午夜精品久久久久久久网站| 男女xx00上下抽搐动态图| 中文字幕在线v| 垫江县| 苍井空一区二区波多野结衣AV | 97人伦色伦成人免费视频| 亚洲欧洲日韩综合二区| 亚洲人成影院在线观看| a男人的天堂久久a毛片| 久久99精品久久久久久9| 一区二区三区精品偷拍| 激情五区| 久久精品国产成人午夜福利| 国产伦视频一区二区三区| 好紧好湿好黄的视频| 动漫精品中文字幕无码| 国产成人毛片在线视频|

<pre id="xpmac"></pre>

<code id="xpmac"><optgroup id="xpmac"></optgroup></code>

<strike id="xpmac"></strike>