<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      Meta發(fā)布Muse Spark:華人天團(tuán)廢墟重建,最恨Llama的果然是小扎自己

      0
      分享至


      作者 | 貓貓頭
      郵箱 | cathy@pingwest.com

      在Llama徹底“崩盤”后,Meta創(chuàng)始人兼CEO扎克伯格親手拆除過去的團(tuán)隊(duì)、架構(gòu)并徹底走向“反Llama”路線,砸百億建起華人科學(xué)家為主的AI研發(fā)天團(tuán)。今天,在9個(gè)月后,在整個(gè)硅谷關(guān)注以及不少的冷嘲熱諷下,他和這個(gè)全新團(tuán)隊(duì)終于交出了首個(gè)模型作品,試圖證明一整套從零搭建的AI棧跑通了。

      4月8日,Meta正式發(fā)布了MSL(Meta Superintelligence Labs)成立以來的第一個(gè)模型Muse Spark。九個(gè)月前Alexandr Wang加入Meta擔(dān)任首席AI官,帶著從OpenAI挖來的一眾華人核心研究員,推翻了整個(gè)Llama時(shí)代的技術(shù)棧——新基礎(chǔ)設(shè)施、新架構(gòu)、新數(shù)據(jù)管道,全部從零開始。Muse Spark就是這套新棧的第一個(gè)產(chǎn)出,現(xiàn)在它已經(jīng)直接上線驅(qū)動(dòng)Meta AI。


      在Llama 4因benchmark造假風(fēng)波陷入被動(dòng)的背景下,這是Meta的一次全面重啟。

      1

      Muse Spark是什么

      它是個(gè)處處和Llama反著來的模型:

      一個(gè)被刻意設(shè)計(jì)得小巧、輕量、高響應(yīng)速度的原生多模態(tài)推理閉源模型。

      先看它的核心能力:

      1. 原生多模態(tài):不是把視覺編碼器硬縫到文本模型上的"拼接式"架構(gòu)。從預(yù)訓(xùn)練階段起,文本、圖像、語(yǔ)音就在同一個(gè)高維特征空間里訓(xùn)練。這意味著它處理圖片不需要先翻譯成文字描述,而是直接從像素級(jí)別提取信息。

      2. Visual Chain of Thought(VCoT,視覺思維鏈):傳統(tǒng)的思維鏈推理是純文本的,模型在文字里逐步拆解問題。Muse Spark把這個(gè)機(jī)制引入了視覺空間——它能在圖像中"思考",自主構(gòu)建視覺元素之間的空間和邏輯關(guān)系。

      3. Contemplating Mode(沉思模式):對(duì)標(biāo)Gemini Deep Think和GPT Pro的極限推理模式。區(qū)別在于它不是單線串行推理,而是在后臺(tái)同時(shí)拉起多個(gè)并行運(yùn)算的子agent,各自處理任務(wù)的不同維度,最后由主控系統(tǒng)融合結(jié)果。沉思模式下Humanity's Last Exam達(dá)到58%,F(xiàn)rontierScience Research達(dá)到38%。

      4. 工具調(diào)用和多agent編排:原生支持,不是后期拼上去的。

      目前Muse Spark已在meta.ai和Meta AI app上線,Contemplating Mode逐步灰度中,同時(shí)向少量合作伙伴開放私有API預(yù)覽。


      1

      技術(shù)亮點(diǎn):華人天團(tuán)都是怎么說的

      今天MSL團(tuán)隊(duì)幾乎集體在X上發(fā)帖,幾個(gè)關(guān)鍵信息值得注意:

      Meta官方博客放出了一個(gè)極其重要的數(shù)據(jù):在預(yù)訓(xùn)練階段,新棧達(dá)到同等能力水平所需的算力比上一代Llama 4 Maverick減少了超過一個(gè)數(shù)量級(jí)。不是百分之幾十的優(yōu)化,是10倍以上的效率提升。博客原文稱"over an order of magnitude less compute",并且"significantly more efficient than the leading base models available for comparison"——甚至比其他家的基座模型都高效。

      Alexandr Wang的九條thread里最重要的一句話:"we saw predictable scaling across pretraining, RL, & test-time reasoning." 預(yù)訓(xùn)練、強(qiáng)化學(xué)習(xí)、測(cè)試時(shí)推理,三條線都看到了可預(yù)測(cè)的scaling——這可能比任何benchmark數(shù)字都重要。它意味著這套棧不是調(diào)出來的一個(gè)lucky shot,而是一個(gè)scaling曲線平滑的系統(tǒng)。


      首席科學(xué)家趙晟佳(@shengjia_zhao)的描述更具體:這個(gè)模型的訓(xùn)練路徑是"端到端的教育"——school(預(yù)訓(xùn)練)、homework(RL)、on-the-job training(產(chǎn)品部署后的持續(xù)學(xué)習(xí))。他強(qiáng)調(diào)"we just got started"。

      RL部分有個(gè)很有意思的技術(shù)細(xì)節(jié)。畢樹超(@shuchaobi)提到了訓(xùn)練中最痛苦的部分:大規(guī)模RL的不穩(wěn)定性,以及"fighting reward hacking"——對(duì)抗獎(jiǎng)勵(lì)機(jī)制作弊。但官方博客顯示他們最終把RL跑到了"smooth, predictable gains"的狀態(tài),pass@1和pass@16都呈log-linear增長(zhǎng),而且在未見過的評(píng)測(cè)集上也能平滑泛化。


      更有意思的是RL訓(xùn)練中出現(xiàn)的"相變"現(xiàn)象:團(tuán)隊(duì)在訓(xùn)練時(shí)引入了thinking time penalty(思考時(shí)間懲罰),模型先是通過更長(zhǎng)的思考來提升表現(xiàn),然后在懲罰壓力下學(xué)會(huì)了"思想壓縮"——用更少的token解決同樣的問題,之后又再次延伸推理以達(dá)到更高性能。Ananya Kumar(@ananyaku)在帖中稱這個(gè)過程"pretty neat"。

      Ananya放出的另一組圖表顯示了多agent推理的關(guān)鍵insight:多個(gè)agent并行推理,在相同延遲下能達(dá)到比單agent更高的性能。換句話說,Contemplating Mode不只是"讓模型想得更久",而是"讓多個(gè)模型同時(shí)想不同的事"。


      余家輝(@jhyuxm)作為多模態(tài)底座的總架構(gòu)師,說了一句很有意思的話:"It's been a fulfilling journey not just building the model, but the team and culture behind it." 建模型是一回事,建團(tuán)隊(duì)和文化是另一回事——他們?cè)诰艂€(gè)月里兩件事同時(shí)干了。


      Jason Wei(@_jasonwei)的回憶最有畫面感:"第一周我們?cè)谑程贸粤艘活D漫長(zhǎng)的晚餐,暢想研究方向,然后回到桌前寫了一個(gè)基本的inference llama腳本。現(xiàn)在我們有了一套相當(dāng)完整的技術(shù)棧,第一個(gè)模型已經(jīng)發(fā)布。"


      1

      Benchmark:什么領(lǐng)先不領(lǐng)先,回到牌桌先

      再來看看benchmark數(shù)據(jù):

      • HealthBench Hard(極高難度醫(yī)學(xué)問答):Muse Spark 42.8,GPT-5.4是40.1,Gemini 3.1 Pro只有20.6,Claude Opus 4.6只有14.8。絕對(duì)領(lǐng)先,接近其他模型的兩到三倍。

      • CharXiv Reasoning(科研論文圖表深度理解):86.4,全行業(yè)最高。

      • SWE-bench Pro(真實(shí)軟件工程任務(wù)):55.0%,超過Claude Opus 4.6的51.9%。

      • Artificial Analysis綜合智能指數(shù):52分,而GPT-5.4和Gemini 3.1 Pro都是57分。

      Meta想借此說明:Muse Spark在醫(yī)療多模態(tài)和科研圖表理解這兩個(gè)需要"真正看懂圖"的領(lǐng)域,已經(jīng)是毫無爭(zhēng)議的第一。在代碼工程上也進(jìn)入了第一梯隊(duì)。

      不過,目前它綜合能力距離GPT-5.4和Gemini 3.1 Pro還有5分的差距,純文本高級(jí)推理方面也還沒撼動(dòng)Anthropic和Google的積累。

      這樣的表現(xiàn)繼續(xù)引來一些批評(píng),Ndea的cofounder Fran?ois Chollet直接稱Muse Spark"已經(jīng)看起來是個(gè)令人失望的模型",他認(rèn)為模型過度優(yōu)化了公開benchmark,犧牲了實(shí)際可用性——而Alexandr Wang的回應(yīng)很克制:承認(rèn)模型在ARC AGI 2等評(píng)測(cè)上表現(xiàn)不佳,并強(qiáng)調(diào)這些數(shù)據(jù)已主動(dòng)公開。

      Chollet的質(zhì)疑不是沒有道理。Llama 4時(shí)代Meta就因benchmark造假風(fēng)波傷過一次信譽(yù)。這次Muse Spark在Artificial Analysis綜合指數(shù)上仍落后GPT-5.4和Gemini 3.1 Pro五分,醫(yī)療和科研圖表上的斷檔領(lǐng)先,是否來自對(duì)特定benchmark的定向優(yōu)化,還是原生多模態(tài)架構(gòu)帶來的真實(shí)能力?這個(gè)問題需要更多第三方獨(dú)立測(cè)試來回答。

      Muse Spark當(dāng)然重要,但它最重要的意義不在于今天的benchmark分?jǐn)?shù)。

      從這個(gè)模型的設(shè)計(jì),到這些研究員此次重點(diǎn)介紹的技術(shù)亮點(diǎn),一切都指向?qū)lama的反對(duì):Llama 4的大潰敗在扎克伯格眼里是個(gè)要徹底翻篇的事情,所以不只是它的開源路線,它的模型架構(gòu)要改,更重要的是它整個(gè)訓(xùn)練基礎(chǔ)設(shè)施都得給它掀翻了。此次這幾位核心作者的x發(fā)文,看起來都在圍繞底層技術(shù)棧的重構(gòu)來介紹。Muse Spark這次發(fā)布也讓人更明白扎克伯格挖來Alexander Wang的目的。

      最恨Llama的還得是扎克伯格自己,他必須得全盤給它推翻,在廢墟里重建。


      此次的發(fā)布也是Meta招兵買馬后那支華人天團(tuán)交出的第一個(gè)模型。余家輝(前OpenAI感知團(tuán)隊(duì)負(fù)責(zé)人、GPT-4o核心開發(fā)者)、趙晟佳(前OpenAI合成數(shù)據(jù)研發(fā)領(lǐng)頭人、ChatGPT聯(lián)合創(chuàng)作者)、任泓宇(前OpenAI o1/o3推理核心貢獻(xiàn)者)、畢樹超(前OpenAI多模態(tài)后訓(xùn)練負(fù)責(zé)人)、林紀(jì)(前OpenAI核心優(yōu)化專家)——這些被Meta用上億美元的簽字費(fèi)挖過來的AI科學(xué)家,在紙面上自然是一個(gè)明星團(tuán)隊(duì),他們必須先用一個(gè)模型讓Meta回到牌桌上。這是扎克伯格的當(dāng)務(wù)之急。

      扎克伯格在九個(gè)月前交給他們的是一張白紙。今天他們交出的答案其實(shí)更多是一整套預(yù)訓(xùn)練、RL、測(cè)試時(shí)推理的完整棧,并且——關(guān)鍵在這——scaling曲線是平滑的、可預(yù)測(cè)的。

      更大的模型已經(jīng)在路上了。


      點(diǎn)個(gè)愛心,再走 吧

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      在名為“統(tǒng)治東方”的地方,讓東方人去慶賀?海參崴閱兵未免過了

      在名為“統(tǒng)治東方”的地方,讓東方人去慶賀?海參崴閱兵未免過了

      歷史擺渡
      2026-05-10 18:55:03
      莎莎打完比賽凍得直哆嗦,一扭頭看見大迪羽絨服,二話不說就穿走

      莎莎打完比賽凍得直哆嗦,一扭頭看見大迪羽絨服,二話不說就穿走

      小娛樂悠悠
      2026-05-04 09:39:48
      盧比奧來不了中國(guó)了?不是中國(guó)不讓他進(jìn),是他根本不配進(jìn)!

      盧比奧來不了中國(guó)了?不是中國(guó)不讓他進(jìn),是他根本不配進(jìn)!

      嘆為觀止易
      2026-05-12 00:34:15
      吞自己的苦果!日媒稱:中國(guó)多所一流高校已經(jīng)終止向日本派交換生

      吞自己的苦果!日媒稱:中國(guó)多所一流高校已經(jīng)終止向日本派交換生

      凡知
      2026-05-09 12:38:17
      CBA官方:浙江因觀眾辱罵裁判、投擲雜物、投資人違規(guī)進(jìn)場(chǎng),罰款16萬(wàn)

      CBA官方:浙江因觀眾辱罵裁判、投擲雜物、投資人違規(guī)進(jìn)場(chǎng),罰款16萬(wàn)

      懂球帝
      2026-05-11 19:33:05
      什么時(shí)候讓你意識(shí)到這就是命,考公四次落榜,隨便報(bào)個(gè)東大就中了

      什么時(shí)候讓你意識(shí)到這就是命,考公四次落榜,隨便報(bào)個(gè)東大就中了

      夜深愛雜談
      2026-05-11 07:41:40
      曝華為“白嫖”開源團(tuán)隊(duì)技術(shù)方案?踢了開發(fā)者跟第三方公司合作

      曝華為“白嫖”開源團(tuán)隊(duì)技術(shù)方案?踢了開發(fā)者跟第三方公司合作

      爆角追蹤
      2026-05-11 09:54:53
      難怪日本女乒敢沖金牌,原來主教練是他,是馬琳師兄卻落選國(guó)家隊(duì)

      難怪日本女乒敢沖金牌,原來主教練是他,是馬琳師兄卻落選國(guó)家隊(duì)

      以茶帶書
      2026-05-11 16:27:51
      京滬高鐵:對(duì)京滬高速線和合蚌高速線部分動(dòng)車組列車的公布票價(jià)上浮20%

      京滬高鐵:對(duì)京滬高速線和合蚌高速線部分動(dòng)車組列車的公布票價(jià)上浮20%

      界面新聞
      2026-05-11 18:18:04
      國(guó)際乒聯(lián)2026年5月11日世界排名,王楚欽第一,林詩(shī)棟第五

      國(guó)際乒聯(lián)2026年5月11日世界排名,王楚欽第一,林詩(shī)棟第五

      乒乓球球
      2026-05-11 23:24:25
      里外不是人!“黃鵝粉雇傭兵”被烏克蘭俘虜,爹不親娘不收沒人要

      里外不是人!“黃鵝粉雇傭兵”被烏克蘭俘虜,爹不親娘不收沒人要

      瑜說還休
      2026-05-09 12:03:06
      為啥建議盡量用現(xiàn)金支付?3個(gè)現(xiàn)實(shí)原因,看完你也會(huì)揣現(xiàn)金出門

      為啥建議盡量用現(xiàn)金支付?3個(gè)現(xiàn)實(shí)原因,看完你也會(huì)揣現(xiàn)金出門

      老特有話說
      2026-05-10 21:01:02
      菲律賓美女部長(zhǎng),身材曼妙高挑挺拔,曾穿裙子去機(jī)場(chǎng)接中國(guó)游客

      菲律賓美女部長(zhǎng),身材曼妙高挑挺拔,曾穿裙子去機(jī)場(chǎng)接中國(guó)游客

      人間無味啊
      2026-05-10 03:46:25
      僅一夜!NBA狀元簽出爐,快船隊(duì)成最大贏家,下賽季超級(jí)黑馬誕生

      僅一夜!NBA狀元簽出爐,快船隊(duì)成最大贏家,下賽季超級(jí)黑馬誕生

      籃球掃地僧
      2026-05-11 10:51:55
      74歲普京現(xiàn)身閱兵儀式,面容憔悴引發(fā)健康擔(dān)憂,俄烏沖突消耗身心

      74歲普京現(xiàn)身閱兵儀式,面容憔悴引發(fā)健康擔(dān)憂,俄烏沖突消耗身心

      譯言
      2026-05-11 07:33:16
      這不是選舉,而是一場(chǎng)生死之戰(zhàn):美國(guó)選民的真實(shí)覺醒

      這不是選舉,而是一場(chǎng)生死之戰(zhàn):美國(guó)選民的真實(shí)覺醒

      斌聞天下
      2026-05-11 08:31:49
      NBA官宣:湖人vs雷霆G4主裁判托尼兄弟 活塞vs騎士G4主裁判馬克

      NBA官宣:湖人vs雷霆G4主裁判托尼兄弟 活塞vs騎士G4主裁判馬克

      醉臥浮生
      2026-05-11 21:54:43
      特朗普宣布訪華!帶1500噸行李和豪華天團(tuán),這波是避難還是談判?

      特朗普宣布訪華!帶1500噸行李和豪華天團(tuán),這波是避難還是談判?

      李將平老師
      2026-05-11 13:30:25
      特朗普即將訪華,啟程前提了個(gè)要求,向中方點(diǎn)名要這個(gè)人

      特朗普即將訪華,啟程前提了個(gè)要求,向中方點(diǎn)名要這個(gè)人

      帶你領(lǐng)略世界風(fēng)采
      2026-05-08 18:05:23
      女子車禍住院遭男醫(yī)生侵犯,錄下全過程并主動(dòng)反問,為何不立案

      女子車禍住院遭男醫(yī)生侵犯,錄下全過程并主動(dòng)反問,為何不立案

      一絲不茍的法律人
      2026-05-11 11:45:38
      2026-05-12 04:12:49
      硅星人 incentive-icons
      硅星人
      硅(Si)是創(chuàng)造未來的基礎(chǔ),歡迎來到這個(gè)星球。
      3070文章數(shù) 10497關(guān)注度
      往期回顧 全部

      科技要聞

      黃仁勛:你們趕上了一代人一次的大機(jī)會(huì)

      頭條要聞

      母女二人一年用水量高達(dá)400多噸 警方發(fā)現(xiàn)背后隱情

      頭條要聞

      母女二人一年用水量高達(dá)400多噸 警方發(fā)現(xiàn)背后隱情

      體育要聞

      梁靖崑:可能是最后一屆了,想讓大家記住這個(gè)我

      娛樂要聞

      “孕婦墜崖案”王暖暖稱被霸凌協(xié)商解約

      財(cái)經(jīng)要聞

      宗馥莉罷免銷售負(fù)責(zé)人 部分業(yè)務(wù)將外包

      汽車要聞

      吉利銀河“TT”申報(bào)圖曝光 電動(dòng)尾翼+激光雷達(dá)

      態(tài)度原創(chuàng)

      時(shí)尚
      健康
      教育
      房產(chǎn)
      軍事航空

      今年夏天最流行的5雙涼鞋,配裙子絕美!

      干細(xì)胞能讓人“返老還童”嗎

      教育要聞

      特朗普訪華對(duì)美國(guó)留學(xué)市場(chǎng)是利好嗎?中國(guó)留美學(xué)生規(guī)模如何變化?

      房產(chǎn)要聞

      產(chǎn)業(yè)賦能教育!翰林府與北師大的這場(chǎng)簽約,絕不那么簡(jiǎn)單!

      軍事要聞

      特朗普:伊朗的回應(yīng)“完全不可接受”

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 亚洲情人网| 日本亚洲一区二区精品久久| 日本另类αv欧美另类aⅴ | 一区二区三区内射美女毛片| 超碰123| 国产亚洲视频免费播放| 欧美精品99久久久| 在线国产在线国产尤物| 亚洲天堂一区二区| 国产 麻豆 日韩 欧美 久久| 毛茸茸性xxxx毛茸茸毛茸茸| 国产办公室无码视频在线观看| 99中文精品7| 97色成人综合网站| 亚洲精品久久久久久下一站| 国产高清无密码一区二区三区 | 中文字幕一区二区人妻痴汉电车| 亚洲日韩Av一区二区三区中文| 亚洲精品一区二区动漫| 国产精品自偷一区在线观看| 天堂网av一区二区三区| 日韩电影精品| 久爱www人成免费网站| 国产三级国产精品久久成人| 欧洲女人牲交性开放视频| 亚洲五月婷婷| 亚洲中文自拍| 国产一区二区av天堂热| 北条麻妃在线无码| 精品一区在线电影| 国产 在线播放无码不卡| 中文文字幕文字幕亚洲色| 99视频精品| 【_undefined?-?P站免费版?-?永久免费的福利视频平台】https://17630364268551281430832.nx37lbnqvd.com/column/all/show?t=&tags=%E5%90%8E%E5%85%A5%E9%AA%91%E9%A9%AC&page=2&orderBy=createTime&expanded=1 | 成年人网站在线| 亚洲精品一二三四区| 天天躁日日躁狠狠| 99精品全国免费观看视频高清| 日韩亚洲国产综合高清| 中文av字幕在线观看| 国产亚洲精|