<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      同一天兩件大事!小模型直接掀翻千億參數(shù),走向效率為王

      0
      分享至


      大模型技術(shù)從“云端”向“終端”轉(zhuǎn)移的過(guò)程中,實(shí)用主義終將戰(zhàn)勝性能堆砌。

      作者丨陳嘉欣

      編輯丨馬曉寧

      5月13日,AI圈同時(shí)炸了兩件事。

      第一件事是頂級(jí)CV學(xué)者何愷明帶著MIT團(tuán)隊(duì),發(fā)布了人生第一個(gè)語(yǔ)言模型ELF。

      105M參數(shù),不走GPT自回歸的老路,全程在連續(xù)embedding空間里做擴(kuò)散,最后一步才離散化回文字。發(fā)布僅幾小時(shí),X上的討論就炸了——"Kaiming出品,必屬精品"。


      第二件事是清華系團(tuán)隊(duì)面壁智能開(kāi)源了新一代「小鋼炮」MiniCPM-V 4.6。

      這款模型在Artificial Analysis的智能指數(shù)上拿了13分,比Qwen3.5-0.8B高出整整3個(gè)點(diǎn),卻只有它1/19的推理token消耗量。而且它僅1.3B,一張4090就能“爆改”。


      同一天發(fā)生的兩件事都在指向一個(gè)問(wèn)題:AI行業(yè)正在經(jīng)歷一個(gè)微妙的轉(zhuǎn)折,從"堆算力"轉(zhuǎn)向"省算力"。

      2026上半年,當(dāng)DeepSeek V4、Qwen3.5、Gemma 4這些大廠還在卷千億參數(shù)時(shí),端側(cè)小模型的已經(jīng)迎來(lái)了新一輪浪潮,如今社區(qū)最大的聲音已經(jīng)不是"誰(shuí)家模型最大",而是"誰(shuí)家模型最小、最快、最省硬件"。

      01


      算力降維:從"堆H100"到"一張4090就夠了"

      面壁智能這次開(kāi)源的MiniCPM-V 4.6,最炸裂的不是參數(shù)規(guī)模本身,而是效率。

      先看一組數(shù)據(jù):在Artificial Analysis的智能指數(shù)測(cè)試中,MiniCPM-V 4.6以5.4M output token完成全部測(cè)試,同期測(cè)試的Qwen3.5-0.8B非推理版用了101M,推理版用了233M。前者是后者的1/19和1/43。


      1/43是什么概念?別人做43次推理的算力,它能做43次。

      再看吞吐量:在256并發(fā)、1000張圖像的高壓測(cè)試下,MiniCPM-V 4.6單張RTX 4090的吞吐量比Qwen3.5-0.8B高出1.6倍。


      清華系的1.3B"小鋼炮",同樣把硬件門(mén)檻拉到了極致,一張消費(fèi)者級(jí)別的RTX 4090就能跑。不需要H100,不需要A100。一臺(tái)游戲顯卡就能部署AI模型做二次開(kāi)發(fā)。放在一年前,這是不敢想的。

      這些數(shù)據(jù)放在一起,指向同一個(gè)結(jié)論:AI的參數(shù)競(jìng)賽正在讓位于效率競(jìng)賽。

      一位曾經(jīng)在Meta和momenta任職,目前現(xiàn)在做具身創(chuàng)業(yè)的研究者向雷峰網(wǎng)表示,小模型在端側(cè)的優(yōu)勢(shì)不是理論上的,是實(shí)打?qū)嵉纳虡I(yè)選擇。"大多數(shù)用戶(hù)不需要一個(gè)能寫(xiě)論文的模型,他們需要的是一個(gè)能隨時(shí)響應(yīng)、不掉線(xiàn)的模型"。

      另一位高通的負(fù)責(zé)人也向雷峰網(wǎng)表示了類(lèi)似觀點(diǎn):“參數(shù)越少,越容易在本地做微調(diào)、越容易適配每個(gè)人的使用習(xí)慣。個(gè)人AI時(shí)代,模型不需要記住全人類(lèi)的知識(shí),只需要記住你一個(gè)人的就夠了"。

      沿著這條思路往下看,你會(huì)發(fā)現(xiàn)小模型干的遠(yuǎn)遠(yuǎn)不只是"省算力"這么簡(jiǎn)單。

      02


      架構(gòu)換道:從"預(yù)測(cè)下一個(gè)詞"到"連續(xù)空間擴(kuò)散"

      何愷明的ELF,走了一條和GPT完全不同的路。

      先搞清楚一個(gè)背景。兩年多來(lái),AI對(duì)話(huà)模型的根基幾乎都是"預(yù)測(cè)下一個(gè)詞",把一句話(huà)拆成一個(gè)個(gè)token,依次猜下一個(gè)該是什么。這條路GPT證明了有效,但也有一條為人熟知的軟肋:生成速度慢、且沒(méi)法回頭修改已經(jīng)生成的詞。

      擴(kuò)散模型在圖像領(lǐng)域早就證明了"不按順序也能生成高質(zhì)量?jī)?nèi)容",Stable Diffusion從一團(tuán)噪聲逐步恢復(fù)為一張圖像,比自回歸生成靈活得多。但在語(yǔ)言領(lǐng)域,這條路一直走得磕磕絆絆。

      問(wèn)題出在哪?現(xiàn)有的大多數(shù)擴(kuò)散語(yǔ)言模型(DLM)雖然在"做擴(kuò)散",但操作的對(duì)象仍然是離散token,本質(zhì)上還是在有限的離散空間里"洗牌",沒(méi)有真正發(fā)揮擴(kuò)散的連續(xù)優(yōu)勢(shì)。

      何愷明團(tuán)隊(duì)的解法干凈利落:全程留在連續(xù)embedding空間里去噪,只在最后一步離散化成文字。


      這就像以前做雕塑,是一塊塊往上堆泥巴(順序生成每個(gè)token);現(xiàn)在是把一整塊石頭里的多余部分全部磨掉(在連續(xù)空間逐次去噪),最后一步才刻上細(xì)節(jié)。效率更高,而且能全局統(tǒng)籌。

      這種解法起手就和之前完全不一樣。所以ELF 105M參數(shù)、45B訓(xùn)練token、32步采樣,就跑贏了現(xiàn)有的DLM方案,不需要額外蒸餾。

      沿著架構(gòu)創(chuàng)新的方向再看MiniCPM-V 4.6。它采用LLaVA-UHD v4架構(gòu),視覺(jué)編碼器的計(jì)算量降低了約50%。這意味著,處理一張3136×3136的高分辨率圖像,在RTX 4090上只需要75.7ms。以前這是云端的活,現(xiàn)在端側(cè)芯片就能干。

      從"預(yù)測(cè)下一個(gè)詞"到"連續(xù)空間中去噪",從"云端算力"到"端側(cè)芯片",這兩條看似獨(dú)立的創(chuàng)新線(xiàn),正在指向同一個(gè)方向:AI模型的底層架構(gòu),正在從"一個(gè)超大的黑箱"變成"一個(gè)精巧的、分工明確的小系統(tǒng)"。

      架構(gòu)變了,生態(tài)也會(huì)變。小,正在成為新的"大"。

      03


      拉開(kāi)AI輕量化浪潮的序幕

      根據(jù)AI科技評(píng)論的觀察,目前市場(chǎng)上關(guān)于AI輕量化的三個(gè)變化正在發(fā)生。

      變化一:端側(cè)AI從概念到標(biāo)配。MiniCPM-V 4.6已經(jīng)能在手機(jī)上跑,不需要聯(lián)網(wǎng),不需要云。2026年下半年,你會(huì)看到更多手機(jī)廠商把端側(cè)模型作為賣(mài)點(diǎn),直接打出"本地跑模型"的旗號(hào)。

      變化二:架構(gòu)創(chuàng)新正在打破Scaling Law的壟斷。ELF證明了語(yǔ)言模型不一定非要自回歸。MiniCPM證明了1.3B也能打。Scaling Law說(shuō)"越大越好",但ELF和MiniCPM說(shuō)"夠用就好,夠快更好"。當(dāng)架構(gòu)創(chuàng)新成為新的競(jìng)爭(zhēng)力源頭,"堆參數(shù)"的軍備競(jìng)賽模式正在失效。

      變化三:商業(yè)模式與落地場(chǎng)景由“算力競(jìng)賽”轉(zhuǎn)向“成本優(yōu)化”。企業(yè)端不再盲目追大,多數(shù) B 端場(chǎng)景如智能客服、文檔輔助等開(kāi)始傾向于定制化的輕量級(jí)模型,因?yàn)槠渫评沓杀緝H為超大模型的數(shù)十分之一,更符合商業(yè)閉環(huán)。

      何愷明下場(chǎng)做語(yǔ)言模型,面壁開(kāi)源第五代端側(cè)模型,高通押注個(gè)人AI。站在2026年5月回頭看,這些不是孤立的新聞。它們拼出了同一個(gè)信號(hào):AI輕量化浪潮的序幕已經(jīng)拉開(kāi)。

      AI 的未來(lái)不再是“越大越好”,而是“在足夠的聰明度下,越輕越貴”。如何做更好的小模型,這或許才是2026年AI行業(yè)最值得關(guān)注的方向。

      未經(jīng)「AI科技評(píng)論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁(yè)、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

      公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來(lái)源并插入本公眾號(hào)名片。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      曹操撩寡婦時(shí)說(shuō)的金句,如今成了約會(huì)開(kāi)場(chǎng)白,男人經(jīng)常掛在嘴邊

      曹操撩寡婦時(shí)說(shuō)的金句,如今成了約會(huì)開(kāi)場(chǎng)白,男人經(jīng)常掛在嘴邊

      掠影后有感
      2026-05-11 11:31:38
      溫莎血脈基因優(yōu)良!哈里夫婦帶一雙兒女出游,阿奇兄妹給梅根爭(zhēng)光

      溫莎血脈基因優(yōu)良!哈里夫婦帶一雙兒女出游,阿奇兄妹給梅根爭(zhēng)光

      楓塵余往逝
      2026-05-13 14:45:33
      突發(fā)!南京又一機(jī)構(gòu)跑路!

      突發(fā)!南京又一機(jī)構(gòu)跑路!

      南京擇校
      2026-05-14 20:12:40
      合川呆呆再登熱搜!母親節(jié)殺雞宴翻車(chē),網(wǎng)友:套路都被玩爛了

      合川呆呆再登熱搜!母親節(jié)殺雞宴翻車(chē),網(wǎng)友:套路都被玩爛了

      童叔不飆車(chē)
      2026-05-14 14:29:11
      馬斯克:每年休息兩三天,試過(guò)睡不到6小時(shí)結(jié)果腦子很痛效率很低

      馬斯克:每年休息兩三天,試過(guò)睡不到6小時(shí)結(jié)果腦子很痛效率很低

      頂級(jí)大佬思維
      2026-05-09 14:23:20
      我國(guó)都有哪些常見(jiàn)毒蛇?哪種蛇最毒?盤(pán)點(diǎn)我國(guó)十大毒蛇,第一名致死率超65%

      我國(guó)都有哪些常見(jiàn)毒蛇?哪種蛇最毒?盤(pán)點(diǎn)我國(guó)十大毒蛇,第一名致死率超65%

      農(nóng)夫也瘋狂
      2026-05-13 11:40:43
      千萬(wàn)網(wǎng)紅董赤赤賬號(hào)僅剩9000元,欠54萬(wàn)!更背后誰(shuí)拿走了網(wǎng)紅的錢(qián)

      千萬(wàn)網(wǎng)紅董赤赤賬號(hào)僅剩9000元,欠54萬(wàn)!更背后誰(shuí)拿走了網(wǎng)紅的錢(qián)

      眼界縱橫
      2026-05-14 14:50:49
      張柏芝現(xiàn)身 4S 店,為剛考取駕照的大兒子 Lucas 提國(guó)產(chǎn)新車(chē)

      張柏芝現(xiàn)身 4S 店,為剛考取駕照的大兒子 Lucas 提國(guó)產(chǎn)新車(chē)

      老吳教育課堂
      2026-05-14 17:43:56
      沒(méi)給日本的,中方都給了特朗普,除了21響禮炮,還有一個(gè)重要承諾

      沒(méi)給日本的,中方都給了特朗普,除了21響禮炮,還有一個(gè)重要承諾

      知法而形
      2026-05-14 20:05:30
      女足亞洲杯太殘酷了:隨著中國(guó)女足2-4,4大勁旅已無(wú)緣爭(zhēng)冠

      女足亞洲杯太殘酷了:隨著中國(guó)女足2-4,4大勁旅已無(wú)緣爭(zhēng)冠

      俯身沖頂
      2026-05-14 21:23:59
      廣廈半決賽主場(chǎng)vs深圳票價(jià):最低100元,最高1500元

      廣廈半決賽主場(chǎng)vs深圳票價(jià):最低100元,最高1500元

      懂球帝
      2026-05-14 15:16:18
      正式棄用!斷崖式下滑!頂薪合同正式泡湯

      正式棄用!斷崖式下滑!頂薪合同正式泡湯

      籃球教學(xué)論壇
      2026-05-14 19:27:46
      廣東松源一在建橋梁因暴雨垮塌?當(dāng)?shù)兀簾o(wú)人員傷亡,水流沖擊所致,只是一個(gè)架子

      廣東松源一在建橋梁因暴雨垮塌?當(dāng)?shù)兀簾o(wú)人員傷亡,水流沖擊所致,只是一個(gè)架子

      瀟湘晨報(bào)
      2026-05-14 17:12:18
      “給兒子吃得大腦缺氧了!”一頓全碳水早餐,暴露了寶媽的低認(rèn)知

      “給兒子吃得大腦缺氧了!”一頓全碳水早餐,暴露了寶媽的低認(rèn)知

      妍妍教育日記
      2026-05-14 13:30:26
      買(mǎi)車(chē)半年維修9次!蔚來(lái)車(chē)主:不敢開(kāi)了,要求退車(chē)

      買(mǎi)車(chē)半年維修9次!蔚來(lái)車(chē)主:不敢開(kāi)了,要求退車(chē)

      深圳晚報(bào)
      2026-05-14 08:45:16
      杜鋒下課?廣東男籃做法有深意,遠(yuǎn)超外界猜測(cè),徐杰或成交易籌碼

      杜鋒下課?廣東男籃做法有深意,遠(yuǎn)超外界猜測(cè),徐杰或成交易籌碼

      萌蘭聊個(gè)球
      2026-05-13 16:32:05
      很多男人已經(jīng)養(yǎng)不起家了,無(wú)數(shù)普通頂梁柱被壓垮!

      很多男人已經(jīng)養(yǎng)不起家了,無(wú)數(shù)普通頂梁柱被壓垮!

      黯泉
      2026-05-14 10:57:59
      爽快!中美會(huì)晤提出的第一個(gè)要求,中方開(kāi)場(chǎng)白定調(diào),太高明了

      爽快!中美會(huì)晤提出的第一個(gè)要求,中方開(kāi)場(chǎng)白定調(diào),太高明了

      愛(ài)看劇的阿峰
      2026-05-14 18:59:00
      隨著騎士3-2領(lǐng)先活塞,馬刺3-2森林狼,NBA季后賽最終4強(qiáng)基本出爐

      隨著騎士3-2領(lǐng)先活塞,馬刺3-2森林狼,NBA季后賽最終4強(qiáng)基本出爐

      球場(chǎng)沒(méi)跑道
      2026-05-14 11:16:03
      美國(guó)眾議院議員強(qiáng)行將援助烏克蘭的法案賦予投票

      美國(guó)眾議院議員強(qiáng)行將援助烏克蘭的法案賦予投票

      山河路口
      2026-05-14 12:33:23
      2026-05-14 22:03:00
      AI科技評(píng)論 incentive-icons
      AI科技評(píng)論
      點(diǎn)評(píng)學(xué)術(shù),服務(wù)AI
      7274文章數(shù) 20751關(guān)注度
      往期回顧 全部

      科技要聞

      馬斯克說(shuō)會(huì)談很順利 黃仁勛點(diǎn)贊 庫(kù)克比耶

      頭條要聞

      重慶"萌感"佛頭意外走紅 雕刻者:不是文物且尚未完工

      頭條要聞

      重慶"萌感"佛頭意外走紅 雕刻者:不是文物且尚未完工

      體育要聞

      爭(zhēng)議抽象天王山,和季后賽最穩(wěn)定中鋒

      娛樂(lè)要聞

      何九華官宣當(dāng)爸!全程不提孩子?jì)?/h3>

      財(cái)經(jīng)要聞

      李強(qiáng)會(huì)見(jiàn)美國(guó)工商界代表

      汽車(chē)要聞

      雙零重力座椅/AI智能體/調(diào)光天幕 啟境GT7內(nèi)飾發(fā)布

      態(tài)度原創(chuàng)

      健康
      本地
      親子
      數(shù)碼
      公開(kāi)課

      專(zhuān)家揭秘干細(xì)胞回輸?shù)陌踩L(fēng)險(xiǎn)

      本地新聞

      用蘇繡的方式,打開(kāi)江西婺源

      親子要聞

      監(jiān)控下的幼兒園小可愛(ài),主動(dòng)幫老師搬桌開(kāi)門(mén),邏輯超在線(xiàn)

      數(shù)碼要聞

      小米耳夾式耳機(jī)官宣,17Max樣張公布

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 宝鸡市| 污视频在线免费| 午夜成人性爽爽免费视频| 免费观看又色又爽又黄的崩锅| 狼人大香伊蕉国产WWW亚洲| 永久免费无码日韩视频| 亚洲国产精品一区二区视频| 亚洲中文字幕精品第三区| 精品国产99久久久久久www| 尹人视频99| 免费一区二区三区视频在线| 蜜臂av| 国产成人亚洲一区二区三区| 国产在线精品熟女| 中文字幕一区二区三区精华液| 自拍偷区亚洲综合激情| 精品 日韩 国产 欧美 视频 | 国产九九在线| 无码欧亚熟妇人妻AV在线外遇| 九九精品国产亚洲AV日韩| 丰满人妻被黑人连续中出| 日本高清视频色wwwwww色| 一本无码人妻在中文字幕免费| 人妻碰碰碰| 三級毛片三級毛片| 国产一区在线播放av| 国产高清自产拍av在线| 91岛国| 久久精产国品一二三产品| 国产综合在线视频_亚洲日韩在线观| 麻豆国产精品VA在线观看不卡| 看全色黄大色黄大片 视频| 亚洲码亚洲码天堂码三区| 日本高清中文字幕免费一区二区| 亚洲中文在线观看| 亚洲日韩三区八妻av| 91年精品国产福利线观看久久| 亚洲天堂人妻| 中文字幕日韩精品有码| 伊人查蕉在线观看国产精品| 亚洲成人五月|