<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      大模型越做越大,面壁智能反手做了個小100倍還能看圖的

      0
      分享至

      面壁好軸啊,

      大家做模型都在比誰更大。

      參數(shù)更大,上下文窗口更大,反正什么都往天花板往上頂,

      問題是,Agent如果真的要進入現(xiàn)實世界,它還得變成一種更像水電煤的東西。

      便宜,穩(wěn)定,到處能跑。

      說實話,要是沒有Coding Plan和五小時額度刷新,10塊百萬token我都嫌貴。

      畢竟,如果像Hermes或者OpenClaw這種重型開發(fā)任務只能跑一兩個對話,如果是多個Skill混合使用的話,也只能跑20-50個回合。

      所以我看到面壁這次發(fā)MiniCPM-V4.6的時候,第一反應其實是又撈著了。

      1.3B,

      能看圖,

      還能跑得很快,


      huggingface.co/openbmb/MiniCPM-V-4.6

      隔壁隨便找一個都是500B往上甚至1T的。

      面壁的MiniCPM-V一直是一個很有代表性的端側(cè)模型系列。從2024年4月發(fā)布以來,

      它打的就不是巨無霸路線,而是小尺寸,高效率,端側(cè)可用。

      這次V4.6小到什么程度呢,你可以把它理解成一個能理解圖文,還能被消費級顯卡隨便拿去再訓練成適用于各種垂直限時任務的腳手架模型。

      在公開評測里,MiniCPM-V 4.6的多模態(tài)綜合能力超過了Qwen3.5-0.8B和Gemma4-E2B-it。


      在AA評測里的token消耗非常低,1.3B非推理版本運行只消耗5.4Mtoken,只有Qwen3.5-0.8B非推理版101M的1/19,也只有Qwen3.5-0.8B推理版本233M的1/43。


      如果只是跑一次demo,

      模型慢點貴點都還能忍。

      但真實業(yè)務里延遲就是體驗,吞吐就是成本,

      顯存就是預算,功耗就是影響落地。

      手機不會因為模型很聰明就多出一塊GPU。

      一個線上系統(tǒng)也不會因為你榜單分數(shù)好看,就允許每個請求都燒掉一大把算力。

      所以MiniCPM-V 4.6要講的不是,端側(cè)模型也能做多模態(tài)。

      而是大模型多模態(tài)能力終于開始變得更像一個可以四通八達到處有用的熱插拔基礎(chǔ)組件了。

      說到這里,干脆來看看它背后的技術(shù)創(chuàng)新吧。


      技術(shù)文檔我打包好了也,回復面壁就好

      多模態(tài)模型看圖,最麻煩的一步是它要先把圖片拆成一堆視覺token。

      圖片越大,越清楚,里面的信息越多,視覺token就越多。

      視覺token一多,后面的成本就上去了。

      你可以把它想成搬家。

      如果一開始把所有東西都原封不動搬上車,后面再說我要節(jié)省空間就沒啥空隙了,

      很多多模態(tài)模型的做法,就是在ViT(Vision Transformer 視覺模型)之后再壓縮token。

      這樣確實可以減輕后面語言模型的負擔,但前面的視覺編碼器已經(jīng)吃過一遍大圖的計算開銷了。

      MiniCPM-V 4.6背后的LLaVA-UHD v4優(yōu)化的點,是把視覺token壓縮提前到ViT內(nèi)部。

      更早壓,更省空間。


      讓后面大部分ViT層一開始就少處理很多token。視覺編碼階段的FLOPs(浮點運算次數(shù))降低55.8%。

      當然,做起來沒那么容易。

      因為不能粗暴地把視覺token砍掉,砍猛了,圖像表征就壞了,模型可能省了算力,但也看不清了。

      LLaVA-UHD v4里面用了早期ViT內(nèi)壓縮模塊,配合窗口注意力,讓鄰近token先做上下文交互,再通過復用相鄰預訓練ViT層參數(shù),盡量減少對原有視覺表征的擾動。

      翻譯成人話就是,它不是一口氣把所有部分都壓縮。


      它是在盡量不傷筋動骨的情況下,把最費算力的部分提前瘦掉。

      這就是MiniCPM-V 4.6能又小又快的關(guān)鍵之一。

      順著這個再聊,就到了另一個很重要的點,4倍和16倍混合視覺token壓縮。

      我覺得這個點挺適合拿普通相機來理解。

      4倍壓縮更像高清模式,保留更多細節(jié),適合追求識別精度的時候用。

      16倍壓縮更像高速省電模式,畫面信息壓得更狠,但推理速度會更快,成本也更低。

      過去很多模型的技術(shù)路線是二選一,要么偏精度,要么偏速度。

      到了MiniCPM-V 4.6,

      它開始把兩種壓縮率混在一起用,能切換兩類完全不同的場景。


      MiniCPM-V 4.6已經(jīng)可以在手機上用了

      一類是端側(cè),

      手機,電腦,車機,智能家具,這些設(shè)備對算力功耗很敏感,我不指望它們像云端機房一樣隨便燒。

      另一類是云端高并發(fā)。

      很多業(yè)務不是一個人問模型一次,而是幾萬個請求同時涌進來。

      每個請求還要求對很多候選結(jié)果做理解,打分,召回,排序。

      MiniCPM-V 4.6要解決的是兩個問題。

      普通設(shè)備怎么運行AI

      以及高并發(fā)怎么省錢。

      隔壁快手OneRec推薦大模型在處理視頻輸入里的字幕,標簽,ASR(語音識別),OCR(字符識別),封面圖這些多模態(tài)表征時,就用到了MiniCPM-V-8B,OneRec承接了短視頻推薦主場景25%的請求。


      在這種地方,模型不能像GPT 5.5一樣想個5分鐘,然后憋一句穩(wěn)穩(wěn)接住你。

      它只需要提供一點點更好的信號。

      比如這個封面圖到底是什么內(nèi)容。

      這段視頻更像美食教程還是探店吐槽。

      這個字幕里有沒有關(guān)鍵品牌名。

      這個用戶當下更可能想看什么。

      單看每一次判斷,好像都不復雜。

      但它會被放大到幾千萬,幾億次請求里。

      所以這種模型要的不是單次表演有多好。

      它要的是夠快,夠輕,夠穩(wěn),夠便宜。

      光是能讓整體系統(tǒng)效果往上抬一點點,

      它就已經(jīng)很值錢了。

      這也是我這三年越來越強烈的一個感受。

      很多人聊AI,還是喜歡盯著最強模型。

      誰超過了GPT,誰逼近了Claude,

      這些當然重要。

      但真正能讓AI滲入現(xiàn)實世界的,

      往往不是一兩個最強大腦,而是一堆穩(wěn)定不需要煩惱token數(shù)的端側(cè)模型。

      它們不一定會都被用戶看見。

      但它們會讓一個系統(tǒng)變得更聰明一點,更快一點,更省錢一點。

      這就是小模型最容易被低估的地方。

      這次面壁還做整套從微調(diào)到部署的工具鏈。

      微調(diào)端支持ms-swift和LLaMA-Factory,部署端適配vLLM、SGLang、llama.cpp、Ollama。

      甚至消費級顯卡,RTX4090,也可以跑通微調(diào)流程。

      尺寸模型的生命力,本來就在于被改造。

      我們不需要把MiniCPM-V 4.6當成一個萬能助手。

      它更適合去做一個垂直文檔解析模型,一個OCR整理模型,一個本地相冊理解模型,一個攝像頭畫面異常識別模塊。

      它在這些場景里,不需要什么都會。

      它只要把一件事做得夠穩(wěn)快便宜就好了。

      從這個角度看,

      MiniCPM-V 4.6最值得看的地方,

      確實不是它又刷了哪個榜。

      而是它把多模態(tài)往基礎(chǔ)設(shè)施的方向,

      又推進了一小步。

      @ 作者 / 卡爾

      最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點贊|在看|轉(zhuǎn)發(fā)|評論

      如果想要第一時間收到推送,不妨給我個星標

      如果你有更有趣的玩法,歡迎在評論區(qū)聊聊

      更多的內(nèi)容正在不斷填坑中……


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      特朗普訪華第3天,五角大樓拉警報!錯過北京調(diào)停,代價遠超想象

      特朗普訪華第3天,五角大樓拉警報!錯過北京調(diào)停,代價遠超想象

      知法而形
      2026-05-15 15:22:02
      俯臥撐數(shù)量出賣真實體能:40-60歲男性對照表

      俯臥撐數(shù)量出賣真實體能:40-60歲男性對照表

      解說阿洎
      2026-05-15 00:49:28
      特朗普談臺灣問題又不一樣了,他在接受采訪時說

      特朗普談臺灣問題又不一樣了,他在接受采訪時說

      小馬姨
      2026-05-14 08:06:39
      這跟不穿有啥區(qū)別?趙露思演唱會內(nèi)衣外穿:被眾嘲一套比一套辣眼

      這跟不穿有啥區(qū)別?趙露思演唱會內(nèi)衣外穿:被眾嘲一套比一套辣眼

      胡一舸南游y
      2026-05-13 15:23:56
      黃仁勛半路登機,史上最貴機票出現(xiàn)了!

      黃仁勛半路登機,史上最貴機票出現(xiàn)了!

      花小貓的美食日常
      2026-05-14 15:38:50
      張雪宣布冠軍車820RR停止生產(chǎn)!網(wǎng)友:老張的車質(zhì)量還是有差距的

      張雪宣布冠軍車820RR停止生產(chǎn)!網(wǎng)友:老張的車質(zhì)量還是有差距的

      火山詩話
      2026-05-14 14:41:35
      特朗普訪華,印度坐不住了!擔憂中美組成“G2”,莫迪搬救兵?

      特朗普訪華,印度坐不住了!擔憂中美組成“G2”,莫迪搬救兵?

      漫川舟船
      2026-05-15 15:38:55
      “從短視頻刷出來的女主角”:零表演經(jīng)驗、還是大二學生的她,怎樣成了《給阿嬤的情書》里的“南枝”?

      “從短視頻刷出來的女主角”:零表演經(jīng)驗、還是大二學生的她,怎樣成了《給阿嬤的情書》里的“南枝”?

      新京報
      2026-05-14 12:25:56
      2026TOP中國大學排名重磅發(fā)布:北大清華浙大上交南大居前五,武大華科川大躋身前十

      2026TOP中國大學排名重磅發(fā)布:北大清華浙大上交南大居前五,武大華科川大躋身前十

      TOP大學來了
      2026-05-15 09:07:14
      兒子長相神似妻子領(lǐng)導,丈夫決定做親子鑒定,結(jié)果出來后愣住了

      兒子長相神似妻子領(lǐng)導,丈夫決定做親子鑒定,結(jié)果出來后愣住了

      紅豆講堂
      2024-08-29 11:07:25
      A股:不用再等下周一行情,市場趨勢有變化,接下來很可能這樣走

      A股:不用再等下周一行情,市場趨勢有變化,接下來很可能這樣走

      財經(jīng)大拿
      2026-05-15 11:55:57
      王毅五字定調(diào)臺灣地位,民進黨2300萬人不接受

      王毅五字定調(diào)臺灣地位,民進黨2300萬人不接受

      安夢入天下
      2026-05-15 14:05:38
      王菊回應床戲尺度大:男女正常需求,說出了多少女性的心聲

      王菊回應床戲尺度大:男女正常需求,說出了多少女性的心聲

      觀察鑒娛
      2026-05-14 11:13:31
      性生活老公突然變得很猛?小心,這可能是個陷阱

      性生活老公突然變得很猛?小心,這可能是個陷阱

      精彩分享快樂
      2026-05-15 12:20:05
      爆賣260億!王傳福再開一槍,比亞迪致命一擊

      爆賣260億!王傳福再開一槍,比亞迪致命一擊

      象視汽車
      2026-05-13 07:00:08
      日航司高度焦慮!7月起,日本過華領(lǐng)空成本劇增,交錢也未必能批

      日航司高度焦慮!7月起,日本過華領(lǐng)空成本劇增,交錢也未必能批

      鐵錘簡科
      2026-05-14 13:24:35
      美國對中國統(tǒng)一下達新結(jié)論:大陸只要按兵不動,越晚統(tǒng)一代價越小

      美國對中國統(tǒng)一下達新結(jié)論:大陸只要按兵不動,越晚統(tǒng)一代價越小

      華史談
      2026-05-13 08:49:26
      當年千手觀音的聾啞人領(lǐng)舞,被富商苦追8年,如今她成了這副模樣

      當年千手觀音的聾啞人領(lǐng)舞,被富商苦追8年,如今她成了這副模樣

      混沌錄
      2026-05-12 23:09:07
      從贏麻了到退市警告,聞泰科技表演了一場年度鬧劇

      從贏麻了到退市警告,聞泰科技表演了一場年度鬧劇

      原來仙女不講理
      2026-05-15 11:52:34
      上海好久沒有如此不計代價的項目

      上海好久沒有如此不計代價的項目

      真叫盧俊
      2026-05-14 10:23:51
      2026-05-15 16:16:49
      卡爾的AI沃茨 incentive-icons
      卡爾的AI沃茨
      前大廠算法工程師,3家科技公司技術(shù)總監(jiān)|致力打造最系統(tǒng)的Al學習體系,讓1萬人通過Al提高生產(chǎn)力
      263文章數(shù) 134關(guān)注度
      往期回顧 全部

      科技要聞

      兩年聯(lián)姻一地雞毛,傳蘋果OpenAI瀕臨決裂

      頭條要聞

      女游客以1分錢拍下標價1980元的三亞海景房 酒店回應

      頭條要聞

      女游客以1分錢拍下標價1980元的三亞海景房 酒店回應

      體育要聞

      德約科維奇買的球隊,從第6級聯(lián)賽升入法甲

      娛樂要聞

      方媛為何要來《桃花塢6》沒苦硬吃?

      財經(jīng)要聞

      特朗普的北京時刻

      汽車要聞

      雙零重力座椅/AI智能體/調(diào)光天幕 啟境GT7內(nèi)飾發(fā)布

      態(tài)度原創(chuàng)

      教育
      藝術(shù)
      游戲
      親子
      公開課

      教育要聞

      新華讀報|拋繡球、游泳進中考,體育改革讓學生“玩有所得”

      藝術(shù)要聞

      一個北大 “反卷教授” 的意外走紅

      上帝模擬肉鴿《潘多拉的玩具盒》今日登陸Steam

      親子要聞

      考前焦慮家長扎堆問診!濟南六一兒童醫(yī)院:學習困難需醫(yī)學“破局”,暑假正當時

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 成人做爰www网站视频| 欧美性福网址| 羞羞网站免费一区二区三区| 久久亚洲国产精品一区二区| 中文字幕A片无码免费看| 亚洲第一极品精品无码久久| 亚洲日韩性欧美中文字幕| 亚洲综合久久国产一区二区| 狠狠操天天操| 中文无码毛片又爽又刺激| 国产精品久久香蕉免费播放| 国产人妻人伦精品婷婷| 国产黑丝袜在线观看视频| 欧美亚洲h在线一区二区| 国产亚洲精品自在久久VR| 久久99国产综合精品女同| 国产黄色自拍视频| 国产精品午夜福利91| 久久一日本综合色鬼综合色 | 波多野结衣一区二区三区高清av | 自拍偷拍第四页| 日本在线不卡一区| 一本一本久久A久久精品综合不卡| 欧美一区二区三区啪啪| 国产乱码1卡二卡3卡四卡5| 精品人妻一区二区色欲产成人| 国产欧美日本| 日本边添边摸边做边爱| 黑人强伦姧人妻久久| 久久久久久久久无码| 国产精品无码翘臀在线看| 国产精品自拍超碰在线| 国产成 人 综合 亚洲奶水| 亚洲欧美国产免费综合视频| 丝袜美腿诱惑之亚洲综合网| 99久久婷婷国产综合精品青草漫画| 蜜芽久久人人超碰爱香蕉 | 衣服被扒开强摸双乳18禁网站| 国产超碰无码最新上传| 国产学生裸体无遮挡免费| 久久国产AV|