<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      面壁智能SALA架構,正在拆掉Transformer的那堵墻

      0
      分享至

      這兩年,大模型圈子里真正卡住行業的點,已經從參數規模,轉向了推理效率。

      模型越做越大,算力和顯存的壓力就越像一堵墻,橫在落地面前。

      尤其當應用從簡單對話進入長文檔理解、代碼倉級分析、長周期智能體任務之后,傳統架構的瓶頸,越來越暴露了出來。

      很多團隊都在優化訓練技巧、壓縮權重、做蒸餾,卻很少有人直接動底層注意力結構,因為那意味著要重新審視整個Transformer范式。

      面壁智能,這次公開的 Linear-Sparse 混合注意力架構 SALA 和對應模型 MiniCPM-SALA,在核心結構層的技術路線上,給了不一樣的答案。


      新模型能力提升現在不新鮮了,但如果是一次架構路線層面的重新定調呢?

      馬上過年了,比起很多公司紅包的熱鬧和營銷的手段,我覺得,面壁智能這樣扎扎實實的技術推進,更值得被看見。


      01. 長上下文需求爆發,正在倒逼注意力機制進化

      大模型最早的商業場景集中在問答、寫作、摘要,這類任務上下文長度通常在幾千到幾萬 token 區間,傳統全注意力機制還能承受。

      隨著應用形態變化,模型開始承擔代碼倉分析、合同審查、科研資料歸納、長鏈路 agent 任務規劃等工作……

      輸入規模直接跳到幾十萬甚至百萬 token 級別,這類需求在企業端和端側同時增長。

      企業側希望模型一次性讀取整個知識庫或代碼庫并保持一致理解,端側設備則存儲著大量用戶私有數據。

      比如說,聊天記錄、歷史行為、位置軌跡,這些信息只有本地處理才符合隱私要求,所以端側長上下文能力逐漸變成剛需指標。

      傳統 Transformer 的問題在這種場景下會被無限放大。


      全注意力機制計算復雜度,隨序列長度平方增長,序列翻十倍,算力需求接近百倍級上升,同時 KV Cache 也同步膨脹。

      推理階段顯存占用持續上漲,哪怕模型參數規模不變,只要上下文變長就會直接炸顯存,這就是很多工程團隊口中的 KV Cache 困局。


      放之前,這幾個困局,就像一個「不可能三角」。

      行業已經嘗試過多條路徑解決這個問題,例如線性注意力、狀態空間模型、稀疏注意力結構,各自都在某些維度表現出色,卻始終存在明顯短板。

      線性注意力與 SSM 類方法將復雜度壓到線性級別,速度和資源消耗表現很理想,不過這種結構需要把歷史信息壓縮進固定容量狀態中,序列越長,早期信息權重就越低,在復雜推理或長鏈條邏輯場景中容易出現記憶衰減現象。

      稀疏注意力走的是另一條路線。

      通過只計算關鍵位置注意力來降低算力需求,推理速度提升明顯,不過歷史 KV 必須完整保存,否則無法回溯長距離依賴。

      這導致顯存仍隨序列線性增長,存儲壓力沒有根本解決。

      行業一直在尋找一種結構,既保留線性結構的效率,又具備稀疏結構的精準感知能力。


      MiniCPM-SALA采用的Transformer-to-Hybrid低成本構建方法(HALO)

      02. SALA的混合注意力架構

      SALA 的核心設計思路很直接,將兩類注意力優勢拼接進同一架構體系,讓不同模塊負責不同任務。

      整體結構中大約 75% 使用 Lightning Attention 線性模塊,負責局部關鍵語義捕捉;

      剩余 25% 使用 InfLLM v2 稀疏注意力模塊,負責全局信息建模。


      這種比例經過多輪實驗調優后確定,目標是找到效率與精度之間的穩定平衡點。

      線性部分保證推理復雜度穩定增長,稀疏部分負責高價值信息精細建模,兩者共同構成完整上下文理解路徑。

      這種設計真正解決的問題在于長序列任務的結構性矛盾。

      純線性模型在序列極長時容易丟失細節,純稀疏模型在序列增長時顯存壓力持續擴大,SALA 把計算密度和信息密度拆分處理,讓計算資源集中在重要區域,同時保證全局狀態可追蹤。


      換句話說,模型在處理百萬 token 輸入時不會同時對所有 token 做同等強度計算,而是自動分配算力權重,這使得資源利用效率明顯提高。

      另一個關鍵創新來自訓練方法 HALO。

      傳統混合架構如果從零訓練,成本會高得驚人,因為新結構需要重新學習全部語言知識與推理能力。

      HALO 的策略是在已有全注意力模型基礎上進行結構轉換,再進行持續訓練,這種方式繼承原模型能力,同時讓新架構逐漸適應新的注意力模式。

      工程層面看,這種路線可以把算力投入降低到可接受范圍,使混合注意力模型具備規模化訓練可行性,對整個行業具有現實參考價值。


      如果把當前主流架構放在同一坐標系中觀察,可以看到一條明顯演化路徑:

      全注意力模型提供穩定智能水平,線性模型提供極致效率,稀疏模型提供長序列能力,SALA 則嘗試把三條路線合并成統一解。

      像 Kimi KDA、DeepSeek NSA、InfLLM v2 都在不同方向推進長上下文能力,SALA 的出現讓行業第一次看到統一結構實現多優勢疊加的可能性。


      相關論文參考:

      • 稀疏-線性混合注意力:https://arxiv.org/pdf/2601.22156

      • InfLLM v2:https://arxiv.org/pdf/2509.24663

      03. MiniCPM-SALA 實測表現,驗證架構可行性

      任何架構創新最終都要回到模型表現。

      MiniCPM-SALA 作為首個基于該結構完成大規模訓練的文本模型,在多個維度給出了比較清晰的數據結果。



      模型參數規模為 9B,體量處于輕量級區間,卻能夠支持百萬 token 上下文推理。

      關鍵在于 KV Cache 控制在 6GB 以下,這意味著普通消費級 GPU 也能完成推理任務。對于開發者來說,這直接降低部署門檻,使長上下文模型從數據中心專屬能力進入個人硬件可運行階段。

      在長文本評測中,該模型展現出穩定優勢,尤其在跨章節信息整合、長鏈推理、代碼結構理解等任務中表現突出。



      更值得關注的是,它在知識問答、數學推理、代碼生成等常規能力測試中仍保持與同規模全注意力模型相近水平,沒有出現性能折損現象,這說明混合結構并沒有犧牲通用智能能力。


      模型同時引入 HyPE 混合位置編碼機制,使短文本和長文本處理能力保持一致,不會出現短輸入性能下降的問題。

      推理速度方面的數據,對工程落地很有價值。

      在云端推理芯片測試中,當上下文長度達到 256K token 時,MiniCPM-SALA 推理速度達到同規模全注意力模型約 3.5 倍,而且測試沒有使用投機采樣或額外加速技巧,結果完全來自架構本身。

      對于企業部署來說,這類性能提升意味著成本直接下降,因為單位時間可處理請求數明顯增加。

      端側的表現,同樣不錯。

      當前很多模型在 8B 規模下運行 256K 上下文就會觸及顯存極限,而 MiniCPM-SALA 在消費級 GPU 上完成百萬上下文推理,這為手機、車載系統、機器人等終端設備運行通用模型打開空間。

      端側模型一旦具備長上下文能力,個人助理類產品就能持續讀取用戶歷史數據并維持長期記憶,體驗會發生質變,這也是行業普遍認為下一階段智能終端競爭的關鍵指標。


      04. 架構路線之爭,正在成為大模型競爭核心變量

      大模型行業早期競爭集中在參數規模和訓練數據量,隨后轉向推理成本和部署效率,現在焦點逐漸落在底層結構設計上。

      誰能在架構層找到更優解,誰就能在同等算力條件下跑出更高性能。

      SALA 的出現,也讓我看到一種新的可能性:未來模型競爭不只看誰的模型更大,還要看誰的結構更合理。


      我在想,這種變化對行業格局,也許會產生多米諾骨牌一樣的連鎖反應。

      有硬件適配邏輯的改變:

      當模型顯存需求下降,部署環境選擇范圍會擴大,GPU 不再是唯一選擇,邊緣計算設備也能承擔更多任務。

      進一步,也會帶來應用生態會被重新洗牌:

      長上下文能力成熟后,大量原本依賴數據庫或檢索系統的應用可能直接由模型完成,因為模型可以一次讀取全部資料并生成結果。

      以及說,訓練策略會發生變化,HALO 這類遷移訓練方法降低新架構實驗成本,使更多團隊具備嘗試底層創新的能力。

      從技術趨勢觀察,注意力機制很可能進入混合化階段。

      單一路線難以同時滿足效率、精度、可擴展性三項指標,多結構協同會成為主流設計方向。

      未來模型可能根據任務動態切換注意力模式,復雜推理使用高精度模塊,大規模掃描使用高效率模塊,這類自適應結構將成為研究重點。


      最后有個好消息:看到面壁、OpenBMB、SGLang 與 NVIDIA,聯合發起了一個比賽。

      比賽名字就叫《SOAR 2026 稀疏算子加速大獎賽》,已經正式開放報名了。

      賽事圍繞混合注意力架構推理性能優化展開,重點方向包括算子融合、編譯優化與硬件協同調度,目標是在消費級 GPU 上進一步壓縮資源占用并提升百萬 token 推理速度。

      而且還是面向全球開發者開放,官網報名入口:

      https://soar.openbmb.cn/

      對于關注推理效率、系統優化和模型架構的工程團隊來說,這是一次直接參與下一代推理基線定義過程的機會。


      特別懸賞獎的獎金,甚至高達28萬!

      感興趣的朋友,真的可以試一試~

      參考閱讀:

      GitHub 鏈接:

      https://github.com/openbmb/minicpm

      HuggingFace 鏈接:

      https://huggingface.co/openbmb/MiniCPM-SALA

      Model Scope 鏈接:

      https://www.modelscope.cn/models/OpenBMB/MiniCPM-SALA

      GitCode 鏈接:

      https://ai.gitcode.com/OpenBMB/MiniCPM-SALA

      MiniCPM-SALA 技術報告

      https://github.com/OpenBMB/MiniCPM/blob/main/docs/MiniCPM_SALA.pdf

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      “一定要投”!摩根士丹利明確看好A股硬科技,外資加速回流,中國資產戰略配置正當其時

      “一定要投”!摩根士丹利明確看好A股硬科技,外資加速回流,中國資產戰略配置正當其時

      每日經濟新聞
      2026-05-29 17:43:32
      別喝“駝奶”了,全世界的駱駝也擠不出那么多的駝奶

      別喝“駝奶”了,全世界的駱駝也擠不出那么多的駝奶

      黃河新流域
      2026-05-14 15:10:42
      每天一個西紅柿,研究發現:三周后身體炎癥下降38%,延緩腦衰老

      每天一個西紅柿,研究發現:三周后身體炎癥下降38%,延緩腦衰老

      科學認識論
      2026-05-28 10:06:49
      霍華德淘汰賽選NBA現役最佳:家鄉情結與大個子偏好的雙重勝利

      霍華德淘汰賽選NBA現役最佳:家鄉情結與大個子偏好的雙重勝利

      籃壇第一線
      2026-05-30 00:40:56
      大定破2萬!余承東:全新M9是地球上最強SUV,沒有之一!網友:廣告法能不能管管他

      大定破2萬!余承東:全新M9是地球上最強SUV,沒有之一!網友:廣告法能不能管管他

      大白聊IT
      2026-05-28 21:21:39
      中國移動迎來史上最年輕的總經理!

      中國移動迎來史上最年輕的總經理!

      ICT解讀者
      2026-05-08 19:50:41
      生育大局已定:如不出意外,2026年起中國人口將迎來3大變化

      生育大局已定:如不出意外,2026年起中國人口將迎來3大變化

      蜉蝣說
      2026-03-17 15:58:31
      帶孫子最狠的一招:不罵不吼,就兩字,我照做3年,孫子越來越懂事

      帶孫子最狠的一招:不罵不吼,就兩字,我照做3年,孫子越來越懂事

      心理觀察局
      2026-05-20 07:51:20
      又一個巨頭倒下了?虧損超62億,一代空調大王爆雷!

      又一個巨頭倒下了?虧損超62億,一代空調大王爆雷!

      素衣讀史
      2026-05-29 22:12:03
      徹底沒得選!德部長帶40家巨頭落地北京,警告歐盟不準碰中國

      徹底沒得選!德部長帶40家巨頭落地北京,警告歐盟不準碰中國

      嘆為觀止易
      2026-05-30 00:26:16
      重返騎士信號?詹姆斯轉發2016年奪冠高光:這支球隊實在太棒了

      重返騎士信號?詹姆斯轉發2016年奪冠高光:這支球隊實在太棒了

      羅說NBA
      2026-05-29 08:44:56
      女子凌晨乘網約車在車內排泄,司機崩潰:臭味洗不掉!乘客全程清醒,還和男友打電話……

      女子凌晨乘網約車在車內排泄,司機崩潰:臭味洗不掉!乘客全程清醒,還和男友打電話……

      環球網資訊
      2026-05-29 13:42:23
      建國初,甚至有部分將帥手握幾十萬兵力,為何沒一人敢擁兵自重?

      建國初,甚至有部分將帥手握幾十萬兵力,為何沒一人敢擁兵自重?

      史之銘
      2026-05-29 16:55:36
      DO&皇馬跟隊:穆里尼奧已簽下三年合同,皇馬主席選舉后官宣

      DO&皇馬跟隊:穆里尼奧已簽下三年合同,皇馬主席選舉后官宣

      懂球帝
      2026-05-29 22:20:07
      法網|爆冷出局后,辛納有點后悔

      法網|爆冷出局后,辛納有點后悔

      北青網-北京青年報
      2026-05-29 08:58:06
      最高層終于給房地產托底了!

      最高層終于給房地產托底了!

      櫻桃大房子
      2026-05-29 22:03:02
      綠營想用牢飯鎖定馬英九?臺商集體倒戈鄭麗文,這才是致命反殺!

      綠營想用牢飯鎖定馬英九?臺商集體倒戈鄭麗文,這才是致命反殺!

      坦蕩的雪莉
      2026-05-29 08:17:10
      688033,被證監會立案!

      688033,被證監會立案!

      中國基金報
      2026-05-29 21:46:04
      3分鐘傾家蕩產?年入千億“精神鴉片”,正精準掏空中國人的錢包

      3分鐘傾家蕩產?年入千億“精神鴉片”,正精準掏空中國人的錢包

      趣文說娛
      2026-05-12 19:53:22
      巔峰對決!吳宜澤VS趙心童 比賽時間公布 小吳再戰艾倫復刻世錦賽

      巔峰對決!吳宜澤VS趙心童 比賽時間公布 小吳再戰艾倫復刻世錦賽

      念洲
      2026-05-29 14:09:37
      2026-05-30 01:32:49
      AI異類 incentive-icons
      AI異類
      從硅谷到中關村,AI信息與測評
      188文章數 8關注度
      往期回顧 全部

      科技要聞

      Claude Opus 4.8凌晨突發上線

      頭條要聞

      釋永信被判24年 中國佛教協會:完全是咎由自取

      頭條要聞

      釋永信被判24年 中國佛教協會:完全是咎由自取

      體育要聞

      即使是文班亞馬,也做不到這件事

      娛樂要聞

      奚夢瑤何猷君將于6月在法國舉行婚禮

      財經要聞

      近3個月跌超20% 黃金"猴市"下的眾生相

      汽車要聞

      900V+3.2秒破百 領克10+&領克10上市16.99萬元起

      態度原創

      游戲
      本地
      教育
      手機
      公開課

      亞運會電競項目名單出爐!LOL、MLBB等項目暫缺陣容

      本地新聞

      用剪紙的方式,打開江蘇揚州

      教育要聞

      山東省家庭教育志愿服務總隊公益大講堂膠州巡講落幕

      手機要聞

      華為雙箭齊發:Mate80系列618官降500元,闊比例直板新機曝光!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 黄色福利社| 蜜臀av一区二区三区精品| 亚洲尤物你懂的视频在线看| 久章草这里只有精品| 国产男女猛烈无遮挡免费网站| 无码人妻一区二区三区免费手机| 无卡无码无免费毛片| 东京热一区二区三区在线| 3P视频网站视频网站视频网站在线播放| 五月天天天综合精品无码| 高潮抽搐潮喷毛片在线播放| 香蕉福利导航| 99久久久无码国产精品免费| 久国产精品韩国三级视频| missav成人网| 亚洲精品久久久久国产| 不卡免费一区二区日韩av| 巨乳无码| 狠狠躁无码一区二区| 九九在线精品| 国产精品女人在线观看| 国产3p视频| 亚洲成人资源在线观看| 亚洲中文字幕第二十三页| 亚洲成a人片77777kkkkk| 人人网aV| 国产精品私拍国产在线播放| 亚洲中文字幕综合一区| 可以直接看的无码av| 老色99久久九九爱精品| 性欧美VIDEOFREE高清大喷水 | 欧美日韩中文字幕久久伊人| 国产精品国色综合久久| 91福利国产午夜亚洲精品| 亚洲国产中文字幕精品| 国产交喘视频| 久久亚洲精品国产av| 五月丁香欧美| 蜜桃精品成人影片| 国产成人精品亚洲午夜麻豆| 中文字幕乱码一区二区免费|