<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      商湯絕影發布端側多模態智能體基座大模型Sage

      0
      分享至

      商湯絕影發布端側多模態智能體基座大模型Sage ,PinchBench 實測 94% 最佳任務完成率領跑主流大模型

      2026 年 4 月 22 日——商湯絕影正式發布端側多模態智能體基座大模型 Sage。Sage 采用 MoE 架構,總參數量為 32B,激活參數僅 3B ,是行業內首款在車端實現復雜智能體能力的基座大模型,在 PinchBench 上性能領跑全球一線云端大模型,已在英偉達 Orin X 端側平臺實現部署。

      AI 全面進入智能體時代,而汽車的復雜智能體能力依賴云端,端側模型受算力與參數限制,僅能實現簡單指令響應。智能座艙因此陷入兩難,依賴云端則有延遲與高 Token 成本,堅守端側則缺失真正智能體能力。Sage 的發布打破這一格局,首次將云端級智能體能力落地端側。

      作為端側智能體基座,Sage 可接入 OpenClaw、Hermes 等主流 Agent 框架,為更多端側智能體落地提供核心支撐,可覆蓋出行、家庭等全場景。

      Sage 的實力,已在國際公開評測中得到印證。在公開 Agent 評測基準 PinchBench 中,Sage 端側大模型最佳任務完成率達到 94%,超越Claude-Opus-4.6(93.3%)、Claude-Sonnet-4.6(88.0%)、GPT-5.4(90.5%)、Google-Gemini-3(87.0%)、Google-Gemma-4(83.9%)、Qwen3.5-27B(90.0%)、MiniMax-M2.7(89.8%)、MiMo-v2-Pro(87.4%)等國際主流云側和端側大模型。





      Sage 以僅3B激活的小參數量,超越眾多大參數量云側旗艦,打破 “只有大模型才能做好智能體任務” 的慣性認知,彰顯端側原生技術路線的高效優勢。以 小米MiMo-v2-Pro 為例,其激活參數為 42B、總參數規模超 1T,而 Sage 激活參數僅 3B,所需激活算力僅為其 1/14;若按模型權重規模近似估算,顯存占用約為其 1/31,但在 PinchBench 上的最佳任務完成率仍高出 6.6 個百分點。



      PinchBench 是龍蝦之父Peter Steinberger推薦的公開 Agent 評測基準。作為面向真實 Agent工作流的評測榜單,PinchBench 不依賴固定不變的靜態題庫,而是隨著公開任務庫持續擴充和版本迭代不斷演進。其公開任務庫覆蓋寫作、研究、編碼、分析、郵件、文件處理、日程管理、記憶與技能調用等典型場景,重點考察模型在工具調用、多步推理和任務閉環執行中的綜合能力。

      與此同時,PinchBench 評測要求模型完成真實任務執行,并綜合衡量成功率、速度與成本,因此測試周期更長、資源消耗更高,單任務token消耗就可達數十萬量級。正因如此,模型在 PinchBench 上取得的精度表現,更能體現其在復雜真實場景中的綜合能力與穩定性。

      在北京車展期間,商湯絕影將正式推出搭載 Sage 端側多模態智能體基座大模型的Sage Box,為汽車邁入超級智能體時代筑牢核心根基。

      憑借兩大黑科技,Sage 讓座艙從“聽懂指令”到“說到做到”

      Sage 端側大模型在 PinchBench跑贏一眾國際主流云/端大模型背后真正的功臣,是商湯絕影圍繞 Sage 后訓練階段自研的兩項關鍵技術:SCOUT 和 ERL。

      以 SCOUT 和 ERL 為核心的后訓練技術體系,一項讓模型"學得又快又省",一項讓模型"做事不出錯",重點突破智能體在學習效率、訓練成本和復雜任務穩定執行上的行業挑戰,解決了讓車載大模型從"能聽懂指令"進化到"能獨立辦成一件復雜的事"的行業公認難題。

      SCOUT:讓大模型學復雜任務,省 60% 算力

      SCOUT(Sub-Scale Collaboration On Unseen Tasks,分級協同學習框架) 技術重點解決大模型學習復雜出行場景任務時成本高、試錯慢的問題,在復雜任務能力注入過程中可節省約 60% 的 GPU 小時消耗。

      很多任務涉及空間規劃、設備聯動、多步決策,直接讓大模型自己試錯學習,既慢又燒算力。SCOUT 的思路是"探路與吸收解耦"——先派一個輕量小模型快速在任務里跑一遍,把走得通的路徑篩出來,再把這些高價值經驗喂給大模型學習,形成"小模型先探路,大模型再吸收"的學習機制,在降低訓練成本的同時,也能夠快速掌握更多真實用車場景技能。

      (上述技術成果論文已上傳arXiv:https://arxiv.org/abs/2601.21754)

      ERL:讓模型自己擦掉錯誤步驟,任務成功率提升 20%

      已被機器學習頂級會議 ICLR 2026 收錄的ERL(Erasable Reinforcement Learning,可擦除強化學習) 技術聚焦復雜任務鏈路中的錯誤識別與糾偏。用戶在真實使用中提出的需求,往往需要模型跨多個步驟完成推理和執行,中間一旦某一步出現偏差,整個任務流程就可能失效。

      ERL 讓模型能夠自動識別推理過程中的錯誤步驟,對錯誤內容進行擦除并重新生成,從源頭阻斷偏差擴散,就像給模型裝上了"邊想邊糾錯"的能力。這項技術讓 Sage 在多跳復雜推理基準上較此前 SOTA 取得顯著提升,裝車后 Sage 在復雜任務上的完成率提升了 20%。

      (上述技術成果論文已上傳arXiv:https://arxiv.org/abs/2510.00861)

      SCOUT 和 ERL 兩項技術前后協同共同推動 Sage 從語言大模型演進為能夠獨立完成復雜任務的智能體。疊加一體化多模態架構與原生訓練數據的優勢,Sage 在能力、成本與量產可行性之間取得了平衡,為打造智能體中樞提供了核心 AI 支撐。

      端側跑出全球領先能力,Sage 定義智能上限

      如果說 PinchBench 94% 的任務完成率證明了 Sage 能"辦成復雜的事",那么真正決定座艙體驗的,是模型在各個專業維度上是不是都"夠用、夠穩、夠聰明"。不同能力維度的公開基準上,Sage 全面領先本月最新發布的同量級端側旗艦模型 Google-Gemma4,把端側模型的能力天花板抬到了一個新的水位。

      MMLU Pro(跨學科專業知識)測試中,Sage 獲 76 分,領先同級端側模型約 10%,證明端側模型具備云端級通用知識密度;GPQA Diamond(研究生級專業推理)測試中,Sage 獲得 77 分,提升 33%,凸顯復雜推理深度;Human Semantic Understanding(座艙語義與視覺理解)測試中獲 91 分,提升 32%,依托原生數據建立獨特優勢。



      在重點考察任務執行能力的 τ2-bench(工具調用與任務閉環)基準上,Sage 以 80 分的成績相較 Gemma 4 實現 38% 的提升,接近翻倍領先。這項基準專門評估模型調用工具、走完多步任務的實戰能力,也是區分"會聊天的模型"與"會辦事的智能體"的關鍵分水嶺。τ2-bench 上近一倍的領先,直接印證了 Sage 作為端側智能體基座在真實任務執行環節上的絕對優勢。

      從專業基準到場景體驗:Sage 真正"懂場景、會思考、能服務"

      這些專業能力落到真實車艙,轉化為一組直接影響用戶體驗的指標:Sage 場景推理精度超過 90%,長鏈路工具調用、邏輯規劃、環境感知任務成功率分別達 92%、89%、94%,復雜指令遵循率提升 40%。

      在 Orin X 平臺部署下,Sage 可實現首字響應(TTFT)約0.5秒、單 Token 推理延遲(TPOT)低至0.03秒、生成吞吐達到80 tk/S,平均任務時長優于主流API 模型,為座艙智能體提供穩定、實時、可持續在線的運行能力。

      模型可以一次性解析用戶的復合指令,自動聯動空調、影音、導航等車載系統完成任務閉環;結合傳感器對乘員狀態與路況的感知,還能主動提供兒童模式、智能路線調整等服務。

      Sage 不再是"被動喚醒、單次響應"的語音助手,而是一個真正懂場景、會思考、能服務的出行伙伴。

      商湯絕影 Sage 端側多模態智能體基座大模型為艙駕一體方案打通了量產可行的模型路徑,打破了技術與落地之間的壁壘,推動智能座艙從基礎交互向高階艙駕融合智能體服務跨越。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      47歲資本大佬戴學斌,涉嫌刑事犯罪被拘!旗下藍潤系曾坐擁超千億元資產,知情人:去年就已有風聲

      47歲資本大佬戴學斌,涉嫌刑事犯罪被拘!旗下藍潤系曾坐擁超千億元資產,知情人:去年就已有風聲

      每日經濟新聞
      2026-05-12 11:24:13
      頂著一路罵聲,巴黎市區第三高樓驚艷封頂,官方:以后不準再建!

      頂著一路罵聲,巴黎市區第三高樓驚艷封頂,官方:以后不準再建!

      GA環球建筑
      2026-05-11 22:55:32
      一個普遍規律:低層次的社交,靠的是飯局;中層次的社交,靠的是利益;而高層次的社交,靠的是這兩個關鍵核心

      一個普遍規律:低層次的社交,靠的是飯局;中層次的社交,靠的是利益;而高層次的社交,靠的是這兩個關鍵核心

      心理觀察局
      2026-05-12 09:17:28
      第3名兒童被找到,已確認溺亡

      第3名兒童被找到,已確認溺亡

      蓬勃新聞
      2026-05-12 17:01:40
      伊朗:已將高濃縮鈾送往第三國!若談判失敗,伊朗會將其取回

      伊朗:已將高濃縮鈾送往第三國!若談判失敗,伊朗會將其取回

      AI商業論
      2026-05-11 08:36:11
      美媒:雄鹿&維拉老板艾登斯與46歲華裔女子發生性關系,女方勒索12億美元

      美媒:雄鹿&維拉老板艾登斯與46歲華裔女子發生性關系,女方勒索12億美元

      懂球帝
      2026-05-11 09:41:18
      亞歷山大:毫不夸張地說 米切爾是這輪系列賽表現最出色的球員

      亞歷山大:毫不夸張地說 米切爾是這輪系列賽表現最出色的球員

      北青網-北京青年報
      2026-05-12 20:22:04
      700日元變350日元!日本盒飯明著打折,為啥沒人敢等?

      700日元變350日元!日本盒飯明著打折,為啥沒人敢等?

      老特有話說
      2026-05-12 15:31:57
      大霧黃色預警繼續:山東江蘇等地局地有濃霧或強濃霧

      大霧黃色預警繼續:山東江蘇等地局地有濃霧或強濃霧

      界面新聞
      2026-05-12 18:11:19
      地主讓唐伯虎為茅廁題詩,出價十兩銀子,誰知竟成千古名句

      地主讓唐伯虎為茅廁題詩,出價十兩銀子,誰知竟成千古名句

      史之銘
      2026-05-10 20:01:26
      美國訪華行程安排是怎樣的?訪華費用誰承擔?

      美國訪華行程安排是怎樣的?訪華費用誰承擔?

      阿天愛旅行
      2026-05-11 15:58:19
      穿禮服后退款后續:女子身份曝光社死,工作遭牽連,商家準備起訴

      穿禮服后退款后續:女子身份曝光社死,工作遭牽連,商家準備起訴

      八斗小先生
      2026-05-12 17:23:09
      他是外交部原部長,1985年被鄧小平怒批“胡說八道”,活到了98歲

      他是外交部原部長,1985年被鄧小平怒批“胡說八道”,活到了98歲

      歷史人文2
      2026-05-09 22:00:03
      劉嘉玲曬法國生活,梁朝偉在老婆鏡頭下撿雞蛋,兩口子生活好愜意

      劉嘉玲曬法國生活,梁朝偉在老婆鏡頭下撿雞蛋,兩口子生活好愜意

      喜歡歷史的阿繁
      2026-05-12 12:12:22
      600522,成交“天量”!

      600522,成交“天量”!

      證券時報
      2026-05-12 17:04:03
      1988年蘭州軍區副司令邢世忠在華清池遭到挑釁碰瓷,當場回應讓對方跟他走一趟!

      1988年蘭州軍區副司令邢世忠在華清池遭到挑釁碰瓷,當場回應讓對方跟他走一趟!

      Ck的蜜糖
      2026-05-11 01:52:20
      劉曉彤當選!惠若琪在列,徐云麗無緣,中國排協公布完整名單

      劉曉彤當選!惠若琪在列,徐云麗無緣,中國排協公布完整名單

      跑者排球視角
      2026-05-12 16:49:17
      17只股即將實施分紅(名單)

      17只股即將實施分紅(名單)

      證券時報
      2026-05-12 09:44:07
      “新能源車普遍偏大一點,我停在車位上,左右車門都不能打得特別開,有時候人都出不去……”最近不少車主感嘆:停車位縮水了?

      “新能源車普遍偏大一點,我停在車位上,左右車門都不能打得特別開,有時候人都出不去……”最近不少車主感嘆:停車位縮水了?

      都市快報橙柿互動
      2026-05-12 15:26:35
      劉三姐“全裸演出”引爭議,張藝謀惹怒全網

      劉三姐“全裸演出”引爭議,張藝謀惹怒全網

      營銷頭版
      2026-05-10 20:09:26
      2026-05-12 21:48:49
      前沿在線 incentive-icons
      前沿在線
      前沿在線官方賬號,關注AI、機器人、智能車等前沿領域;
      205文章數 1235關注度
      往期回顧 全部

      科技要聞

      宇樹發布載人變形機甲,定價390萬元起

      頭條要聞

      新電動車到手不足一月頻繁自動鎖死 老人被摔傷五六次

      頭條要聞

      新電動車到手不足一月頻繁自動鎖死 老人被摔傷五六次

      體育要聞

      總是掉鏈子的“倒霉蛋”,闖進了歐戰決賽

      娛樂要聞

      白鹿風波升級!掉粉20萬評論區淪陷

      財經要聞

      黃仁勛真是被白宮徹底封殺了

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      教育
      數碼
      時尚
      藝術
      手機

      教育要聞

      想進深圳體制內的中小學校?看完這3092人名單,我勸你先考研

      數碼要聞

      綠聯推出“AP16”16英寸便攜屏:2.5K 165Hz +揚聲器,1799元

      穿極簡風的夏天,是真高級!

      藝術要聞

      這位畫家的油畫美人讓人驚嘆不已!

      手機要聞

      水冷透明機身+真全面屏!紅魔 11S Pro+圖賞

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲一区二区三区激情视频| 伊人激情av一区二区三区| 国产成人精品无码播放| 国产极品粉嫩尤物一线天| 人妻天天爽爽网| 日韩欧美一区二区三区| 亚洲av二区三区在线| 全部在线播放免费毛片| 起碰免费公开97在线视频| 人人妻人人做人人爽夜欢视频 | 中文亚洲欧美日韩无线码| 国产亚洲精品AA片在线播放天| 亚洲欧美日韩每日更新在线| 亚洲熟女高清视频| 亚洲www啪成人一区二区| 67194熟妇在线观看线路1| 国产一国产一级毛片aaa| 玩弄放荡人妻少妇系列| 亚洲精品久综合蜜| 亚洲精品麻豆一区二区| 大胸美女吃奶爽死视频| 少妇人妻偷人精品免费| 亚洲日韩性欧美中文字幕| 亚洲 日本 欧洲 欧美 视频| 精品不卡一区二区三区| 中文一区操| 人妻中文字幕AV无码专区| 欧美人成精品网站播放| 最近中文字幕免费手机版| 欧美AA| 一区二区三区岛国av毛片| AV在线影院| 欧美成人免费观看在线看| 中文字幕不卡欧美日韩| 国产麻豆精品在线观看| 无码乳交| 最新国产成人剧情在线播放| 黑人大荫道bbwbbb高潮潮喷| 激情综合网激情国产av| 玩弄少妇人妻中文字幕| 久久精品爱国产免费久久|