文|三少爺
從大模型上車到Agent上車,行業(yè)對于座艙AI的態(tài)度正逐步趨向理性:不再追逐概念,而是真正關注誰能做出好的產(chǎn)品體驗。斑馬智能這樣技術領先且能為用戶帶來全新體驗的科技公司,正在迎來高速發(fā)展的窗口期。
大模型上車已經(jīng)兩年,懂路、懂人、懂用戶、懂生活的「真」智能汽車現(xiàn)在才開始慢慢出現(xiàn)。這事之所以比很多人預期的要慢,是因為要推動智能的涌現(xiàn),座艙AI必須經(jīng)歷從會聊天的ChatBot向能辦事的Agent的蛻變。在這場從ChatBot到Agent的蛻變進程中,斑馬智能正是推動并引領演變的主力推手之一。2024年9月,元神AI首次登臺亮相,初次展現(xiàn)了座艙Agent的模樣。
經(jīng)歷長達一年半的晝夜急行軍,歷經(jīng)數(shù)次迭代改版,于2026年北京車展,斑馬智能重磅推出元神AI汽車機器人大腦,升級Auto Omni全模態(tài)端模型產(chǎn)品矩陣,并發(fā)布行業(yè)首個“龍蝦上車”方案Auto Claw,再度刷新了人們對智能汽車的想象。元神AI的核心主張其實一直都很簡單:座艙AI不應該只是更聰明、能聊天的語音助手,它更應該做到的是,既能懂你所需,又能幫你辦事。
用戶在車里到底要什么?
人的認知資源是有限的,尤其是在開車的時候——要關注路況、要處理行程、可能還在想別的事。這種時候,沒有精力跟車機周旋,沒有耐心一步步教它自己想要什么。用戶的表達往往是這樣的——“我有點冷”、“前面有沒有吃的”、“幫我規(guī)劃一下周末行程”。這些話脫口而出時,懶癌初期的人類根本沒想過用精確的指令。
用戶的第一個核心訴求就像小公主那樣簡單:懂我,別讓我解釋。這不是“語音識別準確率”的問題,而是“意圖理解深度”的問題。座艙AI應該能從模糊的、斷續(xù)的表達里提煉出你的真實意圖,哪怕你自己都沒說清楚。想象一下,你剛結(jié)束一天高強度工作,大腦CPU快燒干了,這時對車機的表達可能就是“那個…前面…吃的…”。指望用戶字斟句酌地組織語言,清晰地表達需求,那得多累呢!
然而,問題恰恰出在“聽懂”這一步。很多座艙的語義理解能力還停留在字面上,無法將“那個”、“前面”、“吃的”這幾個碎片,組合成一個完整的意圖——“我想去前面那家我常去的餐廳”。它聽到了詞,卻沒聽懂話。
![]()
用戶的第二個核心訴求是你辦了就行,別讓我管流程。用戶不想自己定義流程,負責每個環(huán)節(jié)的信息輸入,更不想在多個App之間來回切換,費力地處理信息流轉(zhuǎn),在每個步驟之間當信息搬運工。
你說一句“我餓了”,理想的座艙AI應該能結(jié)合高德等圖商的POI數(shù)據(jù)、你的位置、時間和口味偏好,直接推薦附近合適的餐廳,甚至幫你排隊取號——而不是只會插科打諢“我也餓了,快給我充電吧。”當然,幽默是挺幽默的,但是架不住肚子餓!
![]()
歸攏一下,用戶的需求其實就兩條:一是能被理解,哪怕是模糊的、斷續(xù)的、情境化的表達;二是能把事辦了,而且,除了一些必要的信息確認,不需要用戶介入中間流程。前者是交流,后者是辦事。這兩件事,單拎出來哪一件都不簡單。
面對這樣明確卻棘手的需求,斑馬智能的解法是清晰而堅定的。其座艙AI的設計,始終圍繞著兩個核心理念:No Touch 與 No APP。No Touch對應“交流”,用戶無需觸屏,座艙AI便能從語音、表情、手勢中自動理解意圖;No APP對應“辦事”,用戶無需消耗寶貴的認知帶寬,肉腦規(guī)劃任務,并在不同應用間跳轉(zhuǎn),座艙AI可以直接調(diào)度后臺服務完成任務。這兩個理念,正是元神AI“一腦雙引擎”架構的設計出發(fā)點。
元神AI的一腦雙引擎
斑馬智能的元神AI,本質(zhì)上是一個汽車機器人大腦。其核心架構是“一腦雙引擎”:Auto Omni(端側(cè)大模型引擎)負責感知與理解,回答“用戶想要什么”;Auto Claw(Agent執(zhí)行引擎)負責規(guī)劃與執(zhí)行,回答“怎么幫用戶辦事”。兩者協(xié)同,覆蓋從聽到、聽懂到辦完的全鏈條。
Auto Omni是一個為端側(cè)而生的全模態(tài)大模型。“全模態(tài)”意味著輸入不只有語音。視覺(手勢、表情、注視方向)、聽覺、觸覺、甚至車身傳感器數(shù)據(jù)(溫度、光線),都可作為輸入的上下文。這意味著座艙AI可以“看你一眼”就知道你想干什么——而不用非得等你開口。Auto Omni是斑馬智能與千問大模型深度合作的成果,基于高通驍龍8x97平臺,并利用海量座艙場景數(shù)據(jù),進行深度微調(diào)和訓練,確保了強大的多模態(tài)感知理解能力在車端的穩(wěn)定、高效運行。
![]()
理解了用戶需求,接下來要解決的是“怎么做”。這正是Auto Claw這類Agent的使命。Auto Claw構建了一個完整的“任務池”,隨用戶的狀態(tài)與需求的動態(tài)變化,用大模型來理解、組織、編排所有任務,并根據(jù)需要實時判斷調(diào)整——誰在前、誰在后、誰和誰有關系?當出現(xiàn)了新變化,取消什么、增加什么、修改什么?
“就像大腦一樣不斷運轉(zhuǎn),讓思考和解決問題成為本能。”斑馬智能首席產(chǎn)品官蔡明強調(diào)。這才是像人一樣,成為能辦“復雜事”的助理。與AutoClaw協(xié)同的,還有面向不同場景的座艙智能體,覆蓋影音娛樂、出行生活、用車服務等諸多領域。整個過程,用戶無需知曉背后有幾個Agent在協(xié)同,體驗是渾然一體的。
![]()
回頭看那兩條需求,元神AI的“一腦雙引擎”給出了清晰的答案。交流,由Auto Omni用端側(cè)全模態(tài)感知實現(xiàn)深度理解并兜住隱私;辦事,由Auto Claw用一箭十星Agent架構調(diào)度支撐,生態(tài)底座與開放能力保證執(zhí)行力。兩條腿走路,缺一不可。只懂不辦是花瓶,只辦不懂是莽撞,唯有兩者兼?zhèn)洌揂I才能從玩具變?yōu)楣ぞ吣酥粱锇椤?/p>
座艙AI市場No.1
智能座艙的競爭,正從早期的硬件堆砌與功能羅列,悄然轉(zhuǎn)向更深層的較量:誰的AI更懂人,更能無縫銜接服務。競爭的核心正升維至懂人、服務人的“體驗閉環(huán)”。這場較量的背后,是一場關乎技術根基的靜默革命——座艙AI的技術架構,正在經(jīng)歷一次代際切換。
過去,在意圖理解上,主流座艙系統(tǒng)多采用分模塊架構:聲學信號處理、語音識別、自然語言理解、對話管理、語音合成……各個模塊中間依靠預設規(guī)則串聯(lián),信息在傳遞中難免損耗、延遲,甚至失真。任務執(zhí)行的方式也極為初級,通常只是喚起一個對應的獨立應用(如地圖APP),剩下的所有步驟——規(guī)劃路線、選擇方案、乃至后續(xù)如需“找充電樁”或“播放音樂”——都需要用戶自己在不同APP的信息孤島間手動切換、重復輸入,無法形成自動化的服務閉環(huán)。
變革的浪潮已然涌來。如今,行業(yè)正轉(zhuǎn)向以端到端全模態(tài)模型 + Claw類Agent執(zhí)行引擎的先進架構。在最關鍵的用戶意圖理解和主動服務層面,端到端模型架構,正憑借其信息無損流通與整體優(yōu)化的能力,成為破局的關鍵。曾在自動駕駛領域被驗證的分模塊→端到端演進路徑,如今正在智能座艙領域重現(xiàn)。
![]()
不過,這場轉(zhuǎn)型的門檻遠比想象中更高。它遠不止是分模塊到端到端的轉(zhuǎn)變,更涉及數(shù)據(jù)飛輪的構建、算法的持續(xù)迭代與整車級的工程化落地,是對技術全棧能力的嚴峻考驗。這也意味著,市場的機會將越來越集中于那些能夠全棧掌握端到端解決方案的頭部廠商——正如自動駕駛領域已經(jīng)展現(xiàn)的格局演變一樣。這場靜默的技術轉(zhuǎn)型,在重新定義座艙智能體驗上限的同時,也正在悄然重塑著市場的格局。
斑馬智行在這場轉(zhuǎn)型中的動作很快——2025年9月,斑馬智能推出了行業(yè)首個全模態(tài)端側(cè)大模型實車方案Auto Omni。從感知到理解再到執(zhí)行,全鏈路用一個統(tǒng)一的端到端架構打通。正如端到端自動駕駛帶來了體驗的質(zhì)的飛躍,這種端到端的座艙AI也實現(xiàn)了更自然的交互、更準確的理解、更完整的執(zhí)行。
再來看Claw類Agent。北京車展,龍蝦遍地,但若論成熟度,大多數(shù)汽車小龍蝦跟斑馬智能的Auto Claw還是存在一定的差距。Auto Claw的優(yōu)勢主要體現(xiàn)在落地時間、服務生態(tài)與復雜任務調(diào)度三個關鍵方面。
首先在落地節(jié)奏上,中科創(chuàng)達、地平線等廠商的方案多基于剛剛問世不久的開源OpenClaw進行定制,并在車展前夕或期間發(fā)布,由于接入時間晚,目前尚處技術預覽階段。而斑馬智能的布局早得多,其自2024年9月發(fā)布元神AI之初,便已完整定義Agent框架并啟動服務Agent化,積累了近兩年的車載場景工程經(jīng)驗。
其次在生態(tài)壁壘上,斑馬智能早在2025年云棲大會便聯(lián)合網(wǎng)易云音樂、飛豬、天貓養(yǎng)車等超400家伙伴發(fā)起行業(yè)首個“AI車載平臺服務聯(lián)盟”,將海量服務進行了AI原生化改造與封裝。這套成熟、可調(diào)度的生態(tài)體系是其他后入者需要耗費大量時間逐一對接、整合的,這為斑馬構筑了顯著的先發(fā)優(yōu)勢與護城河。
![]()
第三,基于大模型的復雜任務調(diào)度。當前一些龍蝦類智艙AI,單線程干活居多,把任務拆成碎片,它一項一項執(zhí)行。Auto Claw則是并行異步的進行任務處理,想人類處理任務一般。
斑馬智能Auto Omni+Auto Claw的技術領先性正在迅速轉(zhuǎn)化為市場認可:全球權威機構IDC評測顯示,其元神AI在智能座艙大模型能力綜合排名中位列第一;同時,斑馬也成為國內(nèi)首家獲得中國汽車工程學會云模型和端模型“雙認證”的廠商。良好的體驗與扎實的工程化能力(如其元神AI國內(nèi)首個通過ASPICE 4.0 CL2車規(guī)級認證),幫助斑馬贏得了近20家主流汽車品牌的合作,在TOP20主機廠中的滲透率超過60%,服務的車廠數(shù)量在兩年間增長了兩倍多。憑借技術、產(chǎn)品與交付的全方位優(yōu)勢,斑馬智能已坐實了中國市場智艙AI的No.1領導者地位。
![]()
截至2025年第三季度,AI座艙的普及率僅有10%。這意味著未來五年,行業(yè)將迎來巨大的增長空間。按照國家十五五規(guī)劃2030年90%的普及率,將迎來9倍增長。從大模型上車到Agent上車,行業(yè)對于座艙AI的態(tài)度正逐步趨向理性:不再追逐概念,而是真正關注誰能做出好的產(chǎn)品體驗。斑馬智能這樣技術領先且能為用戶帶來全新體驗的科技公司,正在迎來高速發(fā)展的窗口期。
通過元神AI這套架構,斑馬智能把座艙AI從“更好的語音助手”這個窄框里拽了出來。Auto Omni端模型解決理解的問題,讓座艙能真正聽懂人話、看懂情境;Auto Claw解決執(zhí)行的問題,讓座艙能真的幫你把事從頭到尾辦妥。兩者結(jié)合,才是一個完整、可用的座艙AI。
放眼整個行業(yè),座艙AI、艙駕一體、整車智能體正如火如荼,方興未艾,所以,元神AI不是一個終點,它更像一個強大的新起點,為汽車融入更全面的智能生態(tài)打開了大門。作為物理AI最重要的載體之一,汽車正日益成為人們深入日常、不可或缺的移動生活空間。在斑馬智行等一眾出行科技公司的推動下,未來的AI汽車,終將做到懂你所需、因你而動。
這一天,或許不會太遠。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.