AI浪潮正在深度重塑智能電動汽車的產品形態和用戶體驗——這一點,在本屆北京車展上體現得尤為明顯。
展廳里最熱鬧的不再是哪臺車外觀更帥,而是誰家的智駕能應對更復雜的物理場景、誰家的座艙能真正幫你把事情辦了、誰家的架構把座艙和智駕融合在了一顆芯片上。
物理AI、小龍蝦Claw Agent、艙駕融合——這三條線,串起了2026北京車展最值得看的技術前沿。
物理AI,平息VLA、WA之爭
2024年,頭部車企集體上車端到端方案,當時遵循的核心路線是模仿學習——讓神經網絡直接從海量駕駛數據中學習“輸入圖像→輸出軌跡”。其優勢很直接:省掉規則模塊、端到端一體化、數據驅動迭代快,但問題同樣明顯:傳統端到端系統本質上是一個黑箱映射,知其然而不知其所以然,只知道“訓練數據里這么開的”,而不知道“為什么要這么開”。其結果就是見過的場景能處理,沒見過的長尾場景泛化能力很差——面對訓練集之外的復雜情況,端到端只能靠概率猜了。
![]()
針對端到端的推理短板,2025年行業分化出兩大方向——VLA和世界行為模型。VLA在大語言模型基礎上引入多模態能力和動作輸出,對復雜場景的理解能力遠超傳統端到端模型,但VLA對三維空間幾何和物理運動規律的隱式物理推理仍然薄弱。世界行為模型跳過語言中間層,直接在三維空間做建模和預測,對空間關系和運動預測有天然優勢,但其場景語義理解不如VLA——因為它更擅長底層物理推演(“物體會怎么動”),而缺乏高層語義推理與社會規則理解(“應該怎么反應”)。
VLA缺物理直覺的深度,世界模型缺語義理解的廣度,各自只填補了端到端的一部分短板。2026年北京車展前后涌現的物理AI方案,其核心價值正是將這兩條路徑的優勢融合,志在全面打通邁向Road AGI的路。
![]()
北京車展上,一眾智駕方案供應商紛紛發布物理AI上車的消息,并非是在強蹭AI圈的概念,而是旨在以“物理AI”這一主線,平息VLA與世界行為模型孰優孰劣的爭論。VLA和世界行為模型都是手段,而非目的,真正的目的在于,克服自動駕駛系統在真實物理世界中穩定、安全、實時、舒適、高效運行的真正挑戰。
![]()
物理AI的核心動作,不是沿VLA或世界行為模型單線深挖,而是把兩者的優勢融合。它的核心特征,是在決策鏈中同時融入對語義規則的邏輯理解與對物理規律的因果推演:VLA提供“紅燈停、禮讓行人”的社會常識與高層推理,世界行為模型提供“減速多少能平穩停下、濕滑路面剎車距離會延長”的物理直覺。兩者協同,讓系統不僅知道“該怎么做”,更理解“為什么這樣做可行”。
本屆北京車展成了物理AI方案的集中展示場。輕舟智航發布了基于“世界模型+強化學習”架構的物理AI模型,宣布戰略重心全面轉向通用物理AI。卓馭科技展示了其面向高階智駕的物理AI解決方案,宣布要“智能一切移動”。
千里科技憑借AI技術全棧加持,帶來了超高含模量的物理AI方案G-ASD 4.0,具備面向L4級的高等級自動駕駛能力。
![]()
大家同時強調“物理AI”,說明這不是一家之言,而是行業共識。當自動駕駛的競爭從比拼數據驅動的“模仿”能力,升維至構建對物理世界的“內在理解”時,行業的游戲規則已經被重寫了。
自動駕駛通過物理AI給“大腦”升級物理世界理解及推理能力的同時,座艙側也在經歷一次深刻的形態升級——這次變化的遠不止交互方式,更是整個服務供給與組織的邏輯。
座艙,變身小龍蝦
過去幾年,座艙最大的變化是人機交互方式的躍遷——從觸屏點擊進化到語音對話、手勢控制的自然交互,大模型的加入讓座艙終于能聽懂人話了。但是,服務的供給方式卻沒有跟上交互的進化。用戶依然需要面對一個個獨立的App“信息孤島”,像一個項目經理那樣主動規劃并主導流程,消耗寶貴的認知資源,在不同APP之間充當信息搬運工和流程調度員。
![]()
行業正在發生的轉變,正是座艙功能形態從零散App堆疊,轉向“任務拆解+服務編排”的Agent模式。在端云結合的全模態大模型聽懂你的話、甚至結合車內視覺(如看到后排孩子睡著了)分析清楚您有什么需求后,后半段的服務編排與執行就由Claw Agent框架接手了:把“找一家適合家庭聚餐、附近有充電樁的餐廳”這樣的訴求,拆解成查找餐廳、規劃路線、查詢充電樁狀態等一系列原子操作,并調度對應的服務接口自動完成。
而且,過去,在沒有Claw執行框架的情況下,座艙AI主要局限于車內閉環——控制車窗、空調、導航,本質上都是圍繞車輛本身展開的服務。“小龍蝦”這類Agent框架的意義在于把服務的邊界打開了:點外賣、訂餐廳、買電影票、查天氣安排出行……座艙的能力邊界從車內延伸到了車外。
![]()
這正是Claw Agent模式與App堆疊模式的根本差異:不僅提供一站式服務閉環,更將座艙的能力邊界從車內延伸至車外,消費者們終于可以無縫連接移動互聯網時代打造的各類豐富服務了。
北京車展,龍蝦遍地,這注定不是一個玩家獨占的賽道,而是多家入局、百花齊放的格局。除了地平線的KaKaClaw咖咖蝦、中科創達的AquaClaw,更加值得一提的是BAT。
騰訊座艙智能體已全面覆蓋日常通勤與導航、本地與長途出游、手車互聯及娛樂休閑等高頻出行場景;阿里巴巴聚焦于打通本地生活、支付與導航,構建車內消費與服務的完整閉環;火山引擎則憑借其Agentic AI架構,為座艙打造“感知-推理-執行-記憶-學習”一體化的汽車智能體方案,其豆包座艙助手方案已覆蓋超700萬輛量產車,成為座艙Agent化的重要推動力量。華為在乾崑技術發布會上展示了新一代小藝智能體,同樣展現了超強的一站式主動場景服務能力。
![]()
雖然最終的座艙Agent未必會收斂到OpenClaw這種小龍蝦的形態上,架構格局未定,但方向是明確的:座艙的下半場競爭,比的不再是誰的語音識別更準,而是誰能讓Agent真正“辦得成事”,且辦得流暢、可靠。
不過,執行框架要真正跑起來,就必須能調用車輛的底層能力——而這些能力目前分散在座艙域和駕駛域兩套獨立架構里。座艙域和自動駕駛域之間,橫亙著一道高墻,車企通過艙駕一體要拆的,就是這堵墻。
艙駕一體,不止省錢
在當前主流架構下,座艙域一顆芯片,駕駛域另一顆芯片——兩套硬件、兩套OS、兩套硬件,兩套軟件棧,其代價是巨大的。首先是算力的浪費,兩顆芯片各自留下了冗余,但算力峰值很少同時出現;其次是數據孤島,智駕感知到的實時路況,座艙的SR界面需要經過復雜的跨域通信才能調用;最后是BOM成本的疊加,需要使用兩顆芯片、兩套外圍電路、兩套散熱,車企的賬越算越肉疼。
艙駕融合的本質,是將座艙和智駕統一到單個計算平臺上(如地平線星空6P、黑芝麻(參數丨圖片)武當C1296、高通SA8775P),通過硬件虛擬化和安全隔離技術,同時承載座艙、智駕任務,算力按實際負載動態分配。
![]()
這帶來的不只是硬件成本的大幅優化(地平線稱其星空方案可降低單車成本1500-4000元),更關鍵的是打開了實時協作的可能性。SR實景導航、語音直接控制駕駛行為、將自動駕駛作為一種基礎能力嵌入各種場景里,這些在分離架構下“能做但不好做”的事情,在融合架構下變得簡單多了,因為跨域數據通信從需要經過復雜網絡傳輸,變成了在單芯片內部通過共享內存的超高速交換。
![]()
目前,高通、英偉達、TI、瑞薩、黑芝麻智能、聯發科技等全球主流芯片企業都在搶灘艙駕融合。跨域融合SoC從算力層面奠定了基礎,單SoC艙駕融合方案正從技術驗證邁向規模化量產。高通的驍龍Ride Flex(SA8775P)方案已經通過極狐阿爾法T5等車型實現了量產上車,證明了技術路線的可行性。黑芝麻智能的武當C1296芯片也已在東風天元智艙Plus平臺上實現量產,成為首個本土艙駕一體量產芯片。地平線也剛剛發布了面向艙駕融合的“星空”芯片,已獲得十余家車企合作意向,并將于今年第三季度實現上車部署。
本屆北京車展的主題是“領時代 智未來”。這六個字,放在以前可能只是一句漂亮的slogan,但在2026年這個節點來看,更像是一個已然發生的事實描述。
物理AI讓本土自動駕駛不再只是跟在特斯拉后面抄作業,而是開始在“世界模型+強化學習”的路線上定義自己的認知方向。小龍蝦Claw Agent讓座艙讓座艙徹底告別了需要用戶在多個割裂應用間手動操作、消耗寶貴注意力的舊模式,轉而通過“復雜任務拆解+服務編排”,成為能主動搞定一連串事情的智能出行管家。
艙駕融合讓中國芯片公司有了在高性能車規計算平臺上與國際巨頭同臺叫板的底氣,從跟隨者變為定義者。
以前,是中國車企盯著國外的技術前沿努力追趕,現在,輪到海外同行來北京車展上觀摩中國的方案了。技術創新的策源地,正在發生靜默的遷移。棋至中盤,但這盤棋的執棋者,換了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.