[首發(fā)于智駕最前沿微信公眾號]之前和大家一起分析了小鵬、華為、特斯拉這3加車企的最新智駕方案(相關(guān)閱讀:2026年,各車企的自動駕駛方案到了什么階段 (一) ?),今天我們帶大家來繼續(xù)看看其他車企有哪些技術(shù)革新。
![]()
VLA加3D空間理解,理想MindVLA-o1想補(bǔ)上關(guān)鍵短板
理想汽車在2026年3月英偉達(dá)GTC大會上發(fā)布的MindVLA-o1,試圖走一條與傳統(tǒng)VLA方案不同的路,即將3D空間理解能力與語言推理能力深度融合,構(gòu)建面向物理世界的通用智能體。
![]()
圖片源自:網(wǎng)絡(luò)
理想汽車基座模型負(fù)責(zé)人詹錕在發(fā)布時明確指出,當(dāng)前業(yè)界VLA方案存在三個關(guān)鍵痛點。3D空間理解與語義推理之間對齊效率不夠理想,導(dǎo)致語義理解和行為出現(xiàn)偏差;決策延遲,視覺—語言—行動之間的傳遞鏈路過長;長尾場景覆蓋不夠,僅靠真實數(shù)據(jù)規(guī)模擴(kuò)展難以覆蓋。
MindVLA-o1的解法是多項技術(shù)的組合。它采用VLA-MoE(混合專家模型)架構(gòu),引入專門的Action Expert(動作專家),從3D場景特征、導(dǎo)航目標(biāo)、駕駛指令等多維輸入中提取信息,結(jié)合多模態(tài)思考生成高精度駕駛軌跡。在視覺模型層面,采用原生3D ViT編碼器,通過視頻流直接還原3D空間的位置、點云、語義與像素信息,避免了傳統(tǒng)BEV方案將場景壓縮為俯視圖后丟失高度信息的問題,也解決了OCC占用網(wǎng)絡(luò)缺少語義信息的缺陷。
這套方案還引入了預(yù)測式隱世界模型技術(shù)。該模型可以在隱空間中高效模擬未來幾秒的場景變化,對于需要預(yù)判前車反應(yīng)、行人動作的駕駛場景而言,這種能力可以顯著提升決策的穩(wěn)定性。理想自研的馬赫M100芯片在標(biāo)準(zhǔn)大規(guī)模矩陣乘任務(wù)上性能較上一代提升3倍,為這套新架構(gòu)的車規(guī)級落地提供保障。
理想將MindVLA-o1定義為面向物理世界的通用智能體,同一套VLA模型可同時控制車輛與機(jī)器人,將自動駕駛視為物理AI的發(fā)展起點。
![]()
用世界模型加閉環(huán)強(qiáng)化學(xué)習(xí),蔚來押注類人駕駛?
蔚來的技術(shù)路線與華為同屬世界模型陣營,但落地思路有明顯差異。2026年1月,蔚來正式推送了世界模型NWM全新版本,國內(nèi)首次將完整的閉環(huán)強(qiáng)化學(xué)習(xí)技術(shù)融入智能駕駛研發(fā),構(gòu)建起世界模型+閉環(huán)強(qiáng)化學(xué)習(xí)的技術(shù)架構(gòu)。
![]()
圖片源自:網(wǎng)絡(luò)
這套架構(gòu)的邏輯是讓模型通過學(xué)習(xí)海量人類駕駛行為數(shù)據(jù),自主理解道路動態(tài)、交通常識與空間關(guān)系,以長時序環(huán)境推理能力持續(xù)校準(zhǔn)規(guī)劃邏輯與執(zhí)行精度,從而顯著降低對高成本人工標(biāo)注數(shù)據(jù)的依賴。NWM新版本聚焦選道準(zhǔn)、博弈強(qiáng)、控車穩(wěn)三大方向,優(yōu)化了導(dǎo)航跟隨精度、車流避讓響應(yīng)及動態(tài)車道判斷能力;提升了變道決策的果斷性與人車混行環(huán)境中的安全表現(xiàn);實現(xiàn)了橫向與縱向動作的高度協(xié)同,加減速更加柔和自然。
NWM新版本推送后首月數(shù)據(jù)頗為亮眼,智駕使用總里程環(huán)比提升81.5%,城區(qū)領(lǐng)航輔助使用時長增長81.7%,輔助駕駛里程占比超過50%的用戶數(shù)增長了115.4%,這也反映用戶對新系統(tǒng)的認(rèn)可度明顯提升。蔚來還首次引入了城區(qū)領(lǐng)航換電功能,車輛在領(lǐng)航輔助狀態(tài)下可自動駛?cè)霌Q電站完成換電,支持全國超過2000座二代及以上換電站,打通了補(bǔ)能環(huán)節(jié)的最后一公里。
![]()
百度Apollo,從Robotaxi到功能型無人車
百度Apollo走的是一條技術(shù)開源+商業(yè)運營雙輪驅(qū)動的路線。2026年1月發(fā)布的Apollo開放平臺11.0,聚焦功能型無人車的系統(tǒng)設(shè)計,開放了自動脫困、貼邊行駛、回庫泊車等典型技術(shù)應(yīng)用,可高效服務(wù)于快遞配送、環(huán)衛(wèi)清掃、安防巡檢、園區(qū)接駁等場景。這套開源平臺已匯聚了26萬開發(fā)者。
![]()
圖片源自:網(wǎng)絡(luò)
在商業(yè)運營端,百度旗下的Robotaxi業(yè)務(wù)蘿卜快跑每周全無人訂單已超25萬單,全球累計服務(wù)超2000萬次,覆蓋北京、上海、武漢等26座城市,是目前全球運營規(guī)模最大的自動駕駛出行服務(wù)之一。
![]()
卓馭科技,一個模型驅(qū)動萬物智能移動
卓馭科技在2026年北京車展上發(fā)布了行業(yè)首個原生多模態(tài)基礎(chǔ)模型,將智能駕駛的發(fā)展劃分為小模型(感知+高精地圖+規(guī)則)、中模型(端到端)、大模型(原生多模態(tài))三個階段。這套新模型在預(yù)訓(xùn)練階段融入了互聯(lián)網(wǎng)數(shù)據(jù)、移動機(jī)器人數(shù)據(jù)及多模態(tài)信息,目標(biāo)是實現(xiàn)跨垂類開箱即用,降低車型適配的時間和成本。
![]()
圖片源自:網(wǎng)絡(luò)
2026年4月起,卓馭的高悟性端到端4.0模型將通過OTA推送至搭載高通8650與8775芯片的車型;針對更廣泛的中低算力平臺,搭載TITDA4-VH芯片的車型也將升級至端到端3.0系統(tǒng)。商用車方面,卓馭已與宇通客車達(dá)成戰(zhàn)略合作,聯(lián)合開發(fā)商用客車NOA智駕方案,搭載激目2.0系統(tǒng)和自研補(bǔ)盲激光雷達(dá)。
![]()
小米XLA,軟硬件全系標(biāo)配
小米在2026年3月推出了第三代輔助駕駛方案,XLA認(rèn)知大模型。與之前兩代不同,XLA不再僅僅依賴數(shù)據(jù)模式,而是試圖讓系統(tǒng)真正理解環(huán)境,進(jìn)行常識與因果推斷。
![]()
圖片源自:網(wǎng)絡(luò)
在硬件上,新一代SU7全系標(biāo)配高規(guī)格輔助駕駛硬件,700TOPS算力的Thor芯片,配備激光雷達(dá)、4D毫米波雷達(dá)、11個高清攝像頭和12個超聲波雷達(dá)。軟件層面,XLA基于小米自研的MiMo-Embodied具身基座大模型,首次打通輔助駕駛與具身機(jī)器人兩大任務(wù),實現(xiàn)了兩套系統(tǒng)在同一基座模型上的復(fù)用。
值得一提的是,小米承諾為初代SU7 Pro/Max/Ultra及YU7全系提供XLA的OTA升級,老款車型無需更換硬件即可體驗最新智駕功能,這在行業(yè)內(nèi)并不多見。
![]()
最后的話
將這些主流方案放在一起比較可以發(fā)現(xiàn),VLA路線的代表有小鵬、理想和特斯拉(FSD V14的端到端本質(zhì)上也是這一方向,只不過特斯拉不使用語言中間層);世界模型路線以華為和蔚來為代表。而在VLA和世界模型的中間地帶,卓馭和小米各自在嘗試更靈活的兼容路線,卓馭的原生多模態(tài)模型試圖從預(yù)訓(xùn)練層面就融合多種數(shù)據(jù)模態(tài),小米則用同一套基座模型打通智駕和機(jī)器人兩大任務(wù)。多個玩家,多種解法,2026年的智駕競賽還遠(yuǎn)沒到統(tǒng)一的終局。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.