2026年，各車企的自動駕駛方案到了什么階段（二）？

2026-05-04 10:05:11　來源: 智駕最前沿

江蘇舉報

分享至

[首發(fā)于智駕最前沿微信公眾號]之前和大家一起分析了小鵬、華為、特斯拉這3加車企的最新智駕方案（相關(guān)閱讀：2026年，各車企的自動駕駛方案到了什么階段（一）？），今天我們帶大家來繼續(xù)看看其他車企有哪些技術(shù)革新。

VLA加3D空間理解，理想MindVLA-o1想補(bǔ)上關(guān)鍵短板

理想汽車在2026年3月英偉達(dá)GTC大會上發(fā)布的MindVLA-o1，試圖走一條與傳統(tǒng)VLA方案不同的路，即將3D空間理解能力與語言推理能力深度融合，構(gòu)建面向物理世界的通用智能體。

圖片源自：網(wǎng)絡(luò)

理想汽車基座模型負(fù)責(zé)人詹錕在發(fā)布時明確指出，當(dāng)前業(yè)界VLA方案存在三個關(guān)鍵痛點。3D空間理解與語義推理之間對齊效率不夠理想，導(dǎo)致語義理解和行為出現(xiàn)偏差；決策延遲，視覺—語言—行動之間的傳遞鏈路過長；長尾場景覆蓋不夠，僅靠真實數(shù)據(jù)規(guī)模擴(kuò)展難以覆蓋。

MindVLA-o1的解法是多項技術(shù)的組合。它采用VLA-MoE（混合專家模型）架構(gòu)，引入專門的Action Expert（動作專家），從3D場景特征、導(dǎo)航目標(biāo)、駕駛指令等多維輸入中提取信息，結(jié)合多模態(tài)思考生成高精度駕駛軌跡。在視覺模型層面，采用原生3D ViT編碼器，通過視頻流直接還原3D空間的位置、點云、語義與像素信息，避免了傳統(tǒng)BEV方案將場景壓縮為俯視圖后丟失高度信息的問題，也解決了OCC占用網(wǎng)絡(luò)缺少語義信息的缺陷。

這套方案還引入了預(yù)測式隱世界模型技術(shù)。該模型可以在隱空間中高效模擬未來幾秒的場景變化，對于需要預(yù)判前車反應(yīng)、行人動作的駕駛場景而言，這種能力可以顯著提升決策的穩(wěn)定性。理想自研的馬赫M100芯片在標(biāo)準(zhǔn)大規(guī)模矩陣乘任務(wù)上性能較上一代提升3倍，為這套新架構(gòu)的車規(guī)級落地提供保障。

理想將MindVLA-o1定義為面向物理世界的通用智能體，同一套VLA模型可同時控制車輛與機(jī)器人，將自動駕駛視為物理AI的發(fā)展起點。

用世界模型加閉環(huán)強(qiáng)化學(xué)習(xí)，蔚來押注類人駕駛？

蔚來的技術(shù)路線與華為同屬世界模型陣營，但落地思路有明顯差異。2026年1月，蔚來正式推送了世界模型NWM全新版本，國內(nèi)首次將完整的閉環(huán)強(qiáng)化學(xué)習(xí)技術(shù)融入智能駕駛研發(fā)，構(gòu)建起世界模型+閉環(huán)強(qiáng)化學(xué)習(xí)的技術(shù)架構(gòu)。

圖片源自：網(wǎng)絡(luò)

這套架構(gòu)的邏輯是讓模型通過學(xué)習(xí)海量人類駕駛行為數(shù)據(jù)，自主理解道路動態(tài)、交通常識與空間關(guān)系，以長時序環(huán)境推理能力持續(xù)校準(zhǔn)規(guī)劃邏輯與執(zhí)行精度，從而顯著降低對高成本人工標(biāo)注數(shù)據(jù)的依賴。NWM新版本聚焦選道準(zhǔn)、博弈強(qiáng)、控車穩(wěn)三大方向，優(yōu)化了導(dǎo)航跟隨精度、車流避讓響應(yīng)及動態(tài)車道判斷能力；提升了變道決策的果斷性與人車混行環(huán)境中的安全表現(xiàn)；實現(xiàn)了橫向與縱向動作的高度協(xié)同，加減速更加柔和自然。

NWM新版本推送后首月數(shù)據(jù)頗為亮眼，智駕使用總里程環(huán)比提升81.5%，城區(qū)領(lǐng)航輔助使用時長增長81.7%，輔助駕駛里程占比超過50%的用戶數(shù)增長了115.4%，這也反映用戶對新系統(tǒng)的認(rèn)可度明顯提升。蔚來還首次引入了城區(qū)領(lǐng)航換電功能，車輛在領(lǐng)航輔助狀態(tài)下可自動駛?cè)霌Q電站完成換電，支持全國超過2000座二代及以上換電站，打通了補(bǔ)能環(huán)節(jié)的最后一公里。

百度Apollo，從Robotaxi到功能型無人車

百度Apollo走的是一條技術(shù)開源+商業(yè)運營雙輪驅(qū)動的路線。2026年1月發(fā)布的Apollo開放平臺11.0，聚焦功能型無人車的系統(tǒng)設(shè)計，開放了自動脫困、貼邊行駛、回庫泊車等典型技術(shù)應(yīng)用，可高效服務(wù)于快遞配送、環(huán)衛(wèi)清掃、安防巡檢、園區(qū)接駁等場景。這套開源平臺已匯聚了26萬開發(fā)者。

圖片源自：網(wǎng)絡(luò)

在商業(yè)運營端，百度旗下的Robotaxi業(yè)務(wù)蘿卜快跑每周全無人訂單已超25萬單，全球累計服務(wù)超2000萬次，覆蓋北京、上海、武漢等26座城市，是目前全球運營規(guī)模最大的自動駕駛出行服務(wù)之一。

卓馭科技，一個模型驅(qū)動萬物智能移動

卓馭科技在2026年北京車展上發(fā)布了行業(yè)首個原生多模態(tài)基礎(chǔ)模型，將智能駕駛的發(fā)展劃分為小模型（感知+高精地圖+規(guī)則）、中模型（端到端）、大模型（原生多模態(tài)）三個階段。這套新模型在預(yù)訓(xùn)練階段融入了互聯(lián)網(wǎng)數(shù)據(jù)、移動機(jī)器人數(shù)據(jù)及多模態(tài)信息，目標(biāo)是實現(xiàn)跨垂類開箱即用，降低車型適配的時間和成本。

圖片源自：網(wǎng)絡(luò)

2026年4月起，卓馭的高悟性端到端4.0模型將通過OTA推送至搭載高通8650與8775芯片的車型；針對更廣泛的中低算力平臺，搭載TITDA4-VH芯片的車型也將升級至端到端3.0系統(tǒng)。商用車方面，卓馭已與宇通客車達(dá)成戰(zhàn)略合作，聯(lián)合開發(fā)商用客車NOA智駕方案，搭載激目2.0系統(tǒng)和自研補(bǔ)盲激光雷達(dá)。

小米XLA，軟硬件全系標(biāo)配

小米在2026年3月推出了第三代輔助駕駛方案，XLA認(rèn)知大模型。與之前兩代不同，XLA不再僅僅依賴數(shù)據(jù)模式，而是試圖讓系統(tǒng)真正理解環(huán)境，進(jìn)行常識與因果推斷。

圖片源自：網(wǎng)絡(luò)

在硬件上，新一代SU7全系標(biāo)配高規(guī)格輔助駕駛硬件，700TOPS算力的Thor芯片，配備激光雷達(dá)、4D毫米波雷達(dá)、11個高清攝像頭和12個超聲波雷達(dá)。軟件層面，XLA基于小米自研的MiMo-Embodied具身基座大模型，首次打通輔助駕駛與具身機(jī)器人兩大任務(wù)，實現(xiàn)了兩套系統(tǒng)在同一基座模型上的復(fù)用。

值得一提的是，小米承諾為初代SU7 Pro/Max/Ultra及YU7全系提供XLA的OTA升級，老款車型無需更換硬件即可體驗最新智駕功能，這在行業(yè)內(nèi)并不多見。

最后的話

將這些主流方案放在一起比較可以發(fā)現(xiàn)，VLA路線的代表有小鵬、理想和特斯拉（FSD V14的端到端本質(zhì)上也是這一方向，只不過特斯拉不使用語言中間層）；世界模型路線以華為和蔚來為代表。而在VLA和世界模型的中間地帶，卓馭和小米各自在嘗試更靈活的兼容路線，卓馭的原生多模態(tài)模型試圖從預(yù)訓(xùn)練層面就融合多種數(shù)據(jù)模態(tài)，小米則用同一套基座模型打通智駕和機(jī)器人兩大任務(wù)。多個玩家，多種解法，2026年的智駕競賽還遠(yuǎn)沒到統(tǒng)一的終局。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.