![]()
![]()
“如果說「移動物理AI」是卓馭今后前進的方向,那么「原生多模態基礎模型」就是通往這個方向的路徑。”
作者丨王卓
編輯丨李雨晨
在今年的北京車展現場,在一眾主打乘用車智能輔助駕駛展臺之間,卓馭大膽地將一臺體型龐大的商用重卡放在展臺上。另一側,還擺著無人物流車、robotaxi 等不同類型移動載具的智能輔助駕駛解決方案。
這在過往的車展并不常見。
過去幾年,行業對智能輔助駕駛的討論重心,更多聚焦在乘用車領域。無論是城市NOA,還是端到端、VLA,主流敘事的核心始終圍繞乘用車展開。畢竟,乘用車擁有最大的市場規模、最活躍的用戶,以及最容易形成品牌聲量的消費場景。而無人物流車、無人配送等垂直賽道,雖然也已深耕多年,但各垂類之間相對割裂,尚未形成合力。
但卓馭這次明顯想表達另一件事。
卓馭科技正在打破傳統智能輔助駕駛公司的行業邊界,將技術能力從乘用車領域延伸至更廣闊的通用移動場景。
在卓馭科技CTO馬陸看來,無論是商用重卡、商用客車、物流車、Robotaxi,還是未來的巡檢機器人、割草機、掃地機,它們本質上都屬于同一類問題:如何讓機器理解環境,并完成自主移動。
![]()
卓馭科技CTO馬陸
這正是卓馭在此次北京車展反復強調移動物理AI的原因。相比行業仍聚焦于乘用車智能化,卓馭開始將移動能力本身,當做一種通用AI能力來理解。
于是,一個很有意思的事情出現了:當很多智能輔助駕駛公司仍在圍繞乘用車向下卷價格時,卓馭已經開始將乘用車、商用重卡、物流車、商用客車甚至未來更多移動機器人,放進同一個技術框架里思考,拓展到更多垂類場景,從向下內卷進入到向上正循環。
卓馭真正想做的,是讓一切能夠移動的載體,都擁有從A點安全、高效地移動到B點的自主移動能力。
這正是卓馭提出“智能一切移動”背后真正的野心。
01
為什么卓馭必須成為一家“移動物理AI”公司?
卓馭科技CTO馬陸在與雷峰網的專訪中提到,目前在整個乘用車智能輔助駕駛行業中,高階智能輔助駕駛方案的商業化盈利已成為行業難題。特別是,當十萬級車型也開始要求標配城市NOA時,也意味著輔助駕駛行業議價能力在逐步降低。
即便暫時不談商業回報,僅從技術角度看,無論是早期依賴大量手寫規則的傳統方案,還是如今主流的端到端方案,每新增一座城市、每跨入一個新垂直品類,幾乎都要重新做一輪泛化與適配:重采數據、重調模型、重做驗證,像打一層又一層“補丁”。這種高度依賴場景適配的開發模式,成本極高、效率極低,本質上很難支撐智能輔助駕駛真正走向大規模復制。
馬陸舉例稱,全球有兩百多個國家和地區,如果不使用通用模型,中國智能輔助駕駛技術出海會變得相當艱難,僅歐洲一個區域就需要投入至少三十人的團隊歷時近兩年時間做泛化,成本高、效率低。正因如此,卓馭更希望能做到“同一個技術模型,全球開箱即用,能夠少泛化乃至0泛化”。
此外,向大模型方向演進已是行業共識和必然趨勢。而向大模型方向邁進,意味著算力門檻和訓練成本的指數級飆升。馬陸透露,即便訓練一個中等規模的常見端到端模型,一年最起碼的訓練費就要十億元左右。一旦走上大模型這條路,資金投入只會更為驚人。
![]()
這筆巨額的研發投入,正迫使所有智能輔助駕駛玩家直面一個根本性的商業閉環問題:重金訓練出的通用大模型能力,必須在集中火力打透一個領域,與鋪開到多個領域攤薄成本間做出取舍。
如果只押注單一領域,能否攫取足夠的商業回報來閉環高昂投入,至今仍充滿巨大位置;而如果向多個領域鋪開,前提則是真能做出足夠強的通用大模型,并在每一個領域都實現高質量落地——這同樣是一條少有人走通的路。
顯然,卓馭選擇了后者這條行業前沿的探索路徑。
因此,在乘用車輔助駕駛持續向下“卷價格”、行業長期受困于泛化能力不足與跨場景適配效率低等技術瓶頸,同時研發投入高、商業閉環壓力日益加大的背景下,卓馭正在嘗試尋找一條跳出當前競爭泥潭的新路徑——通過更通用的移動物理AI能力與原生多模態基礎模型,打通不同垂類、不同場景之間的數據與模型復用,建立能夠持續自我強化、向上演進的技術與商業正循環。
![]()
目前在乘用車領域,卓馭已實現超過50款車型量產落地,累計定點車型突破100款。“油電同智、中外同頻、艙駕同芯、行泊同優”這四個關鍵詞,也逐漸成為卓馭區別于其他智能輔助駕駛公司的鮮明標簽。
在馬陸看來,物理AI本質上可以分成兩種能力:對環境的理解和對物理世界的行動;而行動又可以拆成移動能力和操作抓取能力。
卓馭選擇的方向,是最容易落地的“移動能力”,這也是“移動物理AI”名字的來源。換句話說,卓馭想做的,是讓一切能夠移動的機器,都具備自主移動能力。
因此,這次北京車展,卓馭展示的不只是乘用車方案,還有商用重卡、無人物流車、Robotaxi。
按照規劃,其面向商用重卡打造的智能輔助駕駛方案將于今年6月起陸續量產;與宇通客車聯合開發的客車NOA方案,將于今年9月實現量產交付;面向城配場景的全鏈路無人物流解決方案,也將在今年7月開啟試運營;而Robotaxi方案則計劃于今年下半年正式啟動試運營。
深耕智能輔助駕駛十余年后,卓馭已經在激烈的行業競爭中逐漸建立起自身的不可替代性。卓馭科技CEO沈劭劼認為,這種不可替代性主要來自三個方面:長期專注所形成的技術積累、持續沉淀的數據豐富度,以及對跨垂類智能化趨勢的前瞻判斷。
進入更多垂直品類,不僅意味著更廣闊的商業空間,也意味著能夠持續獲取更豐富、更高質量的數據,再進一步反哺模型訓練與算力投入,最終形成“更多場景—更多數據—更強模型—更大商業化”的向上正循環,而不再陷入單一乘用車市場不斷向下的價格內卷。
而一旦真正掌握這種跨場景、跨載具復用的移動物理AI能力,卓馭在行業中的定位,也將不再只是傳統意義上的智能輔助駕駛供應商,而是具備底層技術平臺屬性的AI公司,并由此建立起難以替代的競爭壁壘與生存空間。
02
“原生多模態基礎模型”,到底是什么?
如果說“移動物理AI”是卓馭今后前進的方向,那么“原生多模態基礎模型”就是通往這個方向的路徑。馬陸指出,“原生”并不是一個用于包裝概念的技術名詞,而是對過去拼接式VLA模型的一次技術范式重構。
原生多模態基礎模型的演進,是建立在卓馭前幾代技術積累之上的。
過去幾年,行業已經經歷了兩代技術路線。
第一代是規則算法,它的核心邏輯是:人為定義場景、制定規則,再讓系統執行。這種方案的問題在于,一旦場景復雜度提升,規則會指數級膨脹。每新增一個城市、每增加一種道路形態、每切換一個垂類車型,都要重新適配。
馬陸指出,本質上,規則算法方案不是“理解世界”,而是在“窮舉世界”。
后來行業進入第二階段:端到端。端到端最大的變化,是從“人寫規則”變成“數據驅動模型”。它確實解決了很多問題。按照沈劭劼的說法,當前行業主流端到端模型,即便不做適配,也已經能達到“70分”;經過泛化和調優之后,可以達到“90分”。
但問題也隨之出現。第一,模型越來越大;第二,訓練成本越來越高;第三,泛化能力依然有限——即便是現階段的端到端方案,每擴展一個城市、每跨一個垂類,依舊需要打一套補丁、做一輪適配。這意味著,整個行業仍然沒有擺脫“項目制交付”的邏輯。
![]()
而卓馭提出的原生多模態基礎模型,屬于端到端模型再向前一步的第三代技術范式,其目標是做到開箱即滿分的水平。
現在行業里,很多公司也在談多模態。但卓馭反復強調一個詞:原生。這兩個字,決定了它和過去“外掛式AI”的根本區別。
馬陸告訴雷峰網,過去很多VLA或者VLM方案,本質上是“拼接”。比如先拿一個通用視覺語言模型,再外掛到智能輔助駕駛系統上。它確實能“看見”,比如它知道前方是丁字路口,也知道有“鬼探頭”風險。但問題在于,它知道,不代表它真的能開。
因為其“看”和“開”是分離的。中間仍然需要大量人工規則、規劃邏輯和工程翻譯。所以會出現一個典型問題:“看到了,但做不到;做到了,也做不好。”
而卓馭所說的“原生多模態”,核心恰恰是取消中間翻譯層。它不是先“理解”,再“轉譯”,最后“執行”。
而是讓視覺、語言、動作、激光雷達、導航信息等所有數據,在預訓練階段就統一進入同一個模型,最終形成真正的“知行合一”。
也就是說,它看到,就代表它知道;它知道,就代表它能做到,這是原生多模態和外掛式AI最大的區別。
這會帶來兩個變化。
第一個變化,是響應速度大幅提升。原生多模態基礎模型取消了很多中間處理環節后,系統響應速度已經從原來的百毫秒級,降低到十毫秒級。
別小看這0.1秒,在高速場景里,它意味著更早的風險感知、更自然的剎車、更絲滑的避讓。很多時候,人還沒意識到危險,系統已經提前做出了微調。而且這種動作不是“急剎”,而是類似老司機那種很輕微的提前修正。
第二個變化,則是泛化能力。
過去行業做智能輔助駕駛,很像“專項訓練”——做乘用車是一套邏輯;做商用重卡,又是另一套邏輯;做物流車,還得重新適配。
但卓馭現在希望做的,是類似“大語言模型”的邏輯。不是給模型預設“你只能開乘用車”,而是把各種移動場景的數據統一混合訓練。
包括:乘用車、商用重卡、物流車;室內、室外、園區、城市;視覺、語言、動作、導航、激光雷達。最終目標是讓模型天然具備跨場景遷移能力。
![]()
用馬陸的話說:“最好希望它不需要再去做專門的泛化,最好是開箱即用。”
但卓馭也很清楚,物理AI和數字AI有本質區別。數字AI答錯一道題,可以重來;物理AI一旦出錯,后果是不可逆的。尤其是商用重卡、商用客車這種高載重場景,一次失誤就可能造成巨大事故。
所以相比互聯網行業強調“刷榜”、“參數量”,卓馭反復提到一個詞:底線思維。
在他們看來,智能輔助駕駛最終比拼的,不只是模型能力,還有安全文化。因為物理世界不允許“試錯式成長”。
這也是為什么卓馭一直強調,真正的挑戰,不只是“能不能跑”,而是“能不能規模化跑”。
如果每擴展一個國家、一個城市、一個垂類,都需要幾十人的團隊重新適配半年甚至一年,那么整個行業最終仍然無法擺脫高成本交付模式。
所以,卓馭現在真正想解決的問題,其實只有一個:如何讓模型強到不再依賴補丁。這也是他們提出“開箱即滿分”的原因。
最終,真正成熟的智能輔助駕駛,不應該是一輛“會開車的機器”,而更像一個自然參與交通的人類司機。而這背后,需要的已經不再只是傳統智能輔助駕駛能力。而是一個真正理解物理世界、具備通用遷移能力的原生多模態基礎模型。
這也是沈劭劼為什么說,未來存活下來的智能輔助駕駛公司,都將是移動物理AI公司。
03
何為“智能一切移動”?
行業普遍討論的是物理AI,只有卓馭將移動能力單獨抽象出來,將自身定位為“移動物理AI”。
在卓馭的原生多模態基礎模型里,移動不是乘用車的專有屬性,而是一種可遷移能力。商用重卡、商用客車、物流車、Robotaxi,甚至未來的巡檢設備、農業設備,本質上都在解決同一個問題:如何從A點安全、高效地到達B點。
當這一技術形成閉環時,車型這一概念將不再是不可逾越的技術邊界,而更多是物理形態和應用場景的差異。
于是,一個更底層的競爭邏輯開始顯現:如果所有移動問題可以被統一建模,那么數據可以共享,模型可以復用,能力可以遷移,成本結構也會隨之重構。行業競爭的焦點,不再是單點能力,而是跨場景的統一表達能力。
這也是卓馭提出“智能一切移動”這一使命的真正含義。
![]()
聽起來像是一個愿景,但如果拆解到技術路徑,其實卓馭是在做最重要的一件事:把移動物理AI的原生能力做到足夠好。
行業的競爭方式正在發生變化,過去比的是誰在某個城市做得更好,誰在某個車型上體驗更優;未來比的是誰能在更多移動形態中保持一致的智能能力,并且還能持續進化。
換句話說,堅守安全底線之上,卓馭不止致力于解決智能輔助駕駛的表層問題,更在探尋全域移動智能的本質內核。
而原生多模態基礎模型,正是支撐這一體系的核心底座。
從這個角度看,移動物理AI不是一個新賽道,而是一種重新定義賽道的方式;而“智能一切移動”,也不是簡單的口號,而是把智能輔助駕駛從交通工具層面,推向物理世界基礎能力層的一次嘗試。
當移動不再被當作產品功能,而被當作AI能力本身來理解,這個行業的分水嶺才真正開始清晰。智能輔助駕駛行業的競爭,已經不再只是“誰更會開車”,而是誰能把AI能力,真正變成一種可復制的“移動能力”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.