![]()
在成立的十一年中,理想汽車最擅長也最聲名在外的能力,是把復(fù)雜技術(shù)與家庭的出行需求對齊。
增程不是一套非主流動力架構(gòu),而是“沒有里程焦慮”;大型SUV不是一組車身尺寸,而是“一家人坐得舒服”;冰箱、彩電、大沙發(fā)不是配置堆疊,而是讓一輛車成為自在的移動空間的必需品。
這套方法曾經(jīng)讓理想從一堆更先鋒、更激進、更性感的技術(shù)路線中,找到了一個最容易商業(yè)閉環(huán)的入口。別人忙著證明自己更像未來,理想先回答了一個更樸素的問題:今天的用戶到底愿意為什么買單。
但到了2026年,理想已經(jīng)不再滿足于回答“什么是一輛更好的家庭車”,而是走向了一個更大的問題:當(dāng)AI從屏幕走向物理世界,一輛車在未來到底應(yīng)該變成什么?
![]()
理想最新的回答是,造一個披著汽車外衣,能感知、思考、行動、反饋的硅基生命體。
過去,車的終點是把人從A點送到B點;現(xiàn)在,車被放進了更長的演化鏈條里:先成為硅基司機,再通向硅基保姆,最終演化出具身智能時代的通用機器人。
這也是李想最近提出“自動駕駛是具身智能的上半場,通用人形機器人是具身智能的下半場”行業(yè)觀點的真正背景。
這句話表面上是在定義一個新賽道,實際上是在用李想的方式,重新定義理想自己。
具身智能的分野
2024年的Chatbot,2025年的視頻生成大模型,以及2026年開年的龍蝦熱,一次又一次地震撼著碳基生命:
僅僅活在數(shù)字空間里,AI就已經(jīng)帶來了可觀的生產(chǎn)力供給提升,如果走向物理世界,它會創(chuàng)造多大價值?
物理AI,現(xiàn)在通常被稱為具身智能。特斯拉帶頭,自2022年將人形機器人從實驗室敘事,推成了資本市場與公眾輿論的焦點后,科技大廠相繼下場,創(chuàng)業(yè)公司一擁而上。
而過去兩年,在經(jīng)歷了高強度的機器人跳舞、機器人馬拉松、機器人進工廠運動后,公眾幾乎已經(jīng)把具身智能和人形機器人畫上了等號,更油然而生出一種期待:
機器人今年都能跳托馬斯回旋了,明年幫我做家務(wù)豈不是手拿把掐?
但實際情況是,眼下的人形機器人受限于數(shù)據(jù)、算法、硬件、產(chǎn)品質(zhì)量體系等各個維度的難題,疊好一件衣服都成問題,進度約等于2015年的電動車。
反倒是今天帶有高階智能駕駛的汽車,已經(jīng)能夠解讀人類模糊的語音指令,在幾十公里的距離上無需人類接管,把人送到目的地。
顯然,同樣是帶有大腦、眼睛與運動機構(gòu)的智能設(shè)備,不似人形的自動駕駛汽車,如今比人形機器人更能代表具身智能:實際落地應(yīng)用規(guī)模更大、供應(yīng)鏈成熟度更高、離商業(yè)閉環(huán)更近。
![]()
李想的具身智能上下半場論
當(dāng)數(shù)不清的科技大廠與創(chuàng)業(yè)公司入局打造人形機器人之時,一些掌握自動駕駛技術(shù)的車企,已經(jīng)攥著半張直通具身智能決賽圈的門票:
從技術(shù)來看,帶有自動駕駛能力的智能汽車本就是一種廣義的機器人,兩者技術(shù)棧高度同源。
這不僅意味著車企為自動駕駛構(gòu)建的感知、規(guī)劃、交互、運動能力可遷移至其他形態(tài)機器人,也意味著芯片、傳感器、能源等硬件體系,以及數(shù)據(jù)、基座模型、云端算力等基礎(chǔ)設(shè)施資產(chǎn),也可以被批量復(fù)用。
從商業(yè)維度來考慮,人形機器人在規(guī)模化量產(chǎn)前,還會經(jīng)歷長時間、高強度的研發(fā)階段,年營收千億的車企,有現(xiàn)金流扛起每年上百億的研發(fā)支出。
同時,車企的生產(chǎn)工廠與銷售門店,天然為機器人早期落地提供了冷啟動的場景;車企積累的C端用戶,則會是機器人大規(guī)模商業(yè)化時的有生力量。
此外,車企在汽車業(yè)務(wù)中錘煉的產(chǎn)品定義能力、生產(chǎn)制造管理體系,同樣是大規(guī)模制造機器人時,需要點出的前置科技樹。
李想提出的具身智能上下半場論,言外之意是,一家具備自動駕駛研發(fā)能力的車企,每賣出一輛智能汽車,不只是掙得幾十萬營收,更是鋪下了一塊通往具身智能終局的路基。
節(jié)奏,被忽視的賽點
在科技商業(yè)史中,一個屢見不鮮的現(xiàn)象是,最早投入一項新技術(shù)的企業(yè)往往摘不到最大的果實。
因為在“早半步是先驅(qū)、早一步是先烈"的泛科技產(chǎn)業(yè)中,企業(yè)看錯方向固然危險,但更常見的死法是看對了方向,卻踏錯了節(jié)奏。其表象是快或慢,但更底層是技術(shù)、成本、場景和用戶預(yù)期之間,是否達成了匹配。
技術(shù)太早,產(chǎn)品就只能停留在演示;成本太高,商業(yè)閉環(huán)就無法成立;場景框得太大,穩(wěn)定性就會被真實世界反復(fù)拷打;預(yù)期拉得太高,用戶信任則會在一次次落差中被消耗。
具身智能尤其是人形機器人,并沒有吸取前車之鑒,各要素的錯配仍在放大。
原因在于,當(dāng)看不清未來時,在害怕錯過的情緒驅(qū)使下,社會資源會非理性地往人形機器人過度富集,也將對其期望推向巔峰。而一旦發(fā)現(xiàn)不能快速落地,隨之而來的就是“絕望之谷”。
一家企業(yè)如果對此沒有前瞻判斷,同周期隨波逐流,結(jié)果是浪費大量資源和機遇,更壞的結(jié)果將是退出舞臺。
![]()
這也是為何李想會在定義具身智能上下半場的同時,以5年為刻度,將其劃分為六個階段。
其中自動駕駛這個上半場分為:2018-2023年為L2輔助駕駛階段;2023年至2028年,L3自動駕駛階段;2028年至2033年,是L4無人駕駛階段。
到下半場,通用人形機器人的節(jié)奏則是:2030年至2035年,具備相當(dāng)于6歲兒童的泛化能力;2035年至2040年,達到12歲水平;2040年到AGI實現(xiàn)前后,具備接近18歲成人的泛化能力。
本質(zhì)上,這是李想在多次創(chuàng)業(yè)的經(jīng)驗積累上,吸收大量研發(fā)、業(yè)務(wù)、供應(yīng)鏈一手信息,為具身智能畫出的成熟度坐標(biāo)系與關(guān)鍵技術(shù)圖譜。
它把具身智能從一步到位的效果演示、終局想象,拆成了具體且循序漸進的六級階梯。
對理想公司而言,它類似于“五年計劃”,指引理想核心技術(shù)、產(chǎn)品與組織的變陣節(jié)奏。而在行業(yè)中,當(dāng)李想將這套坐標(biāo)系“開源”,就像過去幾年發(fā)生的,它大概率會被集體學(xué)習(xí),隨后被組織為新的共識。
2020年之前,當(dāng)新能源汽車市場絕大多數(shù)資源投向插混與純電時,理想選擇押注增程與家庭旗艦SUV,隨后被行業(yè)競相效仿,最終促成了一個千億規(guī)模市場的誕生。
把握節(jié)奏,找到階段性最容易實現(xiàn)商業(yè)閉環(huán)的入口,一直是李想創(chuàng)業(yè)以來的強項。只是這一次,李想想用它撬動的,是萬億級的具身智能市場。
用造人的方式造車
在具身智能上下半場的分野中,2026年是一個臨近中場的年份。
一邊,L3自動駕駛的商業(yè)化呼之欲出,L4無人駕駛正在加速驗證可行性;另一邊,人形機器人雖然仍在早期,卻已經(jīng)開始在部分細分場景中努力自證價值——上半場還沒有結(jié)束,下半場已經(jīng)在熱身。
對一家有雄心的車企來說,此時最重要的問題,是由內(nèi)而外,從組織、技術(shù)到產(chǎn) 品,都統(tǒng)一到新的語境與目標(biāo)下:
在能力上,要能橫跨具身智能的上下半場;造車的目標(biāo),也從“造一輛更聰明的車”,變成了“造一個能夠感知、思考、行動、反饋的硅基生命體”。
這也是理想今年一月重構(gòu)研發(fā)體系的原因。
過去汽車研發(fā)的組織方式,大多圍繞軟硬件功能劃分:硬件歸硬件,軟件歸軟件,智能駕駛歸智能駕駛,座艙歸座艙。這套方法適合造傳統(tǒng)汽車,甚至也適合造一輛初級智能汽車,但到了具身智能階段,它開始顯得不夠用了。
因為新的技術(shù)命題,已經(jīng)不再是給一輛車增加幾個智能功能,而是讓一輛車愈發(fā)逼近生命體:它要有心臟提供算力,有眼睛理解世界,有大腦做出判斷,有手腳完成動作,還要有神經(jīng)系統(tǒng)把各個器官連接起來。
如果產(chǎn)品正在變成一個“人”,組織還停留在按傳統(tǒng)零件劃分,就會出現(xiàn)錯位。
理想的做法,是用"造人"的方式重構(gòu)組織。研發(fā)團隊不再簡單按軟硬件切塊,而是圍繞數(shù)字人與硅基人的能力方劃分為Infra團隊、基座模型團隊、軟件本體團隊、硬件本體團隊和評估團隊。
其中Infra提供算力基礎(chǔ)設(shè)施與數(shù)據(jù)工程,類似心臟和能量系統(tǒng);基座模型負責(zé)多模態(tài)預(yù)訓(xùn)練與后訓(xùn)練,類似大腦;軟件本體負責(zé)Agent、工具鏈、記憶與上下文工程,承擔(dān)執(zhí)行與交互;硬件本體負責(zé)芯片、傳感器和機器人硬件,構(gòu)建物理身體;評估團隊則像免疫系統(tǒng),獨立判斷軟硬件本體的工作質(zhì)量。
這套組織調(diào)整的意義,是讓理想第一次把汽車、Agent和機器人放進了同一套研發(fā)語言里。
五月發(fā)布的全新理想L9 Livis,則是這套語言在產(chǎn)品端的第一次集中呈現(xiàn),也是理想第一次明確用造機器人的思路造一輛車:
![]()
心臟是兩枚自研的馬赫M100芯片,用2560 TOPS的有效算力,保障大腦和眼睛的敏捷運轉(zhuǎn)。
眼睛是從2D ViT到3D ViT的感知算法升級,讓車對世界的理解,從二維提升到充分理解距離、速度、遮擋和運動關(guān)系的三維空間,真正像人一樣看世界,從而為L3乃至L4自動駕駛做準(zhǔn)備。
大腦是馬赫VLA模型。憑借數(shù)十億參數(shù)模型中濃縮的知識,它相當(dāng)于聽懂話、會看路、懂開車的專職司機。
手腳則是“完全體”線控底盤和800V主動懸架。線控轉(zhuǎn)向、后輪轉(zhuǎn)向、線控機械制動EMB,讓模型輸出不必再繞過多層機械和控制器鏈路,而是可以更直接地作用于車輛動作,從而以比人類更快的反應(yīng)速度執(zhí)行車輛控制指令。
扮演神經(jīng)系統(tǒng)的是星環(huán)OS。它負責(zé)把芯片、模型、感知、控制和應(yīng)用連接起來,讓各個器官不再各自為戰(zhàn),真正組成一個無縫協(xié)作的整體。
這些器官不僅僅指向一輛車的核心競爭力,在不遠的將來,更是一款機器人得以量產(chǎn)的地基,因此理想采取了全面深度自研的策略。
但理想又并非為了自研而自研。正如早期智人的眼、腦、手腳、脊椎協(xié)同進化,才產(chǎn)生了地球上最聰明的物種,同樣,讓機器人的器官在統(tǒng)一意志下協(xié)同研發(fā),才能把具身智能推向真正的智能,讓看得見、摸得著,讓能夠幫人做事的物理AI盡早走向用戶。
從這個角度看,L9 Livis是理想具身智能戰(zhàn)略的入口,也是一個接口。
它一頭連接自動駕駛汽車,一頭連接未來通用人形機器人;一頭承接理想過去十年在汽車上的工程積累,一頭指向未來十年“硅基司機”和“硅基保姆”的產(chǎn)品想象。
理想仍然在造車,它正在嘗試用造人的方式,重新定義汽車產(chǎn)品的未來。
![]()
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.