網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

李想重畫具身智能

2026-05-20 21:17:17　來源: 遠川科技評論

上海舉報

分享至

在成立的十一年中，理想汽車最擅長也最聲名在外的能力，是把復(fù)雜技術(shù)與家庭的出行需求對齊。

增程不是一套非主流動力架構(gòu)，而是“沒有里程焦慮”；大型SUV不是一組車身尺寸，而是“一家人坐得舒服”；冰箱、彩電、大沙發(fā)不是配置堆疊，而是讓一輛車成為自在的移動空間的必需品。

這套方法曾經(jīng)讓理想從一堆更先鋒、更激進、更性感的技術(shù)路線中，找到了一個最容易商業(yè)閉環(huán)的入口。別人忙著證明自己更像未來，理想先回答了一個更樸素的問題：今天的用戶到底愿意為什么買單。

但到了2026年，理想已經(jīng)不再滿足于回答“什么是一輛更好的家庭車”，而是走向了一個更大的問題：當(dāng)AI從屏幕走向物理世界，一輛車在未來到底應(yīng)該變成什么？

理想最新的回答是，造一個披著汽車外衣，能感知、思考、行動、反饋的硅基生命體。

過去，車的終點是把人從A點送到B點；現(xiàn)在，車被放進了更長的演化鏈條里：先成為硅基司機，再通向硅基保姆，最終演化出具身智能時代的通用機器人。

這也是李想最近提出“自動駕駛是具身智能的上半場，通用人形機器人是具身智能的下半場”行業(yè)觀點的真正背景。

這句話表面上是在定義一個新賽道，實際上是在用李想的方式，重新定義理想自己。

具身智能的分野

2024年的Chatbot，2025年的視頻生成大模型，以及2026年開年的龍蝦熱，一次又一次地震撼著碳基生命：

僅僅活在數(shù)字空間里，AI就已經(jīng)帶來了可觀的生產(chǎn)力供給提升，如果走向物理世界，它會創(chuàng)造多大價值？

物理AI，現(xiàn)在通常被稱為具身智能。特斯拉帶頭，自2022年將人形機器人從實驗室敘事，推成了資本市場與公眾輿論的焦點后，科技大廠相繼下場，創(chuàng)業(yè)公司一擁而上。

而過去兩年，在經(jīng)歷了高強度的機器人跳舞、機器人馬拉松、機器人進工廠運動后，公眾幾乎已經(jīng)把具身智能和人形機器人畫上了等號，更油然而生出一種期待：

機器人今年都能跳托馬斯回旋了，明年幫我做家務(wù)豈不是手拿把掐？

但實際情況是，眼下的人形機器人受限于數(shù)據(jù)、算法、硬件、產(chǎn)品質(zhì)量體系等各個維度的難題，疊好一件衣服都成問題，進度約等于2015年的電動車。

反倒是今天帶有高階智能駕駛的汽車，已經(jīng)能夠解讀人類模糊的語音指令，在幾十公里的距離上無需人類接管，把人送到目的地。

顯然，同樣是帶有大腦、眼睛與運動機構(gòu)的智能設(shè)備，不似人形的自動駕駛汽車，如今比人形機器人更能代表具身智能：實際落地應(yīng)用規(guī)模更大、供應(yīng)鏈成熟度更高、離商業(yè)閉環(huán)更近。

李想的具身智能上下半場論

當(dāng)數(shù)不清的科技大廠與創(chuàng)業(yè)公司入局打造人形機器人之時，一些掌握自動駕駛技術(shù)的車企，已經(jīng)攥著半張直通具身智能決賽圈的門票：

從技術(shù)來看，帶有自動駕駛能力的智能汽車本就是一種廣義的機器人，兩者技術(shù)棧高度同源。

這不僅意味著車企為自動駕駛構(gòu)建的感知、規(guī)劃、交互、運動能力可遷移至其他形態(tài)機器人，也意味著芯片、傳感器、能源等硬件體系，以及數(shù)據(jù)、基座模型、云端算力等基礎(chǔ)設(shè)施資產(chǎn)，也可以被批量復(fù)用。

從商業(yè)維度來考慮，人形機器人在規(guī)模化量產(chǎn)前，還會經(jīng)歷長時間、高強度的研發(fā)階段，年營收千億的車企，有現(xiàn)金流扛起每年上百億的研發(fā)支出。

同時，車企的生產(chǎn)工廠與銷售門店，天然為機器人早期落地提供了冷啟動的場景；車企積累的C端用戶，則會是機器人大規(guī)模商業(yè)化時的有生力量。

此外，車企在汽車業(yè)務(wù)中錘煉的產(chǎn)品定義能力、生產(chǎn)制造管理體系，同樣是大規(guī)模制造機器人時，需要點出的前置科技樹。

李想提出的具身智能上下半場論，言外之意是，一家具備自動駕駛研發(fā)能力的車企，每賣出一輛智能汽車，不只是掙得幾十萬營收，更是鋪下了一塊通往具身智能終局的路基。

節(jié)奏，被忽視的賽點

在科技商業(yè)史中，一個屢見不鮮的現(xiàn)象是，最早投入一項新技術(shù)的企業(yè)往往摘不到最大的果實。

因為在“早半步是先驅(qū)、早一步是先烈"的泛科技產(chǎn)業(yè)中，企業(yè)看錯方向固然危險，但更常見的死法是看對了方向，卻踏錯了節(jié)奏。其表象是快或慢，但更底層是技術(shù)、成本、場景和用戶預(yù)期之間，是否達成了匹配。

技術(shù)太早，產(chǎn)品就只能停留在演示；成本太高，商業(yè)閉環(huán)就無法成立；場景框得太大，穩(wěn)定性就會被真實世界反復(fù)拷打；預(yù)期拉得太高，用戶信任則會在一次次落差中被消耗。

具身智能尤其是人形機器人，并沒有吸取前車之鑒，各要素的錯配仍在放大。

原因在于，當(dāng)看不清未來時，在害怕錯過的情緒驅(qū)使下，社會資源會非理性地往人形機器人過度富集，也將對其期望推向巔峰。而一旦發(fā)現(xiàn)不能快速落地，隨之而來的就是“絕望之谷”。

一家企業(yè)如果對此沒有前瞻判斷，同周期隨波逐流，結(jié)果是浪費大量資源和機遇，更壞的結(jié)果將是退出舞臺。

這也是為何李想會在定義具身智能上下半場的同時，以5年為刻度，將其劃分為六個階段。

其中自動駕駛這個上半場分為：2018-2023年為L2輔助駕駛階段；2023年至2028年，L3自動駕駛階段；2028年至2033年，是L4無人駕駛階段。

到下半場，通用人形機器人的節(jié)奏則是：2030年至2035年，具備相當(dāng)于6歲兒童的泛化能力；2035年至2040年，達到12歲水平；2040年到AGI實現(xiàn)前后，具備接近18歲成人的泛化能力。

本質(zhì)上，這是李想在多次創(chuàng)業(yè)的經(jīng)驗積累上，吸收大量研發(fā)、業(yè)務(wù)、供應(yīng)鏈一手信息，為具身智能畫出的成熟度坐標(biāo)系與關(guān)鍵技術(shù)圖譜。

它把具身智能從一步到位的效果演示、終局想象，拆成了具體且循序漸進的六級階梯。

對理想公司而言，它類似于“五年計劃”，指引理想核心技術(shù)、產(chǎn)品與組織的變陣節(jié)奏。而在行業(yè)中，當(dāng)李想將這套坐標(biāo)系“開源”，就像過去幾年發(fā)生的，它大概率會被集體學(xué)習(xí)，隨后被組織為新的共識。

2020年之前，當(dāng)新能源汽車市場絕大多數(shù)資源投向插混與純電時，理想選擇押注增程與家庭旗艦SUV，隨后被行業(yè)競相效仿，最終促成了一個千億規(guī)模市場的誕生。

把握節(jié)奏，找到階段性最容易實現(xiàn)商業(yè)閉環(huán)的入口，一直是李想創(chuàng)業(yè)以來的強項。只是這一次，李想想用它撬動的，是萬億級的具身智能市場。

用造人的方式造車

在具身智能上下半場的分野中，2026年是一個臨近中場的年份。

一邊，L3自動駕駛的商業(yè)化呼之欲出，L4無人駕駛正在加速驗證可行性；另一邊，人形機器人雖然仍在早期，卻已經(jīng)開始在部分細分場景中努力自證價值——上半場還沒有結(jié)束，下半場已經(jīng)在熱身。

對一家有雄心的車企來說，此時最重要的問題，是由內(nèi)而外，從組織、技術(shù)到產(chǎn) 品，都統(tǒng)一到新的語境與目標(biāo)下：

在能力上，要能橫跨具身智能的上下半場；造車的目標(biāo)，也從“造一輛更聰明的車”，變成了“造一個能夠感知、思考、行動、反饋的硅基生命體”。

這也是理想今年一月重構(gòu)研發(fā)體系的原因。

過去汽車研發(fā)的組織方式，大多圍繞軟硬件功能劃分：硬件歸硬件，軟件歸軟件，智能駕駛歸智能駕駛，座艙歸座艙。這套方法適合造傳統(tǒng)汽車，甚至也適合造一輛初級智能汽車，但到了具身智能階段，它開始顯得不夠用了。

因為新的技術(shù)命題，已經(jīng)不再是給一輛車增加幾個智能功能，而是讓一輛車愈發(fā)逼近生命體：它要有心臟提供算力，有眼睛理解世界，有大腦做出判斷，有手腳完成動作，還要有神經(jīng)系統(tǒng)把各個器官連接起來。

如果產(chǎn)品正在變成一個“人”，組織還停留在按傳統(tǒng)零件劃分，就會出現(xiàn)錯位。

理想的做法，是用"造人"的方式重構(gòu)組織。研發(fā)團隊不再簡單按軟硬件切塊，而是圍繞數(shù)字人與硅基人的能力方劃分為Infra團隊、基座模型團隊、軟件本體團隊、硬件本體團隊和評估團隊。

其中Infra提供算力基礎(chǔ)設(shè)施與數(shù)據(jù)工程，類似心臟和能量系統(tǒng)；基座模型負責(zé)多模態(tài)預(yù)訓(xùn)練與后訓(xùn)練，類似大腦；軟件本體負責(zé)Agent、工具鏈、記憶與上下文工程，承擔(dān)執(zhí)行與交互；硬件本體負責(zé)芯片、傳感器和機器人硬件，構(gòu)建物理身體；評估團隊則像免疫系統(tǒng)，獨立判斷軟硬件本體的工作質(zhì)量。

這套組織調(diào)整的意義，是讓理想第一次把汽車、Agent和機器人放進了同一套研發(fā)語言里。

五月發(fā)布的全新理想L9 Livis，則是這套語言在產(chǎn)品端的第一次集中呈現(xiàn)，也是理想第一次明確用造機器人的思路造一輛車：

心臟是兩枚自研的馬赫M100芯片，用2560 TOPS的有效算力，保障大腦和眼睛的敏捷運轉(zhuǎn)。

眼睛是從2D ViT到3D ViT的感知算法升級，讓車對世界的理解，從二維提升到充分理解距離、速度、遮擋和運動關(guān)系的三維空間，真正像人一樣看世界，從而為L3乃至L4自動駕駛做準(zhǔn)備。

大腦是馬赫VLA模型。憑借數(shù)十億參數(shù)模型中濃縮的知識，它相當(dāng)于聽懂話、會看路、懂開車的專職司機。

手腳則是“完全體”線控底盤和800V主動懸架。線控轉(zhuǎn)向、后輪轉(zhuǎn)向、線控機械制動EMB，讓模型輸出不必再繞過多層機械和控制器鏈路，而是可以更直接地作用于車輛動作，從而以比人類更快的反應(yīng)速度執(zhí)行車輛控制指令。

扮演神經(jīng)系統(tǒng)的是星環(huán)OS。它負責(zé)把芯片、模型、感知、控制和應(yīng)用連接起來，讓各個器官不再各自為戰(zhàn)，真正組成一個無縫協(xié)作的整體。

這些器官不僅僅指向一輛車的核心競爭力，在不遠的將來，更是一款機器人得以量產(chǎn)的地基，因此理想采取了全面深度自研的策略。

但理想又并非為了自研而自研。正如早期智人的眼、腦、手腳、脊椎協(xié)同進化，才產(chǎn)生了地球上最聰明的物種，同樣，讓機器人的器官在統(tǒng)一意志下協(xié)同研發(fā)，才能把具身智能推向真正的智能，讓看得見、摸得著，讓能夠幫人做事的物理AI盡早走向用戶。

從這個角度看，L9 Livis是理想具身智能戰(zhàn)略的入口，也是一個接口。

它一頭連接自動駕駛汽車，一頭連接未來通用人形機器人；一頭承接理想過去十年在汽車上的工程積累，一頭指向未來十年“硅基司機”和“硅基保姆”的產(chǎn)品想象。

理想仍然在造車，它正在嘗試用造人的方式，重新定義汽車產(chǎn)品的未來。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.