![]()
作者 | 周一笑
郵箱 | zhouyixiao@pingwest.com
AI最先征服的是屏幕,最難進入的是現實世界。在屏幕里,AI犯錯最多是答錯一道題、寫壞一段代碼;到了現實世界,一旦出錯,就會撞上車、人和道路。
過去三年,大語言模型、AI編程和Agent平臺擠進同一片數字戰場,模型能力、價格和分發渠道都在快速內卷。但當黃仁勛在CES 2026上宣告機器人領域的ChatGPT時刻已經到來,把“物理AI”推到行業聚光燈中心的時候,一個新的問題浮出水面,從屏幕里走出來的AI,要如何在真實的物理世界里站住腳?在黃仁勛的描述中,物理AI的核心在于讓AI理解真實世界,并據此進行推理和規劃行動。
同期,英偉達也在把Physical AI推向基礎設施層面,Cosmos用于世界模型和合成數據,GR00T面向機器人學習與推理,Isaac Lab-Arena用于評估,OSMO則打通從邊緣到云端的訓練流程。它傳遞出的意思很明確,AI走進物理世界,不只是模型能力問題,也是一整套仿真、訓練、驗證和部署基礎設施的問題。
資本率先給出了回應。具身智能成了2026年最火熱的賽道,融資額一路飆升,百億估值的公司接連涌現。但熱鬧背后有一個更根本的問題,物理AI的門檻不在于誰喊概念更響、誰融資更多,而在于誰先拿到進入長賽道的“門票”,即規模化數據、可持續現金流,以及真實世界里的量產驗證。
物理AI不是一條單線賽道。具身智能、自動駕駛、工業機器人、邊緣AI,都在把AI從屏幕帶進現實世界,它們之間也并非對立關系,更像是物理AI走向現實的不同入口,只是節奏各異。從今天的真實世界數據、現金流和量產驗證看,自動駕駛可能是更早接近閉環的一支。
![]()
4月25日,北京車展期間,“物理AI”成了多家智駕公司發布會上的高頻詞。Momenta R7強化學習世界模型的量產首發,是其中值得關注的一個樣本。R7代表了Momenta這一代智駕系統的核心模型思路,在世界模型構建的虛擬環境中進行強化學習,讓車在行動前先預演世界會怎樣變化。按Momenta披露,搭載其系統的量產車輛規模已超過80萬臺,R7是在這個量產基座上完成的一次架構升級。
1
為什么是自動駕駛
為什么物理AI沒有像ChatGPT那樣迅速爆發?一個被反復討論的原因是成本結構。數字AI的數據來自互聯網,天然大規模、低成本、易獲取,驗證也便宜,Agent調用一個工具只需要一個API接口。物理世界的邏輯完全不同,數據采集難,測試周期長,試錯代價高。OpenAI早年同時布局機器人和語言模型,最終階段性選擇GPT,背后正是這種成本結構差異。
但物理世界“可能是更大的一部分”。這是Momenta CEO曹旭東在北京車展期間反復提到的一個判斷。在他看來,自動駕駛是最先規模化跑通“數據閉環”和“商業閉環”的物理AI場景。體驗提升帶來商業化,商業化帶來數據回流,數據再推動模型能力躍升,一旦這個循環轉起來,進步的速度會遠超直覺。他分享過一個觀察,“任何一個人工智能應用,一旦接近人類的水平,就會在很短的時間內大幅超過人類的水平。”前面可能花十年、二十年爬坡,但超越人可能就發生在一兩年內。
從這個角度看,搭載Momenta系統的量產車輛規模超過80萬臺,意味著Momenta已經是少數成功在真實世界中積累物理AI數據、工程經驗和商業閉環的公司之一。曹旭東認為,智駕領域正在呈現一種“摩爾定律”式的進步節奏,過去大約是兩年十倍的提升速度,行業領軍企業甚至可能做到一年十倍。
![]()
類似的判斷也出現在硅谷。2026年CES期間,Mobileye宣布以約9億美元收購人形機器人公司Mentee Robotics,并把這視為進入“Mobileye 3.0”的一步。Mobileye給出的理由是,自動駕駛和機器人共享一部分底層Physical AI能力,包括感知、世界建模、規劃控制,以及不確定性下的決策。這說明,自動駕駛公司積累的能力,正在被重新理解為可以泛化到更廣義物理AI的平臺能力。
1
在模型里的世界先練車
“世界模型”正在成為自動駕駛行業越來越重要的關鍵詞。
2026年2月,Waymo發布了基于Google DeepMind Genie 3構建的Waymo World Model,用于生成高真實度、可交互的自動駕駛仿真環境,尤其覆蓋現實中難以大規模采集的長尾場景。Momenta R7也處在這一大方向上,只是它強調的是強化學習世界模型的量產首發。這說明,世界模型不再只是自動駕駛論文里的概念,而是正在變成頭部玩家處理長尾風險和仿真訓練的共同語言。
![]()
按Momenta的拆解,這套世界模型分為三層。最底層是預訓練,讓系統擁有物理常識,依托量產車隊產生的海量真實駕駛數據,將物理規律、常識與因果關系壓縮進模型。在常識之上是仿真,核心是讓系統理解“如果我的行為發生變化,世界將如何演變”。最關鍵的一層是在世界模型中進行強化學習,系統從單純的模仿學習走向“想象與探索”,在虛擬世界里經歷千萬次推演,自主學會在復雜博弈中做出最優決策。
一個具體的例子,如果前車意外掉落一箱蘋果,R7能預判蘋果滾落的軌跡與擴散范圍,提前平穩減速并規劃繞行路線。只依賴已有數據分布和真實路測,很難窮盡這類低頻風險。世界模型正在把長尾問題從“碰巧遇到”轉向“可推演、可訓練”。當然,這不意味著系統已經窮盡了所有極端風險,但方向已經明確。不過,世界模型也并不意味著可以繞開真實道路。仿真可以擴大長尾場景覆蓋,卻無法完全復制真實世界的不確定性,最終仍需要真實驗證。這也解釋了為什么“量產”和“真實道路閉環”在物理AI里如此重要。
![]()
如果借用數字AI的理解框架,世界模型預訓練有點像讓大模型先獲得通識常識,而強化學習則是把常識對齊到更好的行為上。區別在于,數字AI對齊的是“回答更好”,物理AI對齊的是在真實物理約束下更安全、更從容地行動。
1
物理AI的門檻
資本熱不是問題,物理AI本來就需要長期資金。另據公開統計顯示,2026年前幾個月,中國具身智能融資已進入百億級密集爆發階段。但資本只能更快地為試錯掃清障礙,卻買不來完整的物理世界周期。安全驗證、供應鏈適配、車規級測試、功能安全認證,每一個環節都會把速度重新拉慢。
曹旭東給出了一個更量化的判斷,物理AI需要一張“門票”,這張門票的本質是能夠長期支撐研發的現金流業務。實現規模化L4自動駕駛,累計投入至少需要百億美元級;通用機器人可能進一步上升到幾百億甚至千億美元級。單靠融資,長期看并不現實。
時間壁壘同樣真實。自動駕駛軟件具備接近零邊際成本的規模效應,先發優勢因此格外顯著。以奔馳為例,2017年投資Momenta,是由奔馳董事長康林松親自決策,但第一個量產項目上市是2025年下半年,整整八年。國際OEM的合作周期是五到七年,國內也要三年。而德系豪華所代表的全球最嚴苛標準,甚至需要更長時間,有時要長達十年。但一旦成功拿下,就有望迎來“贏者通吃”的局面,實現“馬太效應”。
這種技術和產業規模上的先發優勢也會體現在對資本市場資源的更可持續的使用上,更加接近終局的公司在快速進入更成熟的資源池。
據媒體報道,Momenta已向港交所秘密遞交招股書,IPO估值預期超千億元,計劃年內掛牌。2024年下半年曾啟動Pre-IPO融資,交割金額超10億美元。
1
真正的測試場
如果說門票理論是一種行業推演,那么BBA的選擇就是一種現實驗證。
按Momenta披露,本屆北京車展有超過20個品牌、60余款車型搭載其方案,其中包括梅賽德斯-奔馳、奧迪、寶馬的新發布車型。這組客戶的意義不在于名單本身,而在于它們代表了全球汽車工業里門檻最高、最重視安全冗余的一批需求。能夠進入這些品牌的量產體系,本身就是對一家AI公司技術成熟度和工程交付能力的高強度檢驗。
奧迪AUDI品牌產品研發執行副總裁Martin Kraus在北京車展的一場圓桌中說了一句很直白的話,“質量和安全標準是沒得商量的。”按他的說法,E7X將成為奧迪家族全球范圍內第一款搭載L3級自動駕駛系統的車型,也將是Momenta首款搭載L3系統的量產車型。
![]()
曹旭東把與BBA的合作過程概括為“打合”,“高級的合作,永遠是團結、碰撞、再團結。”奔馳團隊曾反復挑戰一個極端場景,高速上沒有燈光,一個摩托車騎手摔倒,戴著黑色頭盔,頭朝后方。這類碰撞的價值在于,它把AI能力拉進了傳統汽車工業最嚴苛的安全語境里。據現場介紹,奔馳與Momenta累計測試里程達80億公里,同時奔馳還堅持“油電同智”,希望在油車上也實現接近電車的智能駕駛體驗。
圓桌上,一位奧迪車主講起京滬高速上的一次經歷,前車連續追尾,系統幫他剎住并駛離超車道。他給母親打電話,“你幫我把湯熱一下,我要到家了。”
這比任何參數都更能解釋安全標準的意義,它最后要回答的,是一個人能不能安全回家。
梅賽德斯-奔馳中國研發自動駕駛及車聯網執行副總裁王忻在同一場圓桌中提到,AI進入物理世界時,“這個虛擬人也需要有情感,它也要有‘害怕’”。物理AI如果只理解物理規律,還不夠,它最后要理解的是坐在車里的人如何感到安全和從容。
對中國AI公司來說,真正的全球競爭力不只是速度和成本,還要能進入全球汽車工業最復雜、也最難妥協的量產體系。
從行業視角看,Momenta這樣的公司在今天的物理AI版圖里占據了一個特殊位置。它并不只是做一套智駕系統,而是在真實道路上積累物理AI所需的底層能力,包括數據閉環、世界模型訓練、仿真驗證、車規級安全和量產交付。今天這些能力服務于智能駕駛,未來也可能外溢到Robotaxi、物流、低速無人車,甚至更廣義的具身智能場景。
自動駕駛不是物理AI的終點。但它可能是這場長賽道上,最先被真實世界驗證的一張門票。
![]()
點個“愛心”,再走 吧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.