文 | 具身商業(yè)前哨
“中國機(jī)器人和美國機(jī)器人之間的差距,不是越來越小,反而越來越大了。”一位機(jī)器人本體廠商的產(chǎn)品負(fù)責(zé)人對(duì)「具身商業(yè)前哨」表示。
這句話聽起來有些刺耳,但并非沒有道理。
就在國內(nèi)還在討論融資、量產(chǎn)和價(jià)格時(shí),特斯拉、Figure和1X已經(jīng)把問題推進(jìn)到另一個(gè)層面:機(jī)器人的競爭正在走向“Physical AI”。
近期,我們梳理了特斯拉、Figure和1X在技術(shù)路線、核心部件、制造體系以及商業(yè)化落地上的信息。一個(gè)明顯變化是:海外頭部機(jī)器人公司正在弱化單純的本體參數(shù),更加強(qiáng)調(diào)AI大腦、世界模型、VLA模型、端側(cè)推理、真實(shí)數(shù)據(jù)閉環(huán),以及規(guī)模化制造能力。
![]()
這是一個(gè)明顯的信號(hào),人形機(jī)器人不再只是一個(gè)會(huì)動(dòng)的機(jī)器,而正在成為“AI進(jìn)入物理世界的入口”。
特斯拉:打造人形機(jī)器人的基礎(chǔ)設(shè)施
特斯拉正在把自身能力,從電動(dòng)車制造延伸到Physical AI平臺(tái)。其最大的優(yōu)勢(shì),不是Optimus V3的本體,而是它背后那套已經(jīng)被自動(dòng)駕駛驗(yàn)證過的AI基礎(chǔ)設(shè)施,正在開始落地到機(jī)器人領(lǐng)域。
馬斯克最近在財(cái)報(bào)會(huì)上也提到,Optimus V3不愿意過早公開展示,因?yàn)楦偁帉?duì)手可能會(huì)逐幀分析并復(fù)制。特斯拉最新計(jì)劃在7月底或8月初啟動(dòng)Optimus的量產(chǎn)。
![]()
今年4月,特斯拉下一代AI推理芯片AI5受到持續(xù)關(guān)注。按照特斯拉的長期規(guī)劃,這類AI芯片不只服務(wù)汽車,也會(huì)服務(wù)Optimus以及未來更大規(guī)模的AI計(jì)算需求。
行業(yè)人士分析:特斯拉做機(jī)器人,并不是只做一個(gè)機(jī)械本體,而是在圍繞“AI如何進(jìn)入物理世界”搭建底層基礎(chǔ)設(shè)施。
“別人是在訓(xùn)練機(jī)器人,特斯拉更像是在訓(xùn)練Physical AI。”行業(yè)人士分析,特斯拉的優(yōu)勢(shì)包括數(shù)十億英里的FSD真實(shí)道路數(shù)據(jù)、長期積累的視覺感知和世界模型訓(xùn)練經(jīng)驗(yàn)、自研AI芯片和端側(cè)推理體系、超算和訓(xùn)練基礎(chǔ)設(shè)施、軟件棧和制造體系協(xié)同能力。
在核心部件層面,雖然外界很難獲得Optimus V3的完整參數(shù),但從目前曝光的信息和官方的公開表述來看,至少有幾個(gè)方向值得關(guān)注。
第一,Optimus V3的整體身高仍在173cm左右,但體重有望進(jìn)一步減輕20%,姿態(tài)和運(yùn)動(dòng)方式會(huì)更接近真人,總自由度預(yù)計(jì)超過50個(gè)。
第二,觸覺傳感、皮膚材料、零部件集成度和電池續(xù)航能力,都會(huì)繼續(xù)升級(jí)。這些變化是為了更方便量產(chǎn)、更穩(wěn)定工作。
第三,新一代靈巧手可能擁有22個(gè)自由度,更接近真人手掌比例,并具備力反饋和指尖觸覺傳感能力。
靈巧手也是特斯拉反復(fù)推遲Optimus展示和量產(chǎn)節(jié)奏的重要原因之一。行業(yè)人士表示,人形機(jī)器人最難的部分,往往不是讓它走起來,而是讓它穩(wěn)定、可靠、低成本地完成真實(shí)工作。
在商業(yè)落地上,特斯拉是為數(shù)不多同時(shí)造汽車和機(jī)器人的超級(jí)平臺(tái),所以這也是馬斯克敢于提出要把Optimus的售價(jià)壓低在2萬美元的底氣之一。
據(jù)公開報(bào)道,弗里蒙特相關(guān)產(chǎn)線的遠(yuǎn)期目標(biāo)年產(chǎn)能可達(dá)100萬臺(tái);德州超級(jí)工廠后續(xù)也被規(guī)劃為更大規(guī)模的機(jī)器人產(chǎn)線,長期目標(biāo)年產(chǎn)能高達(dá)1000萬臺(tái)。
按照長期規(guī)劃,Optimus初期將重點(diǎn)滿足特斯拉內(nèi)部工廠需求,大幅替代人工完成重復(fù)性和危險(xiǎn)性任務(wù)。摩根士丹利發(fā)布的一份報(bào)告指出,如果特斯拉用Optimus機(jī)器人替換其10%的員工,將節(jié)省高達(dá)25億美元的成本。
這也是為什么,馬斯克會(huì)把Optimus視為特斯拉未來最重要的增長曲線之一。特斯拉做Optimus是在搭建一套AI進(jìn)入物理世界的基礎(chǔ)設(shè)施。
Figure:讓 AI Agent在真實(shí)世界落地
如果說特斯拉的優(yōu)勢(shì)來自自動(dòng)駕駛、芯片和制造體系,那么Figure AI的特點(diǎn),是它更像一家原生的Physical AI公司,而不是傳統(tǒng)機(jī)器人公司。
Figure的目標(biāo)是交付一款真正通用的人形機(jī)器人:一種能夠執(zhí)行類人任務(wù),并直接向人類學(xué)習(xí)的機(jī)器人。
它很少把傳播重點(diǎn)放在關(guān)節(jié)參數(shù)、扭矩、自由度、負(fù)載這些硬件指標(biāo)上。Figure更愿意講 Helix、VLA 模型、多任務(wù)泛化、自然語言理解、推理能力,以及機(jī)器人如何完成連續(xù)任務(wù)。
美國科技媒體分析:Figure的野心是把 AI Agent落地到真實(shí)世界中。
![]()
據(jù)了解,Helix模型依賴超過100萬小時(shí)的模擬與實(shí)地?cái)?shù)據(jù)訓(xùn)練,試圖把視覺、語言和動(dòng)作打通。人說一句話,機(jī)器人看見環(huán)境,理解任務(wù),再把理解轉(zhuǎn)化為動(dòng)作。
在技術(shù)路線層面,F(xiàn)igure堅(jiān)信自研VLA模型以及神經(jīng)網(wǎng)絡(luò)端到端控制,可以讓機(jī)器人具備更強(qiáng)的sim-to-real泛化能力。
它采用的是“快慢腦”的雙系統(tǒng)架構(gòu)。慢腦負(fù)責(zé)“思考”,理解自然語言指令和復(fù)雜場景語義;快腦負(fù)責(zé)“行動(dòng)”,將慢腦的意圖轉(zhuǎn)化為毫秒級(jí)的精準(zhǔn)動(dòng)作,控制機(jī)器人完成全身運(yùn)動(dòng)和手部操作。
更重要的是,F(xiàn)igure還在嘗試機(jī)器人之間的協(xié)作能力。兩臺(tái)機(jī)器人可以通過觀察對(duì)方動(dòng)作,實(shí)時(shí)推斷意圖并配合完成任務(wù)。多機(jī)器人協(xié)作開始進(jìn)入Physical AI的訓(xùn)練范疇。
在核心部件層面,F(xiàn)igure 03專門圍繞Helix、家庭場景以及規(guī)模化制造重新設(shè)計(jì)。它配備了重新設(shè)計(jì)的傳感套件和手部系統(tǒng),以更好地支持各類復(fù)雜任務(wù)。
Figure 03身高約173cm,整機(jī)約61kg,全身擁有35個(gè)自由度。外部采用織物材料和軟泡沫包裹,這一設(shè)計(jì)明顯更適合家庭環(huán)境。
在斷網(wǎng)或部分關(guān)節(jié)輕微損毀的情況下,F(xiàn)igure 03仍具備一定工作能力。整體續(xù)航約4到5小時(shí),采用腳部無線感應(yīng)充電方式。靈巧手加入攝像頭和觸覺傳感器,目標(biāo)是進(jìn)一步接近人類水平的靈巧操作能力。
在商業(yè)化層面。Figure官方披露,BotQ工廠已將Figure 03的生產(chǎn)效率從每天1臺(tái)提升到每小時(shí)1臺(tái),未來四年累計(jì)生產(chǎn)目標(biāo)為 10 萬臺(tái)。
同時(shí),F(xiàn)igure沒有完全依賴外部制造商,而是將電機(jī)、電池、關(guān)節(jié)等關(guān)鍵部件納入內(nèi)部生產(chǎn),以便降低成本、控制質(zhì)量、加快迭代速度和提升效率。
對(duì)于Figure來說,每一臺(tái)出貨的機(jī)器人,也是一臺(tái)數(shù)據(jù)采集終端。機(jī)器人在不同家庭、不同商業(yè)場景中遇到的新任務(wù),都可能成為下一版Helix的訓(xùn)練素材。
通過先進(jìn)感知、觸覺智能、家庭設(shè)計(jì)和大規(guī)模制造準(zhǔn)備能力的結(jié)合,F(xiàn)igure正在構(gòu)建一個(gè)能夠在家庭和商業(yè)環(huán)境中學(xué)習(xí)、適應(yīng)并工作的機(jī)器人平臺(tái)。
1X:讓家庭成為Physical AI的訓(xùn)練場
相比特斯拉和Figure AI,1X的路線更激進(jìn)。NEO機(jī)器人不是先去工廠搬箱子,而是進(jìn)入真實(shí)家庭,完成整理衣物、收拾廚房、整理沙發(fā)、遞送物品等任務(wù)。它更堅(jiān)決地把家庭當(dāng)成訓(xùn)練 Physical AI的真實(shí)場景。
更加值得注意的是,1X可以被視為OpenAI在具身智能和人形機(jī)器人方向的重要外部押注之一。
在技術(shù)路線上,1X發(fā)布的1XWM,是一個(gè)基于互聯(lián)網(wǎng)視頻預(yù)訓(xùn)練的生成式世界模型。它的核心不只是讓機(jī)器人識(shí)別物體,而是讓機(jī)器人形成對(duì)世界的理解,并在此基礎(chǔ)上持續(xù)學(xué)習(xí)與行動(dòng),以推動(dòng)NEO的規(guī)模化部署。
這就是1X路線里最有意思的地方。它試圖讓機(jī)器人通過看視頻學(xué)會(huì)新動(dòng)作。比如,你給它看一段疊衣服的視頻,它就有機(jī)會(huì)學(xué)習(xí)類似動(dòng)作。之后,NEO還可以通過OTA更新獲得新能力。
如果遇到不會(huì)做的事,1X 的操作員可以遠(yuǎn)程接管,手把手教它。等它學(xué)會(huì)之后,下次就有機(jī)會(huì)自己完成。這套機(jī)制的本質(zhì),是把家庭變成一個(gè)持續(xù)生成數(shù)據(jù)、持續(xù)訓(xùn)練模型、持續(xù)迭代能力的真實(shí)環(huán)境。
在核心部件上,NEO身高約168cm,體重約30kg,采用柔性3D晶格外殼包裹全身。它的噪聲控制被設(shè)計(jì)得很低,續(xù)航約4小時(shí),能夠識(shí)別人類手勢(shì)和表情。靈巧手擁有22個(gè)自由度,同樣采用腱驅(qū)動(dòng)系統(tǒng)。它比其他機(jī)器人更輕,也更適合家庭環(huán)境。
再看商業(yè)落地。根據(jù)1X官方披露,海沃德工廠正在向年產(chǎn)1萬臺(tái)NEO爬坡。隨著自動(dòng)化更新推進(jìn)以及圣卡洛斯新工廠逐步投用,公司目標(biāo)是在2027年底達(dá)到年產(chǎn)10萬臺(tái)。
NEO的價(jià)格方案包括2萬美元買斷,或者每月499美元訂閱。據(jù)媒體報(bào)道,1X首年1萬臺(tái)計(jì)劃產(chǎn)能在預(yù)售開啟后短時(shí)間內(nèi)售罄。
AI的智能來自多樣性,不是來自重復(fù)。這句話幾乎可以概括1X的路線。它不是先把機(jī)器人訓(xùn)練到完美,再送進(jìn)家庭;而是讓機(jī)器人進(jìn)入真實(shí)家庭,用真實(shí)家庭環(huán)境反過來推動(dòng) AI 能力突破。
機(jī)器人競爭走向“誰更懂現(xiàn)實(shí)世界”
人形機(jī)器人的競爭,正在變成三件事:誰能把AI大腦和機(jī)器人身體真正打通?誰能獲得足夠多、足夠真實(shí)、足夠多樣的數(shù)據(jù)?誰能把機(jī)器人從 demo 推向可制造、可交付、可持續(xù)迭代的產(chǎn)品?
特斯拉、Figure、1X這三家公司路徑不同,但都指向同一個(gè)判斷:人形機(jī)器人未來的核心,是AI能不能通過這副身體理解現(xiàn)實(shí)世界、適應(yīng)現(xiàn)實(shí)世界,并最終改變現(xiàn)實(shí)世界。
這也是中國機(jī)器人公司接下來必須面對(duì)的問題。中國機(jī)器人行業(yè)過去幾年跑得很快,供應(yīng)鏈、成本、工程化和量產(chǎn)速度都有優(yōu)勢(shì)。
但如果競爭維度從“本體能力”升級(jí)到“Physical AI”,雙方的差距就會(huì)體現(xiàn)在模型、數(shù)據(jù)、芯片、算力、軟件棧和真實(shí)場景閉環(huán)等層面。
如果沒有這一層能力,量產(chǎn)越快,可能越像是在更快地把自己推向硬件代工的位置。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.