網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

阿里、美團、字節(jié)、小米罕見「會師」，四大廠為何共同押注自變量機器人

2026-04-23 12:22:35　來源: 極客公園

北京舉報

分享至

當很多具身智能公司更關(guān)心機器人先在哪些場景里跑通商業(yè)化時，自變量更想尋找哪條路徑能夠通往 AGI。

作者｜Li Yuan

編輯｜鄭玄

4 月 21 日，自變量機器人舉行「一個家庭成員的誕生」發(fā)布會，在會上，創(chuàng)始人&CEO 王潛確認，，自變量近期已完成 B 輪融資，投資方為小米戰(zhàn)投。

這是自變量機器人在 2026 年對外披露的第三輪融資，也是這家公司自 2023 年 10 月成立以來完成的第十一輪融資。進入 2026 年后，具身智能賽道融資持續(xù)升溫，多家頭部公司估值已突破百億元，自變量機器人正是其中之一。

但自變量機器人的特別之處，不只在于融資節(jié)奏快、融資規(guī)模大，更在于它所吸引來的資金，呈現(xiàn)出非常鮮明的市場化特征。到目前為止，它已經(jīng)成為業(yè)內(nèi)唯一一家同時獲得美團、阿里、字節(jié)和小米四家互聯(lián)網(wǎng)巨頭戰(zhàn)略投資的具身智能公司。這個投資人名單之所以值得注意，不只是因為巨頭齊聚，更因為這些公司本身都在布局機器人業(yè)務(wù)；而字節(jié)和小米戰(zhàn)投，過去也并不常出現(xiàn)在這類「通用機器人大腦」公司的投資名單中。

發(fā)布會上，除了 B 輪融資消息確認，自變量機器人也發(fā)布了新一代自研具身智能基礎(chǔ)模型 WALL-B，并宣布一個月后，搭載這一新模型的機器人將開啟家庭場景服務(wù)。

這也是當前國內(nèi)具身智能頭部公司中，第一家明確把下一階段重點場景放在家庭的公司。相比之下，行業(yè)內(nèi)大多數(shù)公司的敘事仍然集中在商業(yè)或工業(yè)場景，本質(zhì)上是在優(yōu)先回答 ROI 和落地效率的問題。

而自變量機器人的思路明顯不同。家庭場景對它而言，并不意味著要對外宣稱「家庭機器人已經(jīng)可用」，而更像是一種接近 1X 的路徑：先把機器人真正放進家庭，再讓它在家庭這個高度開放、長尾且復雜的環(huán)境里持續(xù)成長。

自變量也沒有回避家庭場景當前仍可能需要一定程度遙操作的現(xiàn)實。但它想強調(diào)的并不是「靠遙操作把機器人放進家庭，像數(shù)據(jù)采集一樣收數(shù)據(jù)」，而是基礎(chǔ)模型在經(jīng)過大規(guī)模預訓練后，已經(jīng)具備了零樣本泛化能力，可以先在真實家庭環(huán)境中直接執(zhí)行一部分任務(wù)。機器人做得好的部分直接完成，做不好的部分再通過人機協(xié)作回流數(shù)據(jù)，并在后續(xù)訓練中被模型吸收。

這種思路和不少同行并不相同：在許多公司還在圍繞場景閉環(huán)、交付效率和商業(yè)回報做權(quán)衡時，自變量更像是在優(yōu)先押注一條通向通用智能的路線——自變量一直強調(diào)更重視真實數(shù)據(jù)和數(shù)據(jù)質(zhì)量。

某種程度上，這或許正是自變量最鮮明的標簽：當很多具身智能公司更關(guān)心機器人先在哪些場景里跑通商業(yè)化時，自變量更想尋找哪條路徑能夠通往 AGI。這種強烈的「基礎(chǔ)模型導向」和「AGI 導向」，或許也是它持續(xù)獲得大額融資的重要原因之一。

不只是做世界模型，

自變量定義了一種新的「機器人大腦」

自變量此次發(fā)布會上，最有趣的重點之一，是發(fā)布了一個新的模型架構(gòu)：世界統(tǒng)一模型（World Unified Model, WUM)。

行業(yè)公認，開年以來對于大腦的關(guān)注，主要在世界模型相關(guān)的技術(shù)進展。

自變量此次的模型架構(gòu)更新，也和世界模型有關(guān)——但又和普遍認知的世界模型不同。

按自變量的說法，行業(yè)現(xiàn)在公認的兩條具身道路，無論是從 VLM 延展到 VLA，還是從視頻生成模型、世界模型繼續(xù)往動作上接，本質(zhì)上都還是在繼承那些原本不是為具身任務(wù)訓練出來的模型。

前者更強于語義理解，卻未必足夠敏感于機器人真正要面對的空間變化、環(huán)境擾動和動作細節(jié)；后者雖然強調(diào)連續(xù)預測，也未必真正抓住了機器人在物理世界中最關(guān)心的因果關(guān)系。

自變量 CEO 王潛在采訪中直言，這兩種路線都很「糟糕」。

因此，自變量這次提出的，不是一個傳統(tǒng)意義上的世界模型，也不是一個 VLA，而是一套它稱為世界統(tǒng)一模型的新架構(gòu)。按照它的描述，這套架構(gòu)試圖把視覺、語言、動作、觸覺乃至物理預測等能力，盡量放進同一個網(wǎng)絡(luò)中，從頭開始聯(lián)合訓練，而不是先繼承一個為別的任務(wù)訓練出來的模型，再去做機器人適配。

這條路線的好處是，一旦成立，機器人面對物理世界時最核心的幾種能力——感知、理解、預測和動作——就不需要再在不同模塊之間來回轉(zhuǎn)譯，模型也更能直接圍繞「如何在真實世界中行動」這個目標去學習，而不是先學會別的任務(wù)，再被遷移到機器人身上。

自變量把這套模型架構(gòu)的意義，類比為機器人領(lǐng)域的「Apple Silicon 統(tǒng)一內(nèi)存架構(gòu)時刻」。

在它看來，今天主流的 VLA 路線，仍然有點像蘋果 M1 之前的傳統(tǒng)電腦架構(gòu)：視覺、語言、動作等模塊彼此分離，信息需要在不同模塊之間反復傳遞和轉(zhuǎn)譯，每傳一次就損失一次。而 WALL-B 所采用的世界統(tǒng)一模型，更像是一次「統(tǒng)一架構(gòu)」式的重寫——把原本分散的感知、理解、預測和動作能力盡量放進同一個系統(tǒng)里，從底層開始聯(lián)合訓練，減少中間搬運帶來的損耗。

自變量之所以現(xiàn)在提出這條路線，一個重要前提是，它認為具身智能的數(shù)據(jù)積累已經(jīng)到了一個新的階段。按它的說法，當數(shù)據(jù)規(guī)模突破某個門檻之后，行業(yè)里其實已經(jīng)開始陸續(xù)看到零樣本泛化的跡象，只是因為具身場景太多、問題太復雜，不同公司觀察到的程度不一樣。

在這個判斷之上，模型架構(gòu)本身就變得格外重要。新模型強調(diào)「原生多模態(tài)」——不是在已有模型上繼續(xù)打補丁，而是把視覺、語言、動作、觸覺等不同模態(tài)盡量平等地放進同一個系統(tǒng)里，從頭開始訓練一個真正面向物理世界的模型。

這也是 WALL-B 這次真正有看點的地方：它想回答「如果從一開始就按具身智能和物理世界的要求來做，一個基礎(chǔ)模型應該長成什么樣」。

進家庭，不是為了落地，

而是為了逼模型長出泛化能力

如果說，世界統(tǒng)一模型 WALL-B 代表的是自變量對「機器人大腦應該怎么做」的回答；那么把機器人送進家庭，則對應著它對「這個腦應該在哪里繼續(xù)長出來」的回答。

具身智能賽道里，今天并不缺少「做大腦」的公司。但自變量一個非常鮮明的特點是，它對真實世界數(shù)據(jù)的重視程度明顯更高。尤其是在行業(yè)普遍討論仿真、合成數(shù)據(jù)，以及如何用更低成本方式快速擴充數(shù)據(jù)規(guī)模的時候，自變量依然把真實數(shù)據(jù)視作機器人模型演進中最核心的資產(chǎn)之一。

王潛對這件事的判斷有一個明確且非共識的看法。

在他看來，互聯(lián)網(wǎng)視頻對于機器人模型而言，那些最容易拿來用的「低垂果實」基本已經(jīng)被摘得差不多了，行業(yè)下一步必須更多轉(zhuǎn)向自己生產(chǎn)數(shù)據(jù)。仿真當然有價值，但它的上限和約束同樣明顯：一方面，很多真實世界里的關(guān)鍵參數(shù)并不可得，另一方面，像柔性物體這類場景本身就很難被高質(zhì)量模擬。更有意思的是，自變量還有一個相對非共識的判斷——仿真數(shù)據(jù)未必比真實數(shù)據(jù)便宜，在某些情況下，前者甚至可能更貴。

這也決定了自變量對「真實數(shù)據(jù)」這件事的理解，比簡單的「多造幾臺機器人采數(shù)據(jù)」更復雜一些。

在它看來，真實數(shù)據(jù)并不等于都必須來自真機本體，無本體的數(shù)據(jù)采集同樣是關(guān)鍵方向；但與此同時，它也沒有像行業(yè)里不少公司那樣，把數(shù)據(jù)重點迅速轉(zhuǎn)向這一更輕量的路線。

比如今年早些時候，自變量選擇與 58 同城合作，在真實場景中用真機收集數(shù)據(jù)——在大家都在討論如何繞開真機、用更低成本方式做更多數(shù)據(jù)的時候，這種選擇反而顯得有些「逆勢」。

而這種數(shù)據(jù)觀，也直接解釋了它為什么會在這個時間點把下一步放到家庭。

在自變量看來，工業(yè)和家庭其實對應著兩種幾乎相反的技術(shù)目標。工業(yè)場景更封閉、更固定，對速度、準確率和穩(wěn)定性的要求極高；家庭場景則恰恰相反，它是一個極度開放、充滿長尾變化、對泛化能力要求近乎極致的環(huán)境。前者更適合做后訓練、做針對性強化和效率優(yōu)化，后者更適合檢驗、拉升和繼續(xù)塑造一個基礎(chǔ)模型的預訓練能力。

換句話說，如果一家公司想優(yōu)先回答的是，機器人怎樣在一個確定場景里更快、更準、更穩(wěn)定地交付價值，那么工業(yè)會是更自然的選擇；但如果它更關(guān)心的是，機器人能不能在一個復雜開放的真實世界里，面對從未見過的空間、物體和任務(wù)仍然工作下去，那么家庭就是一個更苛刻、也更有價值的環(huán)境。

但這并不意味著，自變量想把家庭變成一個新的數(shù)據(jù)采集場，讓機器人在不同的家里，仍然訓練一樣的疊衣服。自變量承認，在今天的階段，人機協(xié)作乃至一定程度的遙操作仍然存在。

同時它強調(diào)，能夠在這個階段進家庭，正是因為前面所述的基礎(chǔ)模型在經(jīng)過新的架構(gòu)改造后，已經(jīng)具備了一定的零樣本泛化能力，機器人進入家庭之后，原則上不該先被切成一個個預定義能力包，而是要直接面對一個開放任務(wù)集合。除了物理上確實做不到的事情，它希望機器人能夠去嘗試任何任務(wù)。

也就是說，家庭里的價值不只是「采到了多少數(shù)據(jù)」，而是模型能否在真實執(zhí)行中持續(xù)暴露在新的任務(wù)上、同時獲取多種環(huán)境和多種類型的任務(wù)數(shù)據(jù)，并在下一輪把這些困難真正學進去。

這才是家庭場景對于現(xiàn)階段的機器人最有意義的點。

被四大巨頭同時下注，

自變量真正被看中的是什么？

如果只看表面，自變量成為阿里、字節(jié)、美團和小米四家互聯(lián)網(wǎng)巨頭同時下注的具身智能公司，似乎很容易被解釋成「趕上了風口」。但如果把它過去一段時間的動作連起來看，就會發(fā)現(xiàn)，它被重倉的原因顯然不只是賽道熱度。

更核心的原因在于，在當前具身智能競爭中，自變量同時占住了三項最關(guān)鍵、也最難同時成立的位置：基礎(chǔ)模型、真實世界數(shù)據(jù)和機器人本體。

一方面，自變量持續(xù)推進 Great Wall 系列基礎(chǔ)模型，從 WALL-A 到最新發(fā)布的 WALL-B，試圖在模型架構(gòu)、數(shù)據(jù)效率和泛化能力上做出實質(zhì)性突破；另一方面，它又高度重視真實世界數(shù)據(jù)，明確判斷互聯(lián)網(wǎng)視頻對機器人模型而言最容易利用的「低垂果實」已基本摘完，行業(yè)接下來必須更多依靠自己生產(chǎn)數(shù)據(jù)，并堅持通過真機和復雜場景去形成數(shù)據(jù)閉環(huán)。

與此同時，公司并不缺少本體能力，在自研通用輪式雙臂機器人、人形機器人、高自由度靈巧手和機械臂等整套硬件體系。換句話說，它并不是只占住了具身智能鏈條里的某一個環(huán)節(jié)，而是在試圖把模型、數(shù)據(jù)和身體一起打通。

如果說 2025 年行業(yè)的熱度，更多還圍繞本體能力、運動控制、硬件形態(tài)和場景落地展開，那么到了 2026 年，資本開始越來越明確地把籌碼壓向「身體之外」的另一部分能力——機器人「大腦」的 scaling 潛力。也正是在這個意義上，自變量的投資人名單格外值得注意。

阿里、字節(jié)、美團和小米并不是純財務(wù)投資者，更不是對模型沒有判斷能力的普通產(chǎn)業(yè)資本。恰恰相反，這幾家公司本身都在持續(xù)投入 AI，也都在不同程度上推進機器人、具身智能或相關(guān)硬件體系的探索。

也就是說，它們投資自變量，并不是因為自己看不懂這條路；反而正因為它們懂模型、懂系統(tǒng)，也懂這個賽道真正難在哪，所以它們更清楚，什么樣的團隊只是在追風口，什么樣的團隊是在搭下一階段競爭真正需要的能力。

從這個角度看，自變量的特殊性也就更清楚了。和一些國內(nèi)具身智能頭部公司相比，它似乎并不是現(xiàn)階段最著急鋪開商業(yè)化場景、盡快把賬算過來的那一類。無論是這次發(fā)布 WALL-B、提出統(tǒng)一世界模型，還是它強調(diào)真實數(shù)據(jù)、選擇讓機器人進入家庭、堅持在開放世界里逼模型長能力，這些動作背后其實都對應著同一個方向：不是優(yōu)先去找一個最好交付、最好算 ROI 的場景，而是優(yōu)先去搭一個更接近通用智能的系統(tǒng)。

融資之后，公司的重心仍然是繼續(xù)把資金主要投向物理世界基礎(chǔ)模型研發(fā)、包括家庭在內(nèi)的復雜場景拓展與數(shù)據(jù)收集，以及 AI 基礎(chǔ)設(shè)施和機器人研發(fā)體系的持續(xù)升級。從公司成立到現(xiàn)在，自變量最優(yōu)先加碼的，仍然是模型、數(shù)據(jù)和底層能力體系這些最慢、最重、也最不容易在短期內(nèi)兌現(xiàn)收入的部分。

這也是具身智能賽道當下一個很有意思的現(xiàn)象：自變量吸引來的，是業(yè)內(nèi)最市場化的一批資金，但這些資金最終支持它繼續(xù)加碼的，卻不是最短路徑的商業(yè)化驗證，而是物理世界基礎(chǔ)模型、復雜場景和數(shù)據(jù)體系這類更長周期的建設(shè)。

從這個意義上說，四大互聯(lián)網(wǎng)巨頭同時下注自變量，押的已經(jīng)不只是它今天能做出什么樣的機器人，也不只是它眼下能落地多少場景，而是它是否有機會沿著一條更長期的路線，率先把基礎(chǔ)模型、真實世界數(shù)據(jù)和機器人本體真正打通，在下一階段競爭中占住更核心的位置。

*頭圖來源：自變量機器人

本文為極客公園原創(chuàng)文章，轉(zhuǎn)載請聯(lián)系極客君微信 geekparkGO

極客一問

你如何看待自變量機器人？

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.