![]()
當很多具身智能公司更關(guān)心機器人先在哪些場景里跑通商業(yè)化時,自變量更想尋找哪條路徑能夠通往 AGI。
作者|Li Yuan
編輯|鄭玄
4 月 21 日,自變量機器人舉行「一個家庭成員的誕生」發(fā)布會,在會上,創(chuàng)始人&CEO 王潛確認,,自變量近期已完成 B 輪融資,投資方為小米戰(zhàn)投。
這是自變量機器人在 2026 年對外披露的第三輪融資,也是這家公司自 2023 年 10 月成立以來完成的第十一輪融資。進入 2026 年后,具身智能賽道融資持續(xù)升溫,多家頭部公司估值已突破百億元,自變量機器人正是其中之一。
但自變量機器人的特別之處,不只在于融資節(jié)奏快、融資規(guī)模大,更在于它所吸引來的資金,呈現(xiàn)出非常鮮明的市場化特征。到目前為止,它已經(jīng)成為業(yè)內(nèi)唯一一家同時獲得美團、阿里、字節(jié)和小米四家互聯(lián)網(wǎng)巨頭戰(zhàn)略投資的具身智能公司。這個投資人名單之所以值得注意,不只是因為巨頭齊聚,更因為這些公司本身都在布局機器人業(yè)務(wù);而字節(jié)和小米戰(zhàn)投,過去也并不常出現(xiàn)在這類「通用機器人大腦」公司的投資名單中。
發(fā)布會上,除了 B 輪融資消息確認,自變量機器人也發(fā)布了新一代自研具身智能基礎(chǔ)模型 WALL-B,并宣布一個月后,搭載這一新模型的機器人將開啟家庭場景服務(wù)。
這也是當前國內(nèi)具身智能頭部公司中,第一家明確把下一階段重點場景放在家庭的公司。相比之下,行業(yè)內(nèi)大多數(shù)公司的敘事仍然集中在商業(yè)或工業(yè)場景,本質(zhì)上是在優(yōu)先回答 ROI 和落地效率的問題。
而自變量機器人的思路明顯不同。家庭場景對它而言,并不意味著要對外宣稱「家庭機器人已經(jīng)可用」,而更像是一種接近 1X 的路徑:先把機器人真正放進家庭,再讓它在家庭這個高度開放、長尾且復雜的環(huán)境里持續(xù)成長。
自變量也沒有回避家庭場景當前仍可能需要一定程度遙操作的現(xiàn)實。但它想強調(diào)的并不是「靠遙操作把機器人放進家庭,像數(shù)據(jù)采集一樣收數(shù)據(jù)」,而是基礎(chǔ)模型在經(jīng)過大規(guī)模預訓練后,已經(jīng)具備了零樣本泛化能力,可以先在真實家庭環(huán)境中直接執(zhí)行一部分任務(wù)。機器人做得好的部分直接完成,做不好的部分再通過人機協(xié)作回流數(shù)據(jù),并在后續(xù)訓練中被模型吸收。
這種思路和不少同行并不相同:在許多公司還在圍繞場景閉環(huán)、交付效率和商業(yè)回報做權(quán)衡時,自變量更像是在優(yōu)先押注一條通向通用智能的路線——自變量一直強調(diào)更重視真實數(shù)據(jù)和數(shù)據(jù)質(zhì)量。
某種程度上,這或許正是自變量最鮮明的標簽:當很多具身智能公司更關(guān)心機器人先在哪些場景里跑通商業(yè)化時,自變量更想尋找哪條路徑能夠通往 AGI。這種強烈的「基礎(chǔ)模型導向」和「AGI 導向」,或許也是它持續(xù)獲得大額融資的重要原因之一。
01
不只是做世界模型,
自變量定義了一種新的「機器人大腦」
自變量此次發(fā)布會上,最有趣的重點之一,是發(fā)布了一個新的模型架構(gòu):世界統(tǒng)一模型(World Unified Model, WUM)。
行業(yè)公認,開年以來對于大腦的關(guān)注,主要在世界模型相關(guān)的技術(shù)進展。
自變量此次的模型架構(gòu)更新,也和世界模型有關(guān)——但又和普遍認知的世界模型不同。
按自變量的說法,行業(yè)現(xiàn)在公認的兩條具身道路,無論是從 VLM 延展到 VLA,還是從視頻生成模型、世界模型繼續(xù)往動作上接,本質(zhì)上都還是在繼承那些原本不是為具身任務(wù)訓練出來的模型。
前者更強于語義理解,卻未必足夠敏感于機器人真正要面對的空間變化、環(huán)境擾動和動作細節(jié);后者雖然強調(diào)連續(xù)預測,也未必真正抓住了機器人在物理世界中最關(guān)心的因果關(guān)系。
自變量 CEO 王潛在采訪中直言,這兩種路線都很「糟糕」。
因此,自變量這次提出的,不是一個傳統(tǒng)意義上的世界模型,也不是一個 VLA,而是一套它稱為世界統(tǒng)一模型的新架構(gòu)。按照它的描述,這套架構(gòu)試圖把視覺、語言、動作、觸覺乃至物理預測等能力,盡量放進同一個網(wǎng)絡(luò)中,從頭開始聯(lián)合訓練,而不是先繼承一個為別的任務(wù)訓練出來的模型,再去做機器人適配。
![]()
這條路線的好處是,一旦成立,機器人面對物理世界時最核心的幾種能力——感知、理解、預測和動作——就不需要再在不同模塊之間來回轉(zhuǎn)譯,模型也更能直接圍繞「如何在真實世界中行動」這個目標去學習,而不是先學會別的任務(wù),再被遷移到機器人身上。
自變量把這套模型架構(gòu)的意義,類比為機器人領(lǐng)域的「Apple Silicon 統(tǒng)一內(nèi)存架構(gòu)時刻」。
在它看來,今天主流的 VLA 路線,仍然有點像蘋果 M1 之前的傳統(tǒng)電腦架構(gòu):視覺、語言、動作等模塊彼此分離,信息需要在不同模塊之間反復傳遞和轉(zhuǎn)譯,每傳一次就損失一次。而 WALL-B 所采用的世界統(tǒng)一模型,更像是一次「統(tǒng)一架構(gòu)」式的重寫——把原本分散的感知、理解、預測和動作能力盡量放進同一個系統(tǒng)里,從底層開始聯(lián)合訓練,減少中間搬運帶來的損耗。
![]()
自變量之所以現(xiàn)在提出這條路線,一個重要前提是,它認為具身智能的數(shù)據(jù)積累已經(jīng)到了一個新的階段。按它的說法,當數(shù)據(jù)規(guī)模突破某個門檻之后,行業(yè)里其實已經(jīng)開始陸續(xù)看到零樣本泛化的跡象,只是因為具身場景太多、問題太復雜,不同公司觀察到的程度不一樣。
在這個判斷之上,模型架構(gòu)本身就變得格外重要。新模型強調(diào)「原生多模態(tài)」——不是在已有模型上繼續(xù)打補丁,而是把視覺、語言、動作、觸覺等不同模態(tài)盡量平等地放進同一個系統(tǒng)里,從頭開始訓練一個真正面向物理世界的模型。
這也是 WALL-B 這次真正有看點的地方:它想回答「如果從一開始就按具身智能和物理世界的要求來做,一個基礎(chǔ)模型應該長成什么樣」。
02
進家庭,不是為了落地,
而是為了逼模型長出泛化能力
如果說,世界統(tǒng)一模型 WALL-B 代表的是自變量對「機器人大腦應該怎么做」的回答;那么把機器人送進家庭,則對應著它對「這個腦應該在哪里繼續(xù)長出來」的回答。
具身智能賽道里,今天并不缺少「做大腦」的公司。但自變量一個非常鮮明的特點是,它對真實世界數(shù)據(jù)的重視程度明顯更高。尤其是在行業(yè)普遍討論仿真、合成數(shù)據(jù),以及如何用更低成本方式快速擴充數(shù)據(jù)規(guī)模的時候,自變量依然把真實數(shù)據(jù)視作機器人模型演進中最核心的資產(chǎn)之一。
王潛對這件事的判斷有一個明確且非共識的看法。
在他看來,互聯(lián)網(wǎng)視頻對于機器人模型而言,那些最容易拿來用的「低垂果實」基本已經(jīng)被摘得差不多了,行業(yè)下一步必須更多轉(zhuǎn)向自己生產(chǎn)數(shù)據(jù)。仿真當然有價值,但它的上限和約束同樣明顯:一方面,很多真實世界里的關(guān)鍵參數(shù)并不可得,另一方面,像柔性物體這類場景本身就很難被高質(zhì)量模擬。更有意思的是,自變量還有一個相對非共識的判斷——仿真數(shù)據(jù)未必比真實數(shù)據(jù)便宜,在某些情況下,前者甚至可能更貴。
這也決定了自變量對「真實數(shù)據(jù)」這件事的理解,比簡單的「多造幾臺機器人采數(shù)據(jù)」更復雜一些。
在它看來,真實數(shù)據(jù)并不等于都必須來自真機本體,無本體的數(shù)據(jù)采集同樣是關(guān)鍵方向;但與此同時,它也沒有像行業(yè)里不少公司那樣,把數(shù)據(jù)重點迅速轉(zhuǎn)向這一更輕量的路線。
比如今年早些時候,自變量選擇與 58 同城合作,在真實場景中用真機收集數(shù)據(jù)——在大家都在討論如何繞開真機、用更低成本方式做更多數(shù)據(jù)的時候,這種選擇反而顯得有些「逆勢」。
![]()
而這種數(shù)據(jù)觀,也直接解釋了它為什么會在這個時間點把下一步放到家庭。
在自變量看來,工業(yè)和家庭其實對應著兩種幾乎相反的技術(shù)目標。工業(yè)場景更封閉、更固定,對速度、準確率和穩(wěn)定性的要求極高;家庭場景則恰恰相反,它是一個極度開放、充滿長尾變化、對泛化能力要求近乎極致的環(huán)境。前者更適合做后訓練、做針對性強化和效率優(yōu)化,后者更適合檢驗、拉升和繼續(xù)塑造一個基礎(chǔ)模型的預訓練能力。
換句話說,如果一家公司想優(yōu)先回答的是,機器人怎樣在一個確定場景里更快、更準、更穩(wěn)定地交付價值,那么工業(yè)會是更自然的選擇;但如果它更關(guān)心的是,機器人能不能在一個復雜開放的真實世界里,面對從未見過的空間、物體和任務(wù)仍然工作下去,那么家庭就是一個更苛刻、也更有價值的環(huán)境。
但這并不意味著,自變量想把家庭變成一個新的數(shù)據(jù)采集場,讓機器人在不同的家里,仍然訓練一樣的疊衣服。自變量承認,在今天的階段,人機協(xié)作乃至一定程度的遙操作仍然存在。
同時它強調(diào),能夠在這個階段進家庭,正是因為前面所述的基礎(chǔ)模型在經(jīng)過新的架構(gòu)改造后,已經(jīng)具備了一定的零樣本泛化能力,機器人進入家庭之后,原則上不該先被切成一個個預定義能力包,而是要直接面對一個開放任務(wù)集合。除了物理上確實做不到的事情,它希望機器人能夠去嘗試任何任務(wù)。
![]()
也就是說,家庭里的價值不只是「采到了多少數(shù)據(jù)」,而是模型能否在真實執(zhí)行中持續(xù)暴露在新的任務(wù)上、同時獲取多種環(huán)境和多種類型的任務(wù)數(shù)據(jù),并在下一輪把這些困難真正學進去。
這才是家庭場景對于現(xiàn)階段的機器人最有意義的點。
03
被四大巨頭同時下注,
自變量真正被看中的是什么?
如果只看表面,自變量成為阿里、字節(jié)、美團和小米四家互聯(lián)網(wǎng)巨頭同時下注的具身智能公司,似乎很容易被解釋成「趕上了風口」。但如果把它過去一段時間的動作連起來看,就會發(fā)現(xiàn),它被重倉的原因顯然不只是賽道熱度。
更核心的原因在于,在當前具身智能競爭中,自變量同時占住了三項最關(guān)鍵、也最難同時成立的位置:基礎(chǔ)模型、真實世界數(shù)據(jù)和機器人本體。
一方面,自變量持續(xù)推進 Great Wall 系列基礎(chǔ)模型,從 WALL-A 到最新發(fā)布的 WALL-B,試圖在模型架構(gòu)、數(shù)據(jù)效率和泛化能力上做出實質(zhì)性突破;另一方面,它又高度重視真實世界數(shù)據(jù),明確判斷互聯(lián)網(wǎng)視頻對機器人模型而言最容易利用的「低垂果實」已基本摘完,行業(yè)接下來必須更多依靠自己生產(chǎn)數(shù)據(jù),并堅持通過真機和復雜場景去形成數(shù)據(jù)閉環(huán)。
與此同時,公司并不缺少本體能力,在自研通用輪式雙臂機器人、人形機器人、高自由度靈巧手和機械臂等整套硬件體系。換句話說,它并不是只占住了具身智能鏈條里的某一個環(huán)節(jié),而是在試圖把模型、數(shù)據(jù)和身體一起打通。
![]()
如果說 2025 年行業(yè)的熱度,更多還圍繞本體能力、運動控制、硬件形態(tài)和場景落地展開,那么到了 2026 年,資本開始越來越明確地把籌碼壓向「身體之外」的另一部分能力——機器人「大腦」的 scaling 潛力。也正是在這個意義上,自變量的投資人名單格外值得注意。
阿里、字節(jié)、美團和小米并不是純財務(wù)投資者,更不是對模型沒有判斷能力的普通產(chǎn)業(yè)資本。恰恰相反,這幾家公司本身都在持續(xù)投入 AI,也都在不同程度上推進機器人、具身智能或相關(guān)硬件體系的探索。
也就是說,它們投資自變量,并不是因為自己看不懂這條路;反而正因為它們懂模型、懂系統(tǒng),也懂這個賽道真正難在哪,所以它們更清楚,什么樣的團隊只是在追風口,什么樣的團隊是在搭下一階段競爭真正需要的能力。
從這個角度看,自變量的特殊性也就更清楚了。和一些國內(nèi)具身智能頭部公司相比,它似乎并不是現(xiàn)階段最著急鋪開商業(yè)化場景、盡快把賬算過來的那一類。無論是這次發(fā)布 WALL-B、提出統(tǒng)一世界模型,還是它強調(diào)真實數(shù)據(jù)、選擇讓機器人進入家庭、堅持在開放世界里逼模型長能力,這些動作背后其實都對應著同一個方向:不是優(yōu)先去找一個最好交付、最好算 ROI 的場景,而是優(yōu)先去搭一個更接近通用智能的系統(tǒng)。
融資之后,公司的重心仍然是繼續(xù)把資金主要投向物理世界基礎(chǔ)模型研發(fā)、包括家庭在內(nèi)的復雜場景拓展與數(shù)據(jù)收集,以及 AI 基礎(chǔ)設(shè)施和機器人研發(fā)體系的持續(xù)升級。從公司成立到現(xiàn)在,自變量最優(yōu)先加碼的,仍然是模型、數(shù)據(jù)和底層能力體系這些最慢、最重、也最不容易在短期內(nèi)兌現(xiàn)收入的部分。
這也是具身智能賽道當下一個很有意思的現(xiàn)象:自變量吸引來的,是業(yè)內(nèi)最市場化的一批資金,但這些資金最終支持它繼續(xù)加碼的,卻不是最短路徑的商業(yè)化驗證,而是物理世界基礎(chǔ)模型、復雜場景和數(shù)據(jù)體系這類更長周期的建設(shè)。
從這個意義上說,四大互聯(lián)網(wǎng)巨頭同時下注自變量,押的已經(jīng)不只是它今天能做出什么樣的機器人,也不只是它眼下能落地多少場景,而是它是否有機會沿著一條更長期的路線,率先把基礎(chǔ)模型、真實世界數(shù)據(jù)和機器人本體真正打通,在下一階段競爭中占住更核心的位置。
*頭圖來源:自變量機器人
本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請聯(lián)系極客君微信 geekparkGO
極客一問
你如何看待自變量機器人?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.