![]()
具身機器人正迎來數據之戰。
一個有點反常識的現象,最近一年正在國內外具身智能行業發生:全球幾乎所有頭部玩家,都在做同一件看起來“很重”的事,建訓練場。
特斯拉正在把整條工廠產線變成機器人訓練場;Figure AI通過自建+聯合模式,在全球各地采集人類動作數據;國內同樣密集跟進,北京、上海、深圳、蘇州、青島、濟南等地已建成或計劃在建的具身智能訓練場接近 30 家,地方政府、科研機構、企業幾乎同時入局,規模從幾千平米到上萬平米不等。
這些訓練場是專門為具身智能(如人形機器人)提供大規模、標準化數據采集與模型訓練的基礎設施。通過讓機器人在不同場景(如物流、搬運)中“摸爬滾打”,學習技能,積累高質量數據。
如果把時間撥回過去兩三年,當時行業的共識還是模型不夠強,算法不成熟。但現在從業者開始注重一個更現實的問題:沒有高質量的數據,模型也無法快速迭代。
一場具身智能的競賽,正在展開,目標不是生產機器人,而是生產數據。
01
數據是不等價的
有人也許會疑惑,互聯網上有那么多數據,難道還不夠嗎?要理解這一點,需要先理解具身智能數據的層次結構。
底層:互聯網文本和視頻數據。量大、成本低,用于預訓練,讓模型理解世界的語義,但這些數據里沒有機器人所需要的物理信息。
中間層:仿真數據。可在計算機里大規模生成,成本低,用于讓機器人在虛擬環境里做冷啟動訓練,但局限在于,無法精確還原接觸動力學、材料形變、電機摩擦。
頂層:真機數據。質量最高、成本最高,直接決定任務成功率。
尤其是真機數據,目前數量少、生產成本高。訓練場的核心價值,就在于批量、標準化、持續地生產頂層數據。
目前,國內的具身智能訓練場,按運營邏輯可切分為四類:國家隊(如上海國地)在“修考場”,牽頭制定標準與測試基準,發行業駕照;地方國資(如石景山,蘇州等)在“鋪路”,搞新基建吸引產業鏈落地;企業(樂聚、智元、基模企業等)在“種地”,親自下場搭場景采集核心數據喂飽模型;高校科研訓練場(如鄭州大學、哈職大等)在“發課本”,解決數據孤島與人才斷層。簡言之,國家隊定規矩,地方建生態,企業產數據,高校養人才——四方合力,只為把機器人從實驗室的演示品,變成工廠里的打工人。
以下是國內外部分玩家的概覽:
![]()
基于以上信息不難看出,伴隨大模型對數據需求維度的幾何級膨脹,具身智能數據的戰略價值已突顯。
數據基礎設施已經上升到國家政策層面,各地的訓練中心正在形成系統性、超前性的基礎投入。此前,在國家"十五五"規劃綱要中,也已明確將"統籌布局具身智能實訓場"列為國家戰略任務。
具身智能數據設施也正像當年的云計算一樣,正在成為機器人時代的公共平臺,降低開發者的準入門檻。云計算出現之前,互聯網公司需要自建服務器、機房和運維體系,門檻高、周期長,中小團隊很難參與競爭。而云計算平臺將算力以服務形式開放,使開發者可以按需使用,從而帶來了移動互聯網時代的爆發,并誕生了亞馬遜AWS、阿里云、微軟Azure等巨頭。
大多數人形機器人公司還在仿真器里調參,樂聚已經在全國建了 10 個“機器人學校”。這不是什么宏大敘事,而是解決一個最枯燥但最致命的問題:機器人缺數據。就像你不能只靠看視頻學會游泳,機器人也不能只靠合成數據學會擰螺絲。樂聚干的是典型的苦活(schlep)——在蘇州、北京、青島這些地方,1:1 搭出POC真實場景,讓機器人進去一遍遍采數據、標數據。這聽起來沒有大模型性感,但邏輯和阿里早年建數據中心一樣:不急著做應用,先把又臟又累的基礎設施鋪好。訓練場、數據管線、數據標注——這些是行業的“教材”。當你把教材準備好了,你就擁有了定義課程的權利。這不是在搶什么話語權,而是在給未來的機器人搶學位。
今年,光輪智能、無問智科相繼獲得巨額融資,其中光輪智能據稱目前估值已超過10億美元,比肩頭部具身公司的估值。這是資本對具身數據這一賽道最明確的投票。
這個產業的空間,或許比大多數人想象的還要大。
02
爭論
在行業密集加碼數據基礎設施的同時,一個更深層的問題浮出水面:究竟什么數據才是真正有效的?
宇樹科技創始人王興興曾反復提及數據問題,2025年9月外灘大會上上,他表示,目前機器人的數據,無論采集、噪聲、數據質量問題都非常大,都還是比較模糊的階段。
銀河通用聯合創始人張直政則強調,具身大模型的發展可能需要上萬億條數據,全部用真實數據采集,既不可行,也不可持續。他們的主張是,99%合成數據+1%真實數據,真實數據只是補丁,合成數據才是基本盤。
反對的聲音也有。比如,星海圖創始人高繼揚堅持認為,真實世界原生數據才是具身智能的底座,過度依賴仿真是行業最大的捷徑陷阱。
樂聚機器人技術總監王松則堅決看好訓練場獲取來的真機數據。他提到,樂聚提供的近萬小時高質量多模態真機數據,幫助螞蟻靈波LingBot-VLA模型實現泛化能力突破;在產業應用方面,憑借數據效率,樂聚的全尺寸人形機器人已經交付一汽紅旗、海晨物流等企業。
表面上看,以上這些爭論讓人無所適從,但深究起來會發現,其中所反映的是行業對數據的渴求,以及缺乏一套能高質量生產數據的系統。
面對數據短缺的現狀,有的公司給出的答案是仿真,有的公司則堅持訓練場這樣的真機采集。
Figure AI創始人兼CEO Brett Adcock在接受《時代》雜志采訪時,給出了激進的判斷:“數據能解決現階段幾乎所有問題。”
未來一段時間,具身智能的競爭,會從模型能力轉向數據供給能力。
03
經濟價值與技術價值
2015 年前后,深度學習熱潮帶動了 AI 數據行業的崛起,其中的佼佼者Scale AI 更是在2025年,以近300億美元估值被Meta公司收購。
2015 年前后,深度學習熱潮帶動了 AI 數據行業的崛起,其中的佼佼者Scale AI 更是在2025年,以近300億美元估值被Meta公司收購。
具身智能正在走同一條路,但門檻更高。
據樂聚機器人技術總監王松透露,即便依托目前全國規模最大的訓練場網絡,其年均高質量數據產出量級僅在 10 萬小時左右。相比之下,自動駕駛實現 L4 級別通常依賴百萬級數據積累;而具身智能由于涉及更復雜自由度系統的多模態交互與物理反饋,其有效數據需求預計將躍升至千萬級。這意味著,高質量具身數據的供給缺口依然巨大。
樂聚把 LET 數據集開源了——全尺寸人形機器人的真機數據。上線后下載量迅速破了百萬。這個數字只說了一件事:全行業都在餓肚子。
現在的圈子里,大家還在卷架構、卷泛化。但干實事的人心里清楚,手里沒糧。仿真里的數據再干凈也是“塑料飯”;小機械臂的數據放在大機器人身上根本跑不通。大家缺的,是全尺寸機器人在真實物理世界里摸爬滾打過的軌跡。
這很像 2009 年的ImageNet。在那之前,計算機視覺還在爭論算法;在那之后,大家只看誰的數據多、誰的數據真。
LET 驗證了一個常識:具身智能的瓶頸從來不在模型,而在教材。樂聚把教材先發出來了,還牽頭成立了國內首個國家級數據開源社區——開放原子具身智能開源數據集社區(OpenLET)。
做開源從是希望建生態圈子。OpenLET 的核心不只是放幾個數據包,而是要把這群手里拿著模型卻缺數據的開發者聚攏起來。只有當開發者社區開始運轉,讓所有人都圍著同一套標準去貢獻和使用數據時,這個行業才算真正有了生態的基座。
除了商業效應,具身智能數據還承擔著更重要的價值。
隨著數據的積累,我們也將看到,具身智能從Model-Based(基于規則控制),向Data-Driven(數據驅動)的范式轉移。
傳統機器人是規則系統,由人類定義行為,系統執行邏輯。這樣雖然可控,但無法復雜場景。數據驅動則不預設規則,通過大量數據學習。實驗數據證明,在后訓練階段通過少量高質量真機數據做對齊,效果遠優于單純增加仿真樣本。
馬斯克曾多次強調,Optimus 放棄了傳統的預設控制邏輯,全棧采用神經網絡,其動作、行為,都是基于數據訓練的,而非“if-else”邏輯。
04
產業化的必要條件
回到最初的問題,為什么全行業都在建訓練場?
從歷史類比看,自動駕駛行業曾經歷過同樣的階段:模型參數的擴展觸及邊界之后,數據基礎設施建設成為核心競爭要素。這也是為什么特斯拉、Figure AI、Google,以及國內機器人玩家和機構,不約而同做出同一個判斷。
具身智能的自由度和任務復雜度遠高于自動駕駛,所需數據量要高出幾個數量級,這意味著數據設施的重要性會更高。
2025年是具身智能模型敘事,走向商業敘事的轉折點。根據工信部的數據,這一年,中國工業機器人產量同比增長28%,人形機器人產業進入從原型到量產的關鍵過渡期,模型迭代的速度在加快,而每一輪迭代都在消耗數據。
這或許是整件事最核心的邏輯是,訓練場是不是一個終極方案并不重要,重要的是,它是具身智能走向產業化的必要條件。
數據資產是時間的函數,越早開始積累,優勢越難被追上。先建起數據優勢的人,先擁有更深的技術積累,也更有可能留在牌桌上。
未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!
公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。F
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.