網易首頁 > 網易號 > 正文申請入駐

具身智能的競爭，勝負手在數據供給能力

2026-05-08 11:22:37　來源: AI科技評論

廣東舉報

分享至

具身機器人正迎來數據之戰。

一個有點反常識的現象，最近一年正在國內外具身智能行業發生：全球幾乎所有頭部玩家，都在做同一件看起來“很重”的事，建訓練場。

特斯拉正在把整條工廠產線變成機器人訓練場；Figure AI通過自建+聯合模式，在全球各地采集人類動作數據；國內同樣密集跟進，北京、上海、深圳、蘇州、青島、濟南等地已建成或計劃在建的具身智能訓練場接近 30 家，地方政府、科研機構、企業幾乎同時入局，規模從幾千平米到上萬平米不等。

這些訓練場是專門為具身智能（如人形機器人）提供大規模、標準化數據采集與模型訓練的基礎設施。通過讓機器人在不同場景（如物流、搬運）中“摸爬滾打”，學習技能，積累高質量數據。

如果把時間撥回過去兩三年，當時行業的共識還是模型不夠強，算法不成熟。但現在從業者開始注重一個更現實的問題：沒有高質量的數據，模型也無法快速迭代。

一場具身智能的競賽，正在展開，目標不是生產機器人，而是生產數據。

數據是不等價的

有人也許會疑惑，互聯網上有那么多數據，難道還不夠嗎？要理解這一點，需要先理解具身智能數據的層次結構。

底層：互聯網文本和視頻數據。量大、成本低，用于預訓練，讓模型理解世界的語義，但這些數據里沒有機器人所需要的物理信息。

中間層：仿真數據。可在計算機里大規模生成，成本低，用于讓機器人在虛擬環境里做冷啟動訓練，但局限在于，無法精確還原接觸動力學、材料形變、電機摩擦。

頂層：真機數據。質量最高、成本最高，直接決定任務成功率。

尤其是真機數據，目前數量少、生產成本高。訓練場的核心價值，就在于批量、標準化、持續地生產頂層數據。

目前，國內的具身智能訓練場，按運營邏輯可切分為四類：國家隊（如上海國地）在“修考場”，牽頭制定標準與測試基準，發行業駕照；地方國資（如石景山，蘇州等）在“鋪路”，搞新基建吸引產業鏈落地；企業（樂聚、智元、基模企業等）在“種地”，親自下場搭場景采集核心數據喂飽模型；高校科研訓練場（如鄭州大學、哈職大等）在“發課本”，解決數據孤島與人才斷層。簡言之，國家隊定規矩，地方建生態，企業產數據，高校養人才——四方合力，只為把機器人從實驗室的演示品，變成工廠里的打工人。

以下是國內外部分玩家的概覽：

基于以上信息不難看出，伴隨大模型對數據需求維度的幾何級膨脹，具身智能數據的戰略價值已突顯。

數據基礎設施已經上升到國家政策層面，各地的訓練中心正在形成系統性、超前性的基礎投入。此前，在國家"十五五"規劃綱要中，也已明確將"統籌布局具身智能實訓場"列為國家戰略任務。

具身智能數據設施也正像當年的云計算一樣，正在成為機器人時代的公共平臺，降低開發者的準入門檻。云計算出現之前，互聯網公司需要自建服務器、機房和運維體系，門檻高、周期長，中小團隊很難參與競爭。而云計算平臺將算力以服務形式開放，使開發者可以按需使用，從而帶來了移動互聯網時代的爆發，并誕生了亞馬遜AWS、阿里云、微軟Azure等巨頭。

大多數人形機器人公司還在仿真器里調參，樂聚已經在全國建了 10 個“機器人學校”。這不是什么宏大敘事，而是解決一個最枯燥但最致命的問題：機器人缺數據。就像你不能只靠看視頻學會游泳，機器人也不能只靠合成數據學會擰螺絲。樂聚干的是典型的苦活（schlep）——在蘇州、北京、青島這些地方，1:1 搭出POC真實場景，讓機器人進去一遍遍采數據、標數據。這聽起來沒有大模型性感，但邏輯和阿里早年建數據中心一樣：不急著做應用，先把又臟又累的基礎設施鋪好。訓練場、數據管線、數據標注——這些是行業的“教材”。當你把教材準備好了，你就擁有了定義課程的權利。這不是在搶什么話語權，而是在給未來的機器人搶學位。

今年，光輪智能、無問智科相繼獲得巨額融資，其中光輪智能據稱目前估值已超過10億美元，比肩頭部具身公司的估值。這是資本對具身數據這一賽道最明確的投票。

這個產業的空間，或許比大多數人想象的還要大。

爭論

在行業密集加碼數據基礎設施的同時，一個更深層的問題浮出水面：究竟什么數據才是真正有效的？

宇樹科技創始人王興興曾反復提及數據問題，2025年9月外灘大會上上，他表示，目前機器人的數據，無論采集、噪聲、數據質量問題都非常大，都還是比較模糊的階段。

銀河通用聯合創始人張直政則強調，具身大模型的發展可能需要上萬億條數據，全部用真實數據采集，既不可行，也不可持續。他們的主張是，99%合成數據+1%真實數據，真實數據只是補丁，合成數據才是基本盤。

反對的聲音也有。比如，星海圖創始人高繼揚堅持認為，真實世界原生數據才是具身智能的底座，過度依賴仿真是行業最大的捷徑陷阱。

樂聚機器人技術總監王松則堅決看好訓練場獲取來的真機數據。他提到，樂聚提供的近萬小時高質量多模態真機數據，幫助螞蟻靈波LingBot-VLA模型實現泛化能力突破；在產業應用方面，憑借數據效率，樂聚的全尺寸人形機器人已經交付一汽紅旗、海晨物流等企業。

表面上看，以上這些爭論讓人無所適從，但深究起來會發現，其中所反映的是行業對數據的渴求，以及缺乏一套能高質量生產數據的系統。

面對數據短缺的現狀，有的公司給出的答案是仿真，有的公司則堅持訓練場這樣的真機采集。

Figure AI創始人兼CEO Brett Adcock在接受《時代》雜志采訪時，給出了激進的判斷：“數據能解決現階段幾乎所有問題。”

未來一段時間，具身智能的競爭，會從模型能力轉向數據供給能力。

經濟價值與技術價值

2015 年前后，深度學習熱潮帶動了 AI 數據行業的崛起，其中的佼佼者Scale AI 更是在2025年，以近300億美元估值被Meta公司收購。

具身智能正在走同一條路，但門檻更高。

據樂聚機器人技術總監王松透露，即便依托目前全國規模最大的訓練場網絡，其年均高質量數據產出量級僅在 10 萬小時左右。相比之下，自動駕駛實現 L4 級別通常依賴百萬級數據積累；而具身智能由于涉及更復雜自由度系統的多模態交互與物理反饋，其有效數據需求預計將躍升至千萬級。這意味著，高質量具身數據的供給缺口依然巨大。

樂聚把 LET 數據集開源了——全尺寸人形機器人的真機數據。上線后下載量迅速破了百萬。這個數字只說了一件事：全行業都在餓肚子。

現在的圈子里，大家還在卷架構、卷泛化。但干實事的人心里清楚，手里沒糧。仿真里的數據再干凈也是“塑料飯”；小機械臂的數據放在大機器人身上根本跑不通。大家缺的，是全尺寸機器人在真實物理世界里摸爬滾打過的軌跡。

這很像 2009 年的ImageNet。在那之前，計算機視覺還在爭論算法；在那之后，大家只看誰的數據多、誰的數據真。

LET 驗證了一個常識：具身智能的瓶頸從來不在模型，而在教材。樂聚把教材先發出來了，還牽頭成立了國內首個國家級數據開源社區——開放原子具身智能開源數據集社區（OpenLET）。

做開源從是希望建生態圈子。OpenLET 的核心不只是放幾個數據包，而是要把這群手里拿著模型卻缺數據的開發者聚攏起來。只有當開發者社區開始運轉，讓所有人都圍著同一套標準去貢獻和使用數據時，這個行業才算真正有了生態的基座。

除了商業效應，具身智能數據還承擔著更重要的價值。

隨著數據的積累，我們也將看到，具身智能從Model-Based（基于規則控制），向Data-Driven（數據驅動）的范式轉移。

傳統機器人是規則系統，由人類定義行為，系統執行邏輯。這樣雖然可控，但無法復雜場景。數據驅動則不預設規則，通過大量數據學習。實驗數據證明，在后訓練階段通過少量高質量真機數據做對齊，效果遠優于單純增加仿真樣本。

馬斯克曾多次強調，Optimus 放棄了傳統的預設控制邏輯，全棧采用神經網絡，其動作、行為，都是基于數據訓練的，而非“if-else”邏輯。

產業化的必要條件

回到最初的問題，為什么全行業都在建訓練場？

從歷史類比看，自動駕駛行業曾經歷過同樣的階段：模型參數的擴展觸及邊界之后，數據基礎設施建設成為核心競爭要素。這也是為什么特斯拉、Figure AI、Google，以及國內機器人玩家和機構，不約而同做出同一個判斷。

具身智能的自由度和任務復雜度遠高于自動駕駛，所需數據量要高出幾個數量級，這意味著數據設施的重要性會更高。

2025年是具身智能模型敘事，走向商業敘事的轉折點。根據工信部的數據，這一年，中國工業機器人產量同比增長28%，人形機器人產業進入從原型到量產的關鍵過渡期，模型迭代的速度在加快，而每一輪迭代都在消耗數據。

這或許是整件事最核心的邏輯是，訓練場是不是一個終極方案并不重要，重要的是，它是具身智能走向產業化的必要條件。

數據資產是時間的函數，越早開始積累，優勢越難被追上。先建起數據優勢的人，先擁有更深的技術積累，也更有可能留在牌桌上。

未經「AI科技評論」授權，嚴禁以任何方式在網頁、論壇、社區進行轉載！

公眾號轉載請先在「AI科技評論」后臺留言取得授權，轉載時需標注來源并插入本公眾號名片。F

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.