網易首頁 > 網易號 > 正文申請入駐

物理AI時代核心“賣鏟人”：數據采集是機器人下一個風口？

2026-05-08 17:11:11　來源: 華爾街見聞官方

上海舉報

分享至

人工智能的底層邏輯正從大語言模型的“語言理解”轉向世界模型的“預測世界”。在這一躍遷中，物理數據的質量與采集能力成為發展核心。作為解決世界模型與具身智能“數據燃料”問題的關鍵，具身數據采集正開啟下一代數據基建浪潮。

國泰海通最新報告指出，具身智能發展的最大障礙已不再是算法，而是數據缺口。其對數據的需求量呈指數級膨脹，遠超傳統AI模型。在這一背景下，能夠率先填補數據缺口的數據供應商與基礎設施商，將作為物理AI時代的“賣鏟人”，占據產業鏈核心價值節點，有望享受顯著的估值溢價。

技術路線上，真實數據、仿真/合成數據、視頻數據各有利弊：純真實數據成本過高，純仿真數據存在“Sim2Real”（仿真到現實）鴻溝。未來主流路徑逐漸清晰：仿真/視頻數據用于大規模預訓練 + 真實數據用于微調與強化學習。

隨著主流技術路線日漸清晰，資本正加速涌入數據采集工具鏈（動捕、遙操作）、視頻數據升維平臺及仿真訓練場——這些數據采集基礎設施，正成為機器人產業真正的風口與“鏟子”生意。

范式轉移：世界模型重塑AI基石，數據需求膨脹至EB級

AI正從“數據相關性”驅動轉向“物理因果性”驅動，2025年已成為世界模型應用落地的元年。具身智能對數據的需求量及復雜度正呈指數級爆發。

傳統神經網絡與大語言模型本質上依賴模式識別與概率關聯，而“世界模型”的核心在于內建物理規律（如重力、慣性），并具備預測時空演化的能力。自2025年起，該領域迎來集中突破：Meta的V-JEPA 2、谷歌的Genie、OpenAI的Sora以及World Labs的RTFM相繼問世。

世界模型將賦能游戲、自動駕駛與具身智能三大核心場景。其中，具身智能的爆發對數據提出了前所未有的苛刻要求。與大語言模型及自動駕駛（PB級數據量、以文本或視覺為主）不同，具身智能需適應形態各異的硬件平臺，數據需求高達EB級，且極度強調物理交互（力覺、觸覺、關節反饋）。目前行業仍處早期階段，預訓練數據極度緊缺，“數據孤島”與異構數據融合難題已成為制約產業爆發的核心瓶頸。

三大主流數據采集方案利弊共存，視頻數據成為業內關注新焦點

構建高效的數據閉環，是具身智能能力躍升的核心。當前，資本與技術主要圍繞三大數據采集方案展開：

真實數據（高保真但極度昂貴）：通過遙操作、穿戴式動捕等方式直接采集。優勢在于不存在Sim2Real差距；致命短板是成本高、擴展性差，難以覆蓋長尾邊緣場景。

合成/仿真數據（高性價比但存在遷移鴻溝）：利用物理引擎在虛擬環境中生成。成本極低且自帶完美標簽，但面臨顯著的“Sim2Real Gap”（動力學、感知、控制等差異），導致模型在真實環境中性能衰減。

視頻數據（來源廣但直接應用難）：業內新興焦點，通過升維技術利用海量互聯網視頻。成本低、規模大，但缺乏物理交互屬性（如重力、摩擦力），噪聲大且缺少精確的三維標注。

產業演進趨勢：Generalist AI的GEN-0模型（≥7B參數）已證明，在海量真實交互數據下，模型性能呈冪律增長。在真實數據成本被徹底打下來之前，“仿真/視頻數據預訓練 + 真實數據微調/強化學習”的虛實結合方案將是絕對主流。

與此同時，底層數據基建正在國家力量與開源生態的推動下加速成型：上海落地了全國首個具身智能領域國家級標準化試點（“1+N”模式訓練場），北京建立了首個基于真實場景的數據訓練基地。谷歌、星海圖、傅利葉、智元等紛紛發布開源數據集，中國信通院則牽頭制定了國內首個具身智能數據集質量評價標準。

機器人本體廠商的“數據站隊”與戰略分化

正是由于真實數據成本高、仿真數據存在遷移鴻溝、視頻數據噪聲大，國內外主流機器人本體廠商在數據路線上出現了明顯分化。這一分化，反過來為數據采集基建的方向提供了最直接的產業驗證。

真實數據優先派：認為只有真實交互才能跨越Sim2Real鴻溝。智元機器人在大模型訓練階段100%使用真機真實數據，仿真僅用于工程迭代；自變量機器人在復雜物理交互場景中完全不使用仿真數據；1X Technologies同樣將“大規模真實世界數據”作為核心壁壘。

合成與仿真數據優先派：押注成本與規模。銀河通用采用99%的合成數據配以1%的真實數據進行訓練，試圖以極低成本逼近真實分布。

視頻數據戰略高地：特斯拉、Figure AI等巨頭正加速布局，核心邏輯在于互聯網視頻規模遠超任何單一機器人平臺能采集的真實數據。特斯拉Optimus已放棄早期動捕與遙操作，轉向深挖互聯網視頻；千尋智能Spirit v1的70%預訓練來自互聯網視頻；Figure AI啟動Project Go-Big，探索人類視頻到機器人的零樣本遷移；星動紀元、逐際動力則分別采用“視頻預訓練+真機微調”及多源數據組合策略。

這三條路線的并存恰恰說明：當前尚無單一數據來源能獨立解決具身智能的數據瓶頸。無論最終哪條路線收斂，數據采集工具鏈、仿真平臺與視頻升維技術——即物理AI時代的“賣鏟人”——都將是確定性受益的方向。

數據“賣鏟人”全景圖

隨著具身智能對數據的需求量級與復雜度指數級上升，能夠有效解決數據獲取成本與效率問題的供應商，正迎來一輪估值重估。這一重估覆蓋四個關鍵方向：視頻數據轉化、仿真平臺、多模態硬件采集，以及綜合數據服務。

視頻數據轉化方向：核心突破在于將海量互聯網視頻低成本轉化為機器人可用的訓練數據，部分方案已能將綜合采集成本降至行業平均水平的千分之五以下。
仿真平臺方向：全鏈路合成數據體系以極低成本生成帶完美標注的大規模虛擬數據，并逐步縮小Sim2Real差距。
真實數據采集硬件方向：光慣融合手套、電子皮膚等傳感器結合高質量開源數據集，正在構建高保真底座。
真實數據生態與遙操作方向：大規模自建采集場景與高精度遙操作設備，已成為主流微調數據的重要來源。

在二級市場視角下，綜合性數據服務商通過多元方案（遙操作、動捕、合成數據）建設具身智能數據訓練場與工程化平臺；仿真平臺公司則通過收購整合打通虛實數據壁壘，提供全生命周期物理AI解決方案。

整體來看，無論是視頻轉化、仿真生成、硬件采集還是綜合服務，能夠顯著提升數據“可獲得性”與“成本效率”的供應商，正在從產業邊緣走向估值中樞。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.