【億邦原創】今年,具身智能賽道的融資和技術都指向同一個關鍵詞——“數據”。簡單地說,要讓機器人學會打掃衛生整理房間,必須有關于打掃衛生整理房間的數據,讓機器人去學習。所以,數據驅動,是具身智能通往GTP時刻的核心路徑。
那么,具身智能需要什么樣的數據?
大致可分為三層:第一層是互聯網上的各種視頻,尤其是人類第一視角開放場景的數據;第二層是特定場景、任務下人類第一視角實操作業數據;第三層是機器人本體自主或者由人類遙操執行任務的數據。三層數據金字塔,自下而上數據量越來越小,同時采集的難度和成本也越來越大。
當下,數據采集已成為制約具身智能發展的瓶頸:高質量、真實交互數據的不足,硬件標準不一、數據采集流程分散、標注與訓練環節割裂,數據孤島現象突出,采集到的數據雜亂、非標,難以直接用于模型訓練,更無法合規流通交易。
針對這一難題,京東推出全鏈路具身智能數據基礎設施,打通從數據采集到模型測試的全流程閉環,將原始雜亂數據精煉為驅動模型進化的高價值“數據燃料”。
數據采集環節,京東云自研的可穿戴式超高清采集終端JoyEgoCam,可在物流、零售、醫療、家庭等多種場景下“即戴即采”,讓快遞員、保潔員、理貨員一邊工作一邊完成專業級數據采集。
![]()
據悉,在清晰度方面,JoyEgoCam配備4K高清攝像頭,支持60幀幀率與130度超廣角拍攝,可實現毫秒級動作細節捕捉,精準記錄各類場景下的細微操作;在精準度方面,重投影誤差小于0.2像素,搭配京東云自研立體校正技術,能夠真實還原操作現場的空間立體感;在便攜性方面,整機僅重220克,輕于普通智能手機,佩戴舒適;在穩定性方面,內置車規級6軸IMU與多傳感器融合單元,即使在極端抖動場景下也能穩定追蹤拍攝。
誰來采集數據?京東利用其豐富業務場景的優勢,發動內部超過10萬名各類職業員工,以及外部最多50萬各行業人員,其中在宿遷就將發動超10萬市民參與,覆蓋家庭、辦公室、工廠到物流、商店、餐廳、醫療、環衛等超百個細分場景,遍布人類真實活動的方方面面,開展“人類歷史上規模最大的數據采集行動”。
![]()
根據規劃,京東將在首年完成500萬小時人類活動視頻數據采集,兩年內突破1000萬小時,同時積累100萬小時機器人本體運行數據。這一數據規模將使其成為全球最大的具身智能數據服務商。
數據經采集后,進入上傳和加工階段。京東云通過任務、人員、設備全流程可視化管理與SaaS化部署,實現視頻一鍵上云。數據匯入AI數據湖平臺后,自動完成清洗、對齊、轉換與預標注,轉為標準訓練集。JoyBuilder仿真平臺批量生成高逼真仿真數據,從而實現人類操作數據→仿真操作數據→真機操作數據的高效數據增值轉換與泛化擴增。
治理后的數據匯聚至JoyBuilder模型開發平臺,數據“開箱即訓”、模型“一鍵部署”,模型訓練效率提升3.5倍,大幅降低VLA大模型研發門檻。其自研AI算子矩陣貫穿始終,涵蓋去畸變、語義描述、深度重建等關鍵環節,精煉高價值訓練素材。目前,京東日處理數據量已達數十萬條,數據有效率高達95%,整體處理成本降低60%。
可見,依托全鏈路基礎設施,京東構建起“數據采集-模型訓練-數據優化”的生態閉環。以自采數據為核心訓練的京東具身大模型JoyAI-RA,在真機實驗上成功率達到73.5%,超過pi0.5等SOTA模型。
此外,京東上線了具身智能數據交易平臺,匯聚京東豐富業務場景下的多模態數據資源,支持數據方、開發者、應用方多方協同,打通具身智能數據合規交易通道。平臺首批定向開放2000小時高精標注數據集。
可見,京東正構建起“硬件采集-數據處理-模型訓練-仿真測試-合規交易-生態共建”的完整產業鏈條,推動具身智能從實驗室研發邁向規模化商業落地,形成“具身智能超級供應鏈”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.