話說,這兩天有個事情還挺有意思的,那就是,京東突然宣布建成全球最大的具身數據采集中心,還說要發動宿遷超十萬人來進行數據采集。嘿,有點意思,不過,京東這到底是個啥動作啊?能不能成啊?
![]()
先來說說“具身智能”這個詞,其英文名是“ Embodied AI”,簡單點來說就是是“有身體的AI”,AI在物理世界落地, 能看、聽、摸、走、抓、操作現實物體。這個詞火啊,特別是在今年春晚被機器人占領之后,“具身智能”更是火得一塌糊涂。
但很多人不清楚的是,“具身智能”不僅僅局限于人形機器人,它也涉及到了“大腦”——大模型聰明不聰明,但同時,現在這個階段,“具身智能”最缺的是“數據”。什么數據呢?就是真實世界的操作數據,人類“怎么做事”的過程數據以及手、眼、身體協同的數據等等。比如,讓機器人做一件簡單的事情—— “把桌上的杯子拿起來放進洗碗機”,這里的難點不在理解語言,而在判斷杯子材質、控制力度、避免碰撞找到路徑,這些都需要 海量真實操作數據訓練。
![]()
大模型的數據可以將現有互聯網的數據爬取做訓練,而具身智能的數據只能“人肉采集”, 需要人去做示范動作(抓、放、走、搬)、標注行為(成功/失敗)以及在真實環境反復執行。 從“標注語言” 升級為“標注人類行為”。
而做這個事情,你別說,京東還真是自己的優勢。首先,京東的員工數多啊,而且大多數是一線的物流人員。比如根據京東的財報披露,截至2025年底,京東體系人員總數超90萬人,京東物流的員工數約68萬人。簡單來說就是,京東每天都有這么多人在做搬運、抓取、分揀、路徑規劃、配送,這才是最真實的具身智能訓練數據。同時,京東的場景也很豐富,除了物流配送外,京東還有家政、健康、工業等場景,京東這些場景的一線員工可以幫助京東積累更多元的數據。
所以啊,這么看來,京東說要建立全球規模最大的具身智能采集中心,還真的是靠譜的。京東方面稱,京東依托超級供應鏈核心優勢,以及零售、物流、健康、工業、外賣、家政等海量真實業務場景,將建成全球規模最大、場景最全的具身智能數據采集中心,兩年內積累超1000萬小時優質數據。
![]()
在這個機器人數據采集中心中,構建了“采集—標注—訓練—驗證”全流程數據流水線,覆蓋物流倉儲、工業制造、健康醫療、家庭服務、城市運維等五大核心場景,記錄視覺、觸覺、空間軌跡等全維度數據。
而為了更快速地進行數據采集。京東這次更是發動數十萬人參與數據采集——包括內部超過10萬名各類職業員工,以及外部最多50萬各行業人員。
其中,京東創始人劉強東的家鄉人民這次也參與到這一數據采集運動中來。據說,宿遷將發動超10萬市民參與,覆蓋家庭、辦公室、工廠到物流、商店、餐廳、醫療、環衛等超百個細分場景,遍布人類真實活動的方方面面,開展“人類歷史上規模最大的數據采集行動”。不得不說,劉強東造福了家鄉,家鄉人民也是很給力啊。
而京東方面也預計,通過以上舉措,京東將于一年內積累500萬小時人類真實場景視頻數據,兩年內突破1000萬小時,同步實現采集機器人本體數據100萬小時,成為全球最大的具身智能數據公司,從源頭破解行業“數據荒”。
也不得不說,京東這一手也真是有點意思,京東的員工們在干電商干物流的同時,還一邊順手把AI訓練給做了,這還真是很多AI公司做不到的。
有了這些“具身智能”的數據,京東可能還真的會成為AI時代重要的參與者啊,你們說是不?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.