網易首頁 > 網易號 > 正文申請入駐

給具身智能修高速公路：從采數據到建生態，樂聚訓練場鋪到了2.0

2026-05-07 21:24:57　來源: 機器人大講堂

安徽舉報

分享至

AI行業有個規律，關鍵數據的開放，往往比模型突破更能引爆產業。

一如當年李飛飛開源ImageNet，就加速了計算機視覺的躍遷，隨后催生出整條數據標注產業鏈。

具身智能正站在同樣的節點上。當堆參數、堆算力的Scaling Law在物理世界撞上天花板，大家開始發現，提升大腦能力，除了模型，更缺的是數據。

因此，如今，行業共識開始轉向，訓練場這個全新賽道開始浮現，或者說，具身數據的規模化生產模式開始盛行。

而這一次，答案不再是堆GPU，而是建訓練場。本質上看，訓練場不是“訓練機器人”，而是在給大腦修一條高速公路。

01.

跟不上小腦的大腦

具身智能圈有個共識，本體的腳越來越穩，大腦的手卻伸不出來。

近幾年，人形機器人硬件進展神速。從踉蹌原型機到春晚翻跟頭，再到工廠穩定搬運的量產機型，“會走會跑會做基礎動作”的小腦能力已經成熟。但遠遠大腦不夠。

人形機器人走進真實環境，光照變了、物體沒見過、力反饋超出預期，就很難進行真正的任務，這些都不是算法問題，是數據饑荒。

這就好比教孩子騎車，看一百遍視頻，不如路上摔一跤。仿真能教“套路”，教不會“手感”。物理世界的摩擦、形變、機械不一致性，仿真永遠無法窮舉。

單個基座模型預估需要5000萬小時數據，行業真機存量卻可能只有數萬小時。千倍缺口，正是訓練場被集中投注的底層邏輯。

02.

重修一條數據高速公路

當然，從樂聚等頭部企業的行業實踐來看，這條路能否跑通，關鍵在三個環節：本體一致性、采集效率和交付閉環。

本體一致性是前提。如果每臺機器人的機械結構、空間標定、時間同步都不一樣，采出來的數據就無法復用。

例如樂聚的做法是通過車規級MVT制造驗證測試，確保每臺出廠機器人的一致性；再配合機械、模型、光學聯合標定，把靜態誤差和動態誤差都控制在可復用范圍內。

有了本體一致性，才能談采集效率。

例如樂聚訓練場初期，一個遙操員一天只產出1小時有效數據；通過管理流程優化，現在極限能做到8到10小時。針對不同任務類型，采集方案也做了分級，并且能根據任務精度匹配對應的采集方式。

當然，數據采完只是開始，交付閉環才是工業化。類似樂聚的鏈路是打通了任務評估→遙操采集→上傳匯總→標注審核→格式轉換→云端或硬盤交付→模型在訓練場內評測的閉環，這套飛輪才最終把單輪迭代從7到10天壓縮到2到3天，部署成功率從不足60%拉到90%以上。

在Kuavo 4 Pro實測中，使用樂聚LET真機數據訓練的模型，一次成功搬起率100%（15/15），同場景Pi0.5只有33.33%，意味著樂聚數據已經實現質變。

03.

誰在付“高速費”？

回顧其2023年提出來的生態計劃，一條“基礎設施層—核心技術層—場景應用層”的全鏈條生態架構已經成型。基礎設施層是樂聚制造和數據的基礎設施，包括兩座工廠加訓練場，工廠造身體，訓練場建大腦；核心技術層是核心零部件供應鏈，包括一體化關節、電機、靈巧手、數據平臺、具身大腦、操作系統等上下游企業；場景應用層則聚集了一汽、海晨物流、華為、騰訊、阿里云、南方電網、海信等40余家場景伙伴，橫跨工業、商服、科研、家庭四大領域。

那么，到底誰在為訓練場買單？目前來看，訓練場的場景大多從企業實踐中來。例如樂聚訓練場的場景設計走兩條線。

一部分來自真實工業客戶的搬箱子、拆垛、上下料、分揀等產線上真實在跑的任務，海晨物流、一汽、兆豐等企業已經在這些場景中跑通了數據落地。

另一部分直接來自基模和數據客戶的需求訂單。客戶提出商超、家居等泛化場景需求，訓練場按需集中設計、定向采集。從擺好貨架等客上門，到客戶拿需求單來定向采集，這是訓練場從“概念”到“產品”最硬的證明。

在這一趨勢下，數據也正在成為獨立產品。

從樂聚的數據情況來看，三類客戶清晰。第一類，訓基座模型的大廠，缺真機數據完成“最后一公里”收斂。第二類，高校和實驗室，花幾十萬買高質量數據遠比自建團隊劃算。第三類，場景落地的后訓練團隊，這也是未來最大增量。

客戶特性也使得樂聚訓練場內的數據還呈現典型“金字塔”結構。

其底層是互聯網數據，量大便宜，主要用于讓模型“理解世界”；中層仿真和ego無本體數據，成本較低，主要做預訓練和RL冷啟動；頂層真機數據，質量最高成本最高，用于后訓練微調，直接決定任務成功率。

目前，即便是仿真路線最堅定的支持者，在后訓練階段仍需采集少量真機數據做快速對齊。400條高質量真機數據的訓練效果，能超過1300條低質量數據。

這也構成了樂聚這類訓練場模式的生態護城河：行業里有人傾向多用便宜的ego數據做預訓練，策略上沒問題，但那更像“國道”，走得通，但路程更遠，最終仍需上“高速”才能更快抵達終點。

04.

先把飛輪轉起來

訓練場的故事，本質是“把基建先搭起來”。

大模型、世界模型等技術路線都沒完全跑通，當下唯一在工廠真正跑通的，就是真機訓練場這條路。

從樂聚的迭代節奏來看，路徑也很清晰：1.0解決“讓機器人動起來”的基本采集；2.0升級為多模態、分場景、分構型的精細化數據產品；未來3.0要讓遙操精度向真人逼近，從平面輪式走向斜坡、臺階、草地等復雜地形。

先修路，再通車。讓高質量數據穩定流進模型，通過生態讓飛輪更快轉起來。就像智能駕駛在數據推動下進入高速發展期，如今具身智能缺的不是更好的算法，而同樣是足夠多、足夠好、能穩定交付的真機數據。

訓練場這條高速公路，正是要把這個缺塊補上。

05.

從“修路”到“建生態”

但樂聚訓練場的布局從不止是賣數據，生態或許才是其想要實現的真正目的。

與此同時，樂聚還與哈工大、北京大學、蘇州大學等高校持續聯合攻關，打通產學研閉環。

現在這條路樂聚正在一步一步實現。

樂聚在擁有“本體—數據—大小腦—應用場景”全棧資源后，樂聚生態計劃開啟了第三階段，正式招募二次開發合作伙伴。這意味著，開發者不需要自建本體、自采數據、自搭訓練場，基于樂聚的全套基礎設施就能做場景微調和應用開發。

這是把最難、最苦、最重的活先干了。舉個更形象的例子，樂聚這是把路基鋪好了，收費站拆掉了，誰都可以上來跑。對于開發者而言，過去做具身智能應用，要自己搞定本體、自己搭訓練環境、自己采數據、自己去找場景，每一個環節都是高門檻。

現在有了現成的高速公路，開發者只需要聚焦在自己的場景里，把應用做深、做好。這意味著，商業化的速度將不再被基礎設施拖累。就像李飛飛用ImageNet加速了AI視覺時代，具身智能今天缺的不是更好的算法，而是足夠多、足夠好、能穩定交付的真機數據。

當數據這條高速公路建成通車，誰能在這條路上跑出最快的商業化速度，答案正在被書寫。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.