AI行業有個規律,關鍵數據的開放,往往比模型突破更能引爆產業。
一如當年李飛飛開源ImageNet,就加速了計算機視覺的躍遷,隨后催生出整條數據標注產業鏈。
具身智能正站在同樣的節點上。當堆參數、堆算力的Scaling Law在物理世界撞上天花板,大家開始發現,提升大腦能力,除了模型,更缺的是數據。
因此,如今,行業共識開始轉向,訓練場這個全新賽道開始浮現,或者說,具身數據的規模化生產模式開始盛行。
而這一次,答案不再是堆GPU,而是建訓練場。本質上看,訓練場不是“訓練機器人”,而是在給大腦修一條高速公路。
![]()
01.
跟不上小腦的大腦
具身智能圈有個共識,本體的腳越來越穩,大腦的手卻伸不出來。
近幾年,人形機器人硬件進展神速。從踉蹌原型機到春晚翻跟頭,再到工廠穩定搬運的量產機型,“會走會跑會做基礎動作”的小腦能力已經成熟。但遠遠大腦不夠。
人形機器人走進真實環境,光照變了、物體沒見過、力反饋超出預期,就很難進行真正的任務,這些都不是算法問題,是數據饑荒。
這就好比教孩子騎車,看一百遍視頻,不如路上摔一跤。仿真能教“套路”,教不會“手感”。物理世界的摩擦、形變、機械不一致性,仿真永遠無法窮舉。
單個基座模型預估需要5000萬小時數據,行業真機存量卻可能只有數萬小時。千倍缺口,正是訓練場被集中投注的底層邏輯。
![]()
02.
重修一條數據高速公路
當然,從樂聚等頭部企業的行業實踐來看,這條路能否跑通,關鍵在三個環節:本體一致性、采集效率和交付閉環。
本體一致性是前提。如果每臺機器人的機械結構、空間標定、時間同步都不一樣,采出來的數據就無法復用。
例如樂聚的做法是通過車規級MVT制造驗證測試,確保每臺出廠機器人的一致性;再配合機械、模型、光學聯合標定,把靜態誤差和動態誤差都控制在可復用范圍內。
有了本體一致性,才能談采集效率。
例如樂聚訓練場初期,一個遙操員一天只產出1小時有效數據;通過管理流程優化,現在極限能做到8到10小時。針對不同任務類型,采集方案也做了分級,并且能根據任務精度匹配對應的采集方式。
![]()
當然,數據采完只是開始,交付閉環才是工業化。類似樂聚的鏈路是打通了任務評估→遙操采集→上傳匯總→標注審核→格式轉換→云端或硬盤交付→模型在訓練場內評測的閉環,這套飛輪才最終把單輪迭代從7到10天壓縮到2到3天,部署成功率從不足60%拉到90%以上。
在Kuavo 4 Pro實測中,使用樂聚LET真機數據訓練的模型,一次成功搬起率100%(15/15),同場景Pi0.5只有33.33%,意味著樂聚數據已經實現質變。
03.
誰在付“高速費”?
回顧其2023年提出來的生態計劃,一條“基礎設施層—核心技術層—場景應用層”的全鏈條生態架構已經成型。基礎設施層是樂聚制造和數據的基礎設施,包括兩座工廠加訓練場,工廠造身體,訓練場建大腦;核心技術層是核心零部件供應鏈,包括一體化關節、電機、靈巧手、數據平臺、具身大腦、操作系統等上下游企業;場景應用層則聚集了一汽、海晨物流、華為、騰訊、阿里云、南方電網、海信等40余家場景伙伴,橫跨工業、商服、科研、家庭四大領域。
那么,到底誰在為訓練場買單?目前來看,訓練場的場景大多從企業實踐中來。例如樂聚訓練場的場景設計走兩條線。
一部分來自真實工業客戶的搬箱子、拆垛、上下料、分揀等產線上真實在跑的任務,海晨物流、一汽、兆豐等企業已經在這些場景中跑通了數據落地。
另一部分直接來自基模和數據客戶的需求訂單。客戶提出商超、家居等泛化場景需求,訓練場按需集中設計、定向采集。從擺好貨架等客上門,到客戶拿需求單來定向采集,這是訓練場從“概念”到“產品”最硬的證明。
在這一趨勢下,數據也正在成為獨立產品。
從樂聚的數據情況來看,三類客戶清晰。第一類,訓基座模型的大廠,缺真機數據完成“最后一公里”收斂。第二類,高校和實驗室,花幾十萬買高質量數據遠比自建團隊劃算。第三類,場景落地的后訓練團隊,這也是未來最大增量。
客戶特性也使得樂聚訓練場內的數據還呈現典型“金字塔”結構。
其底層是互聯網數據,量大便宜,主要用于讓模型“理解世界”;中層仿真和ego無本體數據,成本較低,主要做預訓練和RL冷啟動;頂層真機數據,質量最高成本最高,用于后訓練微調,直接決定任務成功率。
目前,即便是仿真路線最堅定的支持者,在后訓練階段仍需采集少量真機數據做快速對齊。400條高質量真機數據的訓練效果,能超過1300條低質量數據。
這也構成了樂聚這類訓練場模式的生態護城河:行業里有人傾向多用便宜的ego數據做預訓練,策略上沒問題,但那更像“國道”,走得通,但路程更遠,最終仍需上“高速”才能更快抵達終點。
![]()
04.
先把飛輪轉起來
訓練場的故事,本質是“把基建先搭起來”。
大模型、世界模型等技術路線都沒完全跑通,當下唯一在工廠真正跑通的,就是真機訓練場這條路。
從樂聚的迭代節奏來看,路徑也很清晰:1.0解決“讓機器人動起來”的基本采集;2.0升級為多模態、分場景、分構型的精細化數據產品;未來3.0要讓遙操精度向真人逼近,從平面輪式走向斜坡、臺階、草地等復雜地形。
先修路,再通車。讓高質量數據穩定流進模型,通過生態讓飛輪更快轉起來。就像智能駕駛在數據推動下進入高速發展期,如今具身智能缺的不是更好的算法,而同樣是足夠多、足夠好、能穩定交付的真機數據。
訓練場這條高速公路,正是要把這個缺塊補上。
![]()
05.
從“修路”到“建生態”
但樂聚訓練場的布局從不止是賣數據,生態或許才是其想要實現的真正目的。
與此同時,樂聚還與哈工大、北京大學、蘇州大學等高校持續聯合攻關,打通產學研閉環。
現在這條路樂聚正在一步一步實現。
![]()
樂聚在擁有“本體—數據—大小腦—應用場景”全棧資源后,樂聚生態計劃開啟了第三階段,正式招募二次開發合作伙伴。 這意味著,開發者不需要自建本體、自采數據、自搭訓練場,基于樂聚的全套基礎設施就能做場景微調和應用開發。
這是把最難、最苦、最重的活先干了。舉個更形象的例子,樂聚這是把路基鋪好了,收費站拆掉了,誰都可以上來跑。對于開發者而言,過去做具身智能應用,要自己搞定本體、自己搭訓練環境、自己采數據、自己去找場景,每一個環節都是高門檻。
現在有了現成的高速公路,開發者只需要聚焦在自己的場景里,把應用做深、做好。這意味著,商業化的速度將不再被基礎設施拖累。就像李飛飛用ImageNet加速了AI視覺時代,具身智能今天缺的不是更好的算法,而是足夠多、足夠好、能穩定交付的真機數據。
當數據這條高速公路建成通車,誰能在這條路上跑出最快的商業化速度,答案正在被書寫。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.