具身智能正在掀起新一輪AI競賽,但真正的瓶頸不在硬件,而在可供模型訓練的數據——那種自帶因果、有交互特性、符合物理法則的真實世界數據。就在今天,一座“黃金數據礦”被打開:日均產出1600小時高質量數據,完整記錄從決策到環(huán)境反饋的全鏈條因果關聯(lián),天然符合物理法則。
而啟動這座“黃金數據礦”的鑰匙,掌握在一家叫如祺出行的出行服務公司手里。
5月18日,如祺出行旗下數據業(yè)務板塊(以下簡稱“如祺數據”)首次完整披露AI數據資產版圖,正式以大規(guī)模、高價值出行場景數據切入具身智能與世界模型訓練賽道。目前,如祺數據已建成覆蓋標注數據、行為數據、合成數據、多模態(tài)訓練數據集的完整資產體系,并形成面向物理世界AI的真實場景數據基礎設施。
截至2026年5月,如祺出行已在廣州、上海、重慶、沈陽等城市部署超300 輛智能駕駛數據采集車,日均合規(guī)產出1600小時、130TB高質量數據,能為自動駕駛與具身智能、世界模型模型等迭代提供穩(wěn)定的數據供給。
![]()
真實出行場景沉淀的多模態(tài)數據,可同時支撐自動駕駛與多行業(yè)AI訓練,并為具身智能、世界模型提供可擴展的真實世界數據底座。有長期從事AI模型訓練的相關人士指出,在空間智能成為AI發(fā)展核心方向的背景下,包含駕駛行為、道路交互、空間關系、時序變化的真實出行數據,是訓練物理世界AI模型的優(yōu)質資源。
手握AI訓練的“黃金數據礦”
當前,以具身智能為核心應用載體的世界模型,已成為全球AI競爭的下一個主戰(zhàn)場。然而,高質量物理交互數據嚴重短缺,成為制約世界模型與具身智能走向落地的核心瓶頸。行業(yè)數據顯示,可供具身智能背后世界模型訓練的高質量數據,目前全球總量僅約50萬小時,而頭部廠商單年需求量即達百萬小時級別,供需嚴重失衡。
有意思的是,類似如祺出行這樣的出行服務平臺,卻天然具備持續(xù)生產、沉淀高價值訓練數據的優(yōu)勢。依托每年數億級出行訂單與海量車輛運行數據,平臺持續(xù)積累駕駛員行車、泊車、城市道路通行等高頻復雜交通場景的多模態(tài)數據。與傳統(tǒng)圖片、視頻或人工搭建的模擬數據不同,這些數據記錄了“駕駛員決策-車輛響應-環(huán)境反饋”全鏈條,具備天然因果關聯(lián)與交互邏輯,可直接解決出行相關AI模型訓練面臨的“數據枯竭”問題,是訓練世界模型與具身智能的核心稀缺資產。
公開信息顯示,如祺出行早在2023年開始布局AI數據解決方案,基于自身出行服務平臺的優(yōu)勢,將搭載激光雷達、高清攝像頭、毫米波雷達等多傳感器的智能駕駛數據采集車投入常態(tài)化服務,同時合規(guī)采集真實駕駛行為與道路環(huán)境數據。
![]()
以典型的泊車場景為例,如祺數據不僅記錄3D障礙物空間位置,還同步采集車輛底盤CAN信號、毫米波雷達回波、激光點云與多路攝像頭視頻,圍繞泊車行為構建多模態(tài)“行為-狀態(tài)-環(huán)境”聯(lián)合數據集。
![]()
長期關注大模型訓練的業(yè)內人士認為,這類數據具備完整的推理、決策與反饋閉環(huán),能夠有效支撐具身智能體、世界模型理解空間關系、動態(tài)交互及長尾復雜場景,其數據價值遠超傳統(tǒng)靜態(tài)圖片或合成視頻,是訓練空間智能模型的 “黃金數據礦”。有接近如祺出行的人士透露,該公司已開始將其積累的數據用于訓練車后服務機器人。
全棧服務能力延伸至具身智能
與傳統(tǒng)AI數據服務商多聚焦基礎標注環(huán)節(jié)不同,如祺數據已實現從單一標注服務向“數據集+全棧能力”升級,形成數據采集、規(guī)模化處理、精準標注、合成數據生成、多模態(tài)數據處理的全鏈路服務能力。這一能力體系使其不僅能夠服務智能駕駛領域,更可高效延伸至具身智能、通用大模型等高價值賽道。
目前,如祺數據已具備將完整服務封裝成標準化產品的能力,讓客戶實現“開箱即用”,無需承擔底層數據清洗、標注等工作,顯著降低高質量真實數據的使用門檻。
在規(guī)模化交付能力上,如祺出行已在全國布局3大服務交付基地,服務團隊規(guī)模超1500人,擁有超1000家BPO合作伙伴及近百萬眾包資源,可實現月千萬級標注產能,滿足高并發(fā)、大規(guī)模數據處理需求。技術層面,公司自研OCC自動化標注算法,可減少90%人工標注時間,交付準確率穩(wěn)定超過98%。同時,如祺合成數據覆蓋不同時段、天氣條件與座艙場景,有效彌補真實數據采集盲區(qū);多模態(tài)訓練數據集覆蓋圖像、文本、音頻、視頻,可直接支持大模型垂類微調與快速迭代。
![]()
商業(yè)化路徑獲得驗證
依托真實場景數據優(yōu)勢、全棧技術能力與規(guī)模化交付體系,如祺數據在AI數據服務賽道建立起差異化競爭力,其服務已從智能駕駛延伸至具身智能、大模型、消費電子、醫(yī)療等多個高價值領域,形成多賽道協(xié)同增長格局。
在商業(yè)化層面,如祺數據已與騰訊、小馬智行、理想汽車、火山引擎、百度智能云、廣汽集團等行業(yè)頭部企業(yè)達成合作,商業(yè)化路徑已得到初步驗證。這一點在營收上也得到了反映。如祺出行2025年財報顯示,公司以AI數據服務為主要收入來源的技術服務營收達1.60億元,同比增長487.4%,成為增長最快的業(yè)務板塊。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.