網易首頁 > 網易號 > 正文申請入駐

全球看中國，靈初智能用10萬小時人類數據寫下具身智能的中國答案

2026-05-14 12:44:08　來源: 機器之心Pro

河北舉報

分享至

機器之心發布

2026 年，“世界模型” 正在成為具身智能行業的高頻詞。越來越多公司開始將自己的技術路線表述為機器人世界模型，試圖用可學習的環境模型提升機器人訓練效率。

靈初智能（PsiBot）也常被放入這一敘事中。但在靈初聯合創始人陳源培看來，世界模型并不是靈初的核心方向，而是服務于數據遷移的工具。“我覺得做世界模型不算轉型。世界模型只是個工具。我們從 Day one 開始，就是在做人類數據。”

靈初真正關注的問題是：真實人類操作數據，能否規模化轉化為機器人訓練數據？

在靈初成立前，陳源培已經開始探索用人類手部運動數據訓練靈巧操作。這項工作后來發表于 CoRL 2024，也成為靈初押注 human data 路線的重要技術來源。如今，靈初在更大規模的數據實踐中給出了一個更明確的判斷：在 10 萬小時量級上，人類數據已經可以大幅替代真機采集數據。

這一路線里，VLA、世界模型、強化學習、外骨骼手套都不是單獨的終點。它們共同指向同一件事：構建一套從人類數據到機器人 policy 的轉化管線。

Morgan Stanley Research 統計顯示，截至 2026 年 4 月底，2026 年全球人形機器人 VC 融資額已超過 2025 年全年。資本加速進入后，具身智能行業的數據、模型與落地能力正在被重新定價。

一、從 Day One 開始的人類數據路線：從 robot-centric 到 human-centric

具身智能的數據問題，本質上是規模、質量和遷移效率之間的權衡。

過去幾年，行業主流路線之一是 teleoperation。通過同構或近似同構的遙操作設備，讓人直接控制機器人或影子臂采集數據。這類數據與機器人本體更接近，遷移難度低，訓練鏈路相對直接。

但 teleoperation 的問題也很明顯：采集成本高、設備重、場地依賴強、操作員需要訓練，很難獲得足夠大的數據規模。對于試圖訓練通用機器人能力的公司來說，素材場式的數據生產方式很快會遇到上限。

另一類路線是 ego data，即用攝像頭采集人類第一視角操作數據。它的成本更低，也更接近真實人類行為，但新的問題隨之出現：人和機器人之間存在天然 gap。人的關節結構、骨骼自由度、動作習慣、視覺視角都與機器人不同。直接把這類數據用于機器人訓練，往往會遇到遷移效率低、噪聲大、動作不規范等問題。

靈初的判斷是：遷移問題可以通過模型和算法管線解決，但數據規模問題必須在采集方式上解決。

“我們當時設計這套手套，一個很核心的原因就是能盡量不影響人的日常工作。比如讓一個收銀員戴上我們的手套工作，他基本上不會有什么影響。但你讓他拿著兩個夾爪工作，掃碼都掃不了。”

這意味著，靈初想進入的不是專門搭建的機器人素材場，而是真實勞動場景：物流、倉儲、收銀、工廠等持續產生人類操作行為的場景。

這一路線與 UMI 等 robot-centric 方案形成對比。Robot-centric 方案通過形態更接近機器人夾爪的設備采集數據，遷移效率更高，但操作者動作會受到限制，很難進入真實勞動場景。靈初選擇 human-centric，接受更高的遷移難度，換取更大的數據規模上限。

目前，靈初并行采集兩類人類數據。

第一類是外骨骼手套數據。它通過機械連接捕捉手部和手臂動作，不依賴 IMU，精度更高，也可以記錄更完整的雙手雙臂自由度。

第二類是純視覺數據，也就是英偉達和模型廠商押注的 EGO 路線：通過頭部和腕部攝像頭記錄人類操作過程，不使用手套，成本更低，規模化能力更強，但動作精度相對弱一些。

在靈初的設計里，手套的自由度盡可能做高，并不只是為了適配自家的靈巧手，而是為了提升數據的跨本體遷移能力。換句話說，靈初想采集的不是綁定某一個機器人硬件的數據，而是未來可以遷移到不同機器人本體上的人類操作數據。

二、W0 和 R2：用世界模型完成人類數據到機器人 policy 的遷移

人類數據路線的核心難點，不是采集，而是遷移。

人類動作天然帶有噪聲和不規范性，人的動力學也不同于機器人。靈初的解決方式是：用強化學習，在世界模型中完成遷移。

靈初的系統主要由兩個模塊構成：W0 和 R2。

R2 是 policy，最終部署到機器人上，負責實際執行操作。W0 是 world model，更準確地說，是一個 action-conditioned world model：給定當前狀態和動作，預測下一幀狀態。

在訓練階段，W0 扮演可學習的仿真器。R2 不直接在真實機器人上大量試錯，而是在 W0 構建的環境里通過強化學習在線迭代。W0 提供環境反饋，R2 在其中不斷探索，把人手動力學遷移到機器人動力學上，并生成新的訓練數據，再反哺 R2，形成閉環。

部署階段，W0 退場，機器人上只運行 R2。

“如果模型訓好了，自然就不需要 W0 了。W0 是個仿真器，它是個提升的過程，不是部署的一部分。”

這也是陳源培不愿意把靈初簡單定義為 “世界模型公司” 的原因。在他的理解里，世界模型不是單獨的方向，而是數據轉化管線中的一個中間模塊。它的作用不是替代真實世界，而是幫助人類數據完成到機器人 policy 的遷移。

“算法本身沒那么重要，哪個好用就用哪個。我們更核心的還是人類數據，以及把這套數據轉移成高質量機器人數據的管線。”

在這一體系中，數據質量也不完全依賴人工審核。靈初將判斷權交給模型本身：一條數據能不能在世界模型里成功轉換，能不能讓 policy 跑通，就是篩選標準。能跑通的數據留下，跑不通的數據丟掉。隨著模型能力提升，數據篩選邊界也會動態變化。

陳源培認為，靈初在人類數據路線上的一個關鍵階段性結果，是 10 萬小時量級的內部驗證。

“我們基本沒有真機的素材場，真機數據非常非常少，靠人類數據也能做出來跟那些采了幾萬小時 teleoperation 數據的公司差不多的效果。”

這指向一個更核心的問題：機器人基礎模型是否必須依賴大規模真機 teleoperation 數據？

陳源培的判斷是，真機數據仍然重要，但它不一定是唯一燃料。如果人類數據采集足夠規模化，遷移管線足夠有效，那么大量真機數據可以被人類數據部分替代。真機數據更像是校準、驗證和少量 fine-tuning 的補充，而不是全部數據來源。

這并不意味著人類數據天然等同于機器人數據。相反，人類數據要真正可用，必須經過采集系統、世界模型、強化學習、數據篩選和 policy 訓練的完整管線。

靈初試圖建立的，是這套系統能力。

三、從數據集到落地：SynData、小全棧與路線邊界

截至 2026 年 5 月 13 日，靈初智能 SynData 數據集在 Hugging Face 上下載量已達約 1.46 萬次。

Hugging Face鏈接：https://huggingface.co/datasets/PsiBotAI/SynData

這是基于 R2 和 W0 體系的新一代大規模真實世界多模態數據集，覆蓋視覺、語言、動作等維度。依托自研外骨骼手套系統，SynData 能夠捕捉雙手雙臂完整自由度的高精度操作數據，同時結合裸手數據與自然人類交互行為，面向動作建模、操作學習、道具學習及多模態智能研究開放使用。

對靈初而言，SynData 是其技術路線的一次階段性外化：以真實人類操作數據為底座，通過世界模型和強化學習完成遷移，再訓練出可部署到機器人上的 policy。

但從商業化階段看，陳源培并不認為行業已經進入 “通用基模” 階段。

他把靈初當前的位置分為幾層。

第一層是產能期。現階段，靈初的收入主體仍然來自硬件，包括外骨骼手套、采集系統以及素材場建設。數據收入預計要到明年才會逐漸成為主體。

第二層是調 policy 期。當前機器人進入具體客戶場景，仍然需要針對任務、環境和節拍要求調整 policy。“真正不需要調的通用基模，還要大概三五年左右。”

第三層才是基模期。這是目標，但不是當下。

這也解釋了靈初為什么選擇做 “小全棧”。陳源培對 “小全棧” 的定義是：以模型為核心往下做，關鍵環節自己掌握，但做到核心零部件為止。比如觸覺傳感器、精密減速器這類零部件，靈初選擇外采，不會自研。

原因并不是為了展示全棧能力，而是落地需要。“你要做落地，硬件的穩定性、節拍要求，跟硬件高度耦合，現在沒辦法，只能自己做。” 在現階段，機器人落地不是單純的軟件問題。一個 policy 能否穩定運行，取決于機器人本體、執行器、傳感器、控制系統、任務節拍和場景約束。模型和硬件仍然高度耦合，只做模型很難完成真實交付。

對于行業其他路線，陳源培的判斷也比較明確。關于 Genesis 等近期受到關注的機器人 demo，他認為不需要神化，也不應否定。“如果我們拿那套硬件訓一下，他們那些 demo 我們也都能做出來。”

關于仿真，他相對悲觀。在他看來，仿真是重要工具，但如果期待仿真本身出現巨大突破，并單獨解決真實物理世界中的接觸、長尾和高精度操作問題，概率并不高。

那么，human data 路線會不會被證偽？

陳源培認為，如果這條路線最終被證偽，大概只有兩種可能：第一，仿真出現巨大突破，可以低成本生成足夠真實、足夠多樣、足夠可遷移的數據；第二，某家公司擁有足夠強的資金和工程能力，把真機數據飛輪真正跑起來。

相比之下，他認為第二種可能性更高。

在他看來，human data 路線真正要證明的，不是人類數據比真機數據更干凈，而是在規模、成本、遷移效率和泛化能力之間，是否能形成更優的綜合解。

這一路線的護城河也不只是數據量。

“算法其實沒有秘密。但數據，包括整個數據梳理的管線、積累和處理的方法，會影響你很長一段時間。有些人踩了三年的數據，你想馬上追上來，非常難。”

數據之外，還有組織能力。

“整個組織的文化、結構、價值觀，也很重要。”

從論文到公司，陳源培認為靈初做的一直是同一件事：讓人類數據能被機器人用起來。VLA、世界模型、強化學習都是工具，真正的方向是通用機器人能力。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.