網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

10億到手！中科大、斯坦福校友，蘋果前高管入局通用機(jī)器人

2026-05-07 16:36:19　來源: 算法與數(shù)學(xué)之美

北京舉報(bào)

分享至

5月6日消息，RoboScience機(jī)器科學(xué)近日完成了10億元人民幣A輪融資，投資方涵蓋多家國內(nèi)外知名產(chǎn)業(yè)巨頭及一線財(cái)務(wù)機(jī)構(gòu)。

公開資料顯示，RoboScience于2024年底注冊，2025年3月正式運(yùn)營，距今不過一年半。從種子輪到A輪，累計(jì)融資已超13億元，成長速度在行業(yè)內(nèi)居于前列。

據(jù)消息人士透露，RoboScience 的新一輪融資也接近完成，投資方包括互聯(lián)網(wǎng)產(chǎn)業(yè)資本、國家隊(duì)基金及頂級財(cái)務(wù)機(jī)構(gòu)。

PART.01

創(chuàng)始團(tuán)隊(duì)：蘋果＋斯坦福的“降維打擊”

創(chuàng)始人兼CEO田野，本科中科大物理學(xué)院，碩士斯坦福AI Lab，師從吳恩達(dá)。更關(guān)鍵的是，他曾在蘋果公司擔(dān)任AI Platform技術(shù)負(fù)責(zé)人，帶隊(duì)打造了被內(nèi)部譽(yù)為“蘋果的PyTorch與CUDA”的核心基礎(chǔ)設(shè)施平臺。

這個(gè)經(jīng)歷很有意思。蘋果不是一家傳統(tǒng)的AI公司，但它的AI產(chǎn)品落地能力極強(qiáng)——App Store背后是全球數(shù)百萬開發(fā)者的生態(tài)，AI技術(shù)要在這樣的環(huán)境下跑通，難度不亞于任何一家純AI公司。

田野選擇創(chuàng)業(yè)的邏輯也很直接：蘋果證明了“AI技術(shù)＋產(chǎn)品落地”這條路是通的，但具身智能領(lǐng)域的“產(chǎn)品落地”還遠(yuǎn)遠(yuǎn)沒有實(shí)現(xiàn)。

首席科學(xué)家邵林，博士同樣來自斯坦福AI Lab，師從Jeannette Bohg，聯(lián)合導(dǎo)師是Leonidas J。 Guibas——幾何計(jì)算的頂級學(xué)者。目前他在新加坡國立大學(xué)計(jì)算機(jī)系擔(dān)任助理教授，提出了UniGrasp深度神經(jīng)網(wǎng)絡(luò)架構(gòu)，成為數(shù)據(jù)驅(qū)動靈巧手抓取的基準(zhǔn)性方法。

學(xué)術(shù)圈的都知道，在機(jī)器人操作領(lǐng)域，ICRA最佳論文獎的含金量極高。2025年，RoboScience團(tuán)隊(duì)提出的D（R，O）Grasp拿了ICRA機(jī)器人操作與運(yùn)動最佳論文獎——這是近5年唯一來自亞洲的獲獎團(tuán)隊(duì)。2026年，他們的T（R，O）Grasp再次刷新全球SOTA，入圍ICRA 2026。

那么，學(xué)術(shù)成果能不能真正轉(zhuǎn)化為產(chǎn)品？

從團(tuán)隊(duì)背景看，核心成員來自斯坦福、中科大、港大、上交大、新國立等高校，以及蘋果、商湯、科沃斯等企業(yè)。產(chǎn)學(xué)研的閉環(huán)在這里形成了——邵林在學(xué)術(shù)端持續(xù)輸出，田野在產(chǎn)業(yè)端負(fù)責(zé)落地，中間還有一批從頭部公司出來的工程化人才。

PART.02

VLOA大模型的差異化路徑

具身智能行業(yè)，大部分公司在講“視頻生成”或“世界模型”的故事，核心思路是“讓機(jī)器人先'看'到要做什么”。

這個(gè)思路本身沒問題。但問題在于，視頻預(yù)測關(guān)注的是“機(jī)器人的視角看到什么”，而不是“物體的狀態(tài)發(fā)生了什么變化”。

RoboScience的技術(shù)路線不太一樣。他們的大模型叫VLOA——Vision－Language－Object－Action，字面意思就是把物體（Object）單獨(dú)拎出來，作為連接視覺、語言和動作的中介。

具體來說，VLOA引入了一個(gè)叫“Object Trajectory”的概念——物體3D點(diǎn)云軌跡。不是讓機(jī)器人預(yù)測“我要做什么的動作”，而是預(yù)測“這個(gè)物體接下來會怎么移動”。

這個(gè)區(qū)別很關(guān)鍵。比如你要讓機(jī)器人把一個(gè)杯子從桌上拿起來。視頻預(yù)測的思路是：機(jī)器人先想象自己伸手、抓住、抬起的畫面。物體軌跡的思路是：機(jī)器人先預(yù)測“杯子會沿著什么軌跡移動”，然后把自己的動作適配到這個(gè)軌跡上。

兩種思路都能完成任務(wù)，但第二種更符合“物理因果”——機(jī)器人的動作是因，物體的移動是果，抓住“果”比模擬“因”更容易泛化。

VLOA的架構(gòu)分為兩層：上層是具身世界模型，負(fù)責(zé)“認(rèn)知＋預(yù)演物理軌跡”；下層是通用操作模型，負(fù)責(zé)“把軌跡轉(zhuǎn)化為不同機(jī)器人的控制信號”。

這樣的設(shè)計(jì)讓RoboScience的操作模型具備了幾個(gè)關(guān)鍵能力：支持剛體、鉸鏈體、1D／2D／3D可形變體；支持跨本體操作——也就是說，同一個(gè)模型可以適配不同的機(jī)器人硬件；支持閉環(huán)操作和視覺、觸覺、力覺多模態(tài)感知。

從數(shù)據(jù)積累看，RoboScience目前有“數(shù)百萬小時(shí)以物體為中心的高維多模態(tài)操作數(shù)據(jù)集”，每周還在新增數(shù)十萬小時(shí)，目標(biāo)是2026年達(dá)到上千萬小時(shí)。仿真數(shù)據(jù)方面，他們自研了多模態(tài)物理引擎，已經(jīng)有數(shù)百億次高質(zhì)量操作軌跡數(shù)據(jù)，目標(biāo)是2026年達(dá)到1萬億次。

這也就意味著他們的模型是在“海量數(shù)據(jù)＋物理仿真”的雙重加持下訓(xùn)練的。不同于純視頻數(shù)據(jù)，仿真數(shù)據(jù)可以精確標(biāo)注“物體狀態(tài)變化”，而這正好是VLOA的核心需求。

PART.03

14個(gè)月從0到“本體＋大腦”

通常來說，創(chuàng)業(yè)公司會先選擇一個(gè)切入點(diǎn)——要么做本體，要么做大腦。

而RoboScience選擇兩個(gè)都自己做，"軟硬一體"。

他們將在近期發(fā)布自研機(jī)器人本體，涵蓋零售、物流、工業(yè)與家庭等場景。配合VLOA大模型，形成了“軟硬一體”的完整閉環(huán)。

這個(gè)策略有風(fēng)險(xiǎn)。軟硬一體意味著同時(shí)做兩件很難的事：硬件的工程化量產(chǎn)和軟件的能力泛化。行業(yè)里折在這上面的公司不少。

但換個(gè)角度看，軟硬一體也有它的邏輯。

現(xiàn)在行業(yè)里的問題是：本體公司和大腦公司互相不信任。本體公司覺得“模型公司不了解硬件”，模型公司覺得“本體公司不懂AI”。這種割裂導(dǎo)致“本體＋大腦”的整合方案很難真正落地——出了問題，雙方互相推諉。

RoboScience的選擇是把兩個(gè)能力都握在自己手里。這需要更高的研發(fā)投入，但好處是出了問題只有一個(gè)責(zé)任方，迭代速度會更快。

有意思的是，RoboScience的商業(yè)模式不只有“軟硬一體”這一條路。他們還提到了“模型即服務(wù)”的潛在模式——API調(diào)用和解決方案授權(quán)。

如果VLOA的能力足夠通用，這種授權(quán)模式是有想象空間的。想象一下：一家工業(yè)機(jī)器人公司，不需要自己訓(xùn)練大模型，直接調(diào)用VLOA的API，就能讓自己的機(jī)器人具備靈巧操作能力。這比“軟硬一體”更輕，但前提是模型能力足夠強(qiáng)。

兩條腿走路。這是RoboScience的商業(yè)策略。

PART.04

2026年的具身智能走到哪一步了？

2026年以來，國內(nèi)具身智能領(lǐng)域公開融資總額已超345億元。這個(gè)數(shù)字不小，但更值得關(guān)注的是結(jié)構(gòu)變化——資本從整機(jī)向關(guān)節(jié)模組、傳感器、靈熟手等上游核心部件滲透。

也就是說，行業(yè)正在“下沉”。不再只是“我要做一臺人形機(jī)器人”，而是開始關(guān)注“機(jī)器人的手能不能靈巧抓取”、“機(jī)器人的關(guān)節(jié)能不能精準(zhǔn)控制”。

這個(gè)趨勢對RoboScience是利好。他們的技術(shù)路線恰恰是圍繞“物體操作”展開的——抓取、操控、交互。這不是做一臺“看起來像人”的機(jī)器人，而是做一臺“能真正做事”的機(jī)器人。

另一個(gè)趨勢是，行業(yè)從“技術(shù)演示”轉(zhuǎn)向“規(guī)模量產(chǎn)”。星動紀(jì)元聯(lián)合中國郵政、順豐，已經(jīng)在10余個(gè)物流中心落地，Q2開啟千臺級批量交付。

量產(chǎn)意味著什么？意味著產(chǎn)品要經(jīng)受住真實(shí)場景的考驗(yàn)，不是實(shí)驗(yàn)室里跑幾個(gè)demo就能交代的。

RoboScience還沒有公布具體的量產(chǎn)計(jì)劃，但他們的技術(shù)路線和產(chǎn)品策略，都指向“能夠量產(chǎn)、能夠落地”這個(gè)目標(biāo)。14個(gè)月走完從0到“本體＋大腦”的閉環(huán)，速度不慢。

技術(shù)會迭代，資本會進(jìn)退，但最終能穿越周期的，一定是那些真正解決實(shí)際問題、創(chuàng)造真實(shí)價(jià)值的企業(yè)。

未來，RoboScience軟硬一體的模式，能不能真正跑通？VLOA的技術(shù)路線，能不能在更多場景驗(yàn)證？跨界團(tuán)隊(duì)的優(yōu)勢，能不能持續(xù)轉(zhuǎn)化為產(chǎn)品競爭力？

我們期待著最終的答案。

文章來源：GEIA全球具身智能觀察。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.