5月6日消息,RoboScience機(jī)器科學(xué)近日完成了10億元人民幣A輪融資,投資方涵蓋多家國內(nèi)外知名產(chǎn)業(yè)巨頭及一線財(cái)務(wù)機(jī)構(gòu)。
公開資料顯示,RoboScience于2024年底注冊,2025年3月正式運(yùn)營,距今不過一年半。從種子輪到A輪,累計(jì)融資已超13億元,成長速度在行業(yè)內(nèi)居于前列。
據(jù)消息人士透露,RoboScience 的新一輪融資也接近完成,投資方包括互聯(lián)網(wǎng)產(chǎn)業(yè)資本、國家隊(duì)基金及頂級財(cái)務(wù)機(jī)構(gòu)。
![]()
PART.01
創(chuàng)始團(tuán)隊(duì):蘋果+斯坦福的“降維打擊”
創(chuàng)始人兼CEO田野,本科中科大物理學(xué)院,碩士斯坦福AI Lab,師從吳恩達(dá)。更關(guān)鍵的是,他曾在蘋果公司擔(dān)任AI Platform技術(shù)負(fù)責(zé)人,帶隊(duì)打造了被內(nèi)部譽(yù)為“蘋果的PyTorch與CUDA”的核心基礎(chǔ)設(shè)施平臺。
這個(gè)經(jīng)歷很有意思。蘋果不是一家傳統(tǒng)的AI公司,但它的AI產(chǎn)品落地能力極強(qiáng)——App Store背后是全球數(shù)百萬開發(fā)者的生態(tài),AI技術(shù)要在這樣的環(huán)境下跑通,難度不亞于任何一家純AI公司。
田野選擇創(chuàng)業(yè)的邏輯也很直接:蘋果證明了“AI技術(shù)+產(chǎn)品落地”這條路是通的,但具身智能領(lǐng)域的“產(chǎn)品落地”還遠(yuǎn)遠(yuǎn)沒有實(shí)現(xiàn)。
首席科學(xué)家邵林,博士同樣來自斯坦福AI Lab,師從Jeannette Bohg,聯(lián)合導(dǎo)師是Leonidas J。 Guibas——幾何計(jì)算的頂級學(xué)者。目前他在新加坡國立大學(xué)計(jì)算機(jī)系擔(dān)任助理教授,提出了UniGrasp深度神經(jīng)網(wǎng)絡(luò)架構(gòu),成為數(shù)據(jù)驅(qū)動靈巧手抓取的基準(zhǔn)性方法。
學(xué)術(shù)圈的都知道,在機(jī)器人操作領(lǐng)域,ICRA最佳論文獎的含金量極高。2025年,RoboScience團(tuán)隊(duì)提出的D(R,O)Grasp拿了ICRA機(jī)器人操作與運(yùn)動最佳論文獎——這是近5年唯一來自亞洲的獲獎團(tuán)隊(duì)。2026年,他們的T(R,O)Grasp再次刷新全球SOTA,入圍ICRA 2026。
那么,學(xué)術(shù)成果能不能真正轉(zhuǎn)化為產(chǎn)品?
從團(tuán)隊(duì)背景看,核心成員來自斯坦福、中科大、港大、上交大、新國立等高校,以及蘋果、商湯、科沃斯等企業(yè)。產(chǎn)學(xué)研的閉環(huán)在這里形成了——邵林在學(xué)術(shù)端持續(xù)輸出,田野在產(chǎn)業(yè)端負(fù)責(zé)落地,中間還有一批從頭部公司出來的工程化人才。
PART.02
VLOA大模型的差異化路徑
具身智能行業(yè),大部分公司在講“視頻生成”或“世界模型”的故事,核心思路是“讓機(jī)器人先'看'到要做什么”。
這個(gè)思路本身沒問題。但問題在于,視頻預(yù)測關(guān)注的是“機(jī)器人的視角看到什么”,而不是“物體的狀態(tài)發(fā)生了什么變化”。
RoboScience的技術(shù)路線不太一樣。他們的大模型叫VLOA——Vision-Language-Object-Action,字面意思就是把物體(Object)單獨(dú)拎出來,作為連接視覺、語言和動作的中介。
![]()
具體來說,VLOA引入了一個(gè)叫“Object Trajectory”的概念——物體3D點(diǎn)云軌跡。不是讓機(jī)器人預(yù)測“我要做什么的動作”,而是預(yù)測“這個(gè)物體接下來會怎么移動”。
這個(gè)區(qū)別很關(guān)鍵。比如你要讓機(jī)器人把一個(gè)杯子從桌上拿起來。視頻預(yù)測的思路是:機(jī)器人先想象自己伸手、抓住、抬起的畫面。物體軌跡的思路是:機(jī)器人先預(yù)測“杯子會沿著什么軌跡移動”,然后把自己的動作適配到這個(gè)軌跡上。
兩種思路都能完成任務(wù),但第二種更符合“物理因果”——機(jī)器人的動作是因,物體的移動是果,抓住“果”比模擬“因”更容易泛化。
VLOA的架構(gòu)分為兩層:上層是具身世界模型,負(fù)責(zé)“認(rèn)知+預(yù)演物理軌跡”;下層是通用操作模型,負(fù)責(zé)“把軌跡轉(zhuǎn)化為不同機(jī)器人的控制信號”。
這樣的設(shè)計(jì)讓RoboScience的操作模型具備了幾個(gè)關(guān)鍵能力:支持剛體、鉸鏈體、1D/2D/3D可形變體;支持跨本體操作——也就是說,同一個(gè)模型可以適配不同的機(jī)器人硬件;支持閉環(huán)操作和視覺、觸覺、力覺多模態(tài)感知。
從數(shù)據(jù)積累看,RoboScience目前有“數(shù)百萬小時(shí)以物體為中心的高維多模態(tài)操作數(shù)據(jù)集”,每周還在新增數(shù)十萬小時(shí),目標(biāo)是2026年達(dá)到上千萬小時(shí)。仿真數(shù)據(jù)方面,他們自研了多模態(tài)物理引擎,已經(jīng)有數(shù)百億次高質(zhì)量操作軌跡數(shù)據(jù),目標(biāo)是2026年達(dá)到1萬億次。
這也就意味著他們的模型是在“海量數(shù)據(jù)+物理仿真”的雙重加持下訓(xùn)練的。不同于純視頻數(shù)據(jù),仿真數(shù)據(jù)可以精確標(biāo)注“物體狀態(tài)變化”,而這正好是VLOA的核心需求。
PART.03
14個(gè)月從0到“本體+大腦”
通常來說,創(chuàng)業(yè)公司會先選擇一個(gè)切入點(diǎn)——要么做本體,要么做大腦。
而RoboScience選擇兩個(gè)都自己做,"軟硬一體"。
他們將在近期發(fā)布自研機(jī)器人本體,涵蓋零售、物流、工業(yè)與家庭等場景。配合VLOA大模型,形成了“軟硬一體”的完整閉環(huán)。
這個(gè)策略有風(fēng)險(xiǎn)。軟硬一體意味著同時(shí)做兩件很難的事:硬件的工程化量產(chǎn)和軟件的能力泛化。行業(yè)里折在這上面的公司不少。
但換個(gè)角度看,軟硬一體也有它的邏輯。
現(xiàn)在行業(yè)里的問題是:本體公司和大腦公司互相不信任。本體公司覺得“模型公司不了解硬件”,模型公司覺得“本體公司不懂AI”。這種割裂導(dǎo)致“本體+大腦”的整合方案很難真正落地——出了問題,雙方互相推諉。
RoboScience的選擇是把兩個(gè)能力都握在自己手里。這需要更高的研發(fā)投入,但好處是出了問題只有一個(gè)責(zé)任方,迭代速度會更快。
有意思的是,RoboScience的商業(yè)模式不只有“軟硬一體”這一條路。他們還提到了“模型即服務(wù)”的潛在模式——API調(diào)用和解決方案授權(quán)。
如果VLOA的能力足夠通用,這種授權(quán)模式是有想象空間的。想象一下:一家工業(yè)機(jī)器人公司,不需要自己訓(xùn)練大模型,直接調(diào)用VLOA的API,就能讓自己的機(jī)器人具備靈巧操作能力。這比“軟硬一體”更輕,但前提是模型能力足夠強(qiáng)。
兩條腿走路。這是RoboScience的商業(yè)策略。
PART.04
2026年的具身智能走到哪一步了?
2026年以來,國內(nèi)具身智能領(lǐng)域公開融資總額已超345億元。這個(gè)數(shù)字不小,但更值得關(guān)注的是結(jié)構(gòu)變化——資本從整機(jī)向關(guān)節(jié)模組、傳感器、靈熟手等上游核心部件滲透。
也就是說,行業(yè)正在“下沉”。不再只是“我要做一臺人形機(jī)器人”,而是開始關(guān)注“機(jī)器人的手能不能靈巧抓取”、“機(jī)器人的關(guān)節(jié)能不能精準(zhǔn)控制”。
這個(gè)趨勢對RoboScience是利好。他們的技術(shù)路線恰恰是圍繞“物體操作”展開的——抓取、操控、交互。這不是做一臺“看起來像人”的機(jī)器人,而是做一臺“能真正做事”的機(jī)器人。
另一個(gè)趨勢是,行業(yè)從“技術(shù)演示”轉(zhuǎn)向“規(guī)模量產(chǎn)”。星動紀(jì)元聯(lián)合中國郵政、順豐,已經(jīng)在10余個(gè)物流中心落地,Q2開啟千臺級批量交付。
量產(chǎn)意味著什么?意味著產(chǎn)品要經(jīng)受住真實(shí)場景的考驗(yàn),不是實(shí)驗(yàn)室里跑幾個(gè)demo就能交代的。
RoboScience還沒有公布具體的量產(chǎn)計(jì)劃,但他們的技術(shù)路線和產(chǎn)品策略,都指向“能夠量產(chǎn)、能夠落地”這個(gè)目標(biāo)。14個(gè)月走完從0到“本體+大腦”的閉環(huán),速度不慢。
技術(shù)會迭代,資本會進(jìn)退,但最終能穿越周期的,一定是那些真正解決實(shí)際問題、創(chuàng)造真實(shí)價(jià)值的企業(yè)。
未來,RoboScience軟硬一體的模式,能不能真正跑通?VLOA的技術(shù)路線,能不能在更多場景驗(yàn)證?跨界團(tuán)隊(duì)的優(yōu)勢,能不能持續(xù)轉(zhuǎn)化為產(chǎn)品競爭力?
我們期待著最終的答案。
文章來源:GEIA全球具身智能觀察。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.