![]()
![]()
重構(gòu)仿真數(shù)據(jù)的生產(chǎn)方式。
作者|劉楊楠
編輯|栗子
5月12日,虛時科技(Intime AI)與地瓜機器人聯(lián)合開發(fā)的首款仿真空間數(shù)據(jù)生成平臺——AnySceneGen正式發(fā)布。
這是一個面向具身智能訓練的仿真空間生成平臺。用戶可以基于多模態(tài)輸入,快速生成對應的三維仿真場景,場景中所有物體自帶完整的物理屬性,可直接導入Isaac Sim、MuJoCo等主流仿真平臺,用于機器人訓練、評測與數(shù)據(jù)采集。
![]()
AnySceneGen平臺產(chǎn)品界面
這場合作真正值得關(guān)注的,是它直指一個被反復提及,卻遲遲無解的行業(yè)難題。
過去兩年,具身智能對訓練數(shù)據(jù)的需求進入指數(shù)級增長階段。仿真數(shù)據(jù)理論上可以突破真實采集的物理限制,通過算力并行無限擴展,且邊際成本隨規(guī)模遞減。
但現(xiàn)實中,除了備受關(guān)注Sim2Real Gap問題外,真正可用于仿真的空間環(huán)境(Sim-ready 3D scene)的供給方式還停留在手工作坊時代。建模師逐個制作資產(chǎn),手動搭建場景,再逐一配置物理參數(shù)。這套流程的成本和效率,讓仿真數(shù)據(jù)規(guī)模化生產(chǎn)的理論優(yōu)勢始終無法兌現(xiàn)。
虛時科技要做的,就是打破這個局面。
虛時科技成立于2024年下半年,是一家專注于打造物理AI時代數(shù)據(jù)基礎(chǔ)設(shè)施的初創(chuàng)公司,目前已獲得奇績創(chuàng)壇、宇跡科創(chuàng)的種子輪投資。
他們的切入點正是仿真空間規(guī)模化生產(chǎn)的底層難題——用模型替代人工,重構(gòu)整個仿真數(shù)據(jù)的供給方式。
1.重構(gòu)仿真數(shù)據(jù)的生產(chǎn)方式
當前,具身智能已經(jīng)全面進入數(shù)據(jù)驅(qū)動階段。
過去一年,國內(nèi)人形機器人公司密集融資,各家廠商的硬件能力快速迭代,Demo演示越來越流暢。但進入真實場景后,機器人往往容易“翻車”。因為真實環(huán)境千變?nèi)f化,光照、物體擺放角度、背景干擾、沒見過的新物體,任何一個變量超出訓練分布,模型就可能崩潰。
要讓模型具備這種泛化能力,需要的是海量、多樣化、覆蓋長尾場景的訓練數(shù)據(jù)。
在具身智能可用的訓練數(shù)據(jù)構(gòu)成中,真實遙操作數(shù)據(jù)是機器人理解物理世界最直接的基準,對于模型校準不可或缺。
但它的局限性同樣顯而易見。
每一條有效數(shù)據(jù)背后,是工程師輪班、設(shè)備損耗和場地限制,人力和硬件成本高昂。同時,危險場景和長尾場景天然難以覆蓋,并且無法適配強化學習、評測等環(huán)節(jié),采集到的數(shù)據(jù)涵蓋的物理信息也非常有限,可交互性較差。
更致命的是,這種方式的采集成本遵循線性增長邏輯。數(shù)據(jù)量每增加一個數(shù)量級,需要投入的人力和時間近乎等比例上升。這意味著真機數(shù)據(jù)更適合早期少數(shù)任務(wù)驗證。一旦涉及規(guī)模化落地,這種方式的成本高不可及。
今年,雖然一些公司已經(jīng)定下了全年采集百萬小時級數(shù)據(jù)集的目標,但對于打造通用機器人的終極遠景,這個體量還遠遠不夠。
仿真數(shù)據(jù)也因此被推到臺前。它的優(yōu)勢很直觀,可通過并行算力規(guī)模化擴展,場景變量更加可控,能批量生成真機難以獲取的因果維度訓練樣本。
對此,學界和產(chǎn)業(yè)界已有代表性案例。今年4月,蘇度科技發(fā)布軟硬件全棧自研的機器人系統(tǒng)Sudo R1,采用世界模型與強化學習一體化設(shè)計,在不使用任何真機數(shù)據(jù)的前提下,實現(xiàn)了關(guān)鍵任務(wù)近100%的Zero-shot成功率。
這個案例足以證明,仿真數(shù)據(jù)的價值上限,遠未被觸達。
但一個容易被忽視的悖論是,仿真數(shù)據(jù)本應突破真實數(shù)據(jù)采集的規(guī)模化瓶頸,可在現(xiàn)有生產(chǎn)流程中,能夠用于閉環(huán)交互、實驗和數(shù)據(jù)采集的仿真空間,仍主要依賴人工建模、人工布置和人工配置物理參數(shù),其生產(chǎn)方式尚未實現(xiàn)規(guī)模化。
還原一下傳統(tǒng)仿真數(shù)據(jù)生產(chǎn)流程,就能看到問題所在。
當前,雖然有各種基于生成或者重建的技術(shù)路徑,但要么缺失空間智能,仍需依賴人工擺放;要么缺乏可交互能力。最終,行業(yè)常見做法仍是由建模師手工制作,調(diào)取或者生成多個3D資產(chǎn),再把資產(chǎn)逐個擺放成空間場景,導入Isaac Sim、MuJoCo等仿真器,最后手動為每個物體配置材質(zhì)、質(zhì)量、摩擦系數(shù)等物理參數(shù)。
整個建模過程中,每一步都需要專業(yè)人員參與,且效率同樣呈線性增長。一個有經(jīng)驗的建模師一天只能搭出少量可用場景,如果要生成100個布局不同的廚房,時間成本幾乎是單個廚房的100倍。
如果企業(yè)沿用傳統(tǒng)人工建模方法,在超大規(guī)模需求下,邊際成本將急劇上升。如果仿真數(shù)據(jù)的生產(chǎn)方式不變,其在模型訓練中的效率優(yōu)勢就永遠停留在理論上。
這便是虛時科技正在撬動的杠桿。
2.Code-to-Space:規(guī)模化供給仿真數(shù)據(jù)的新范式
創(chuàng)業(yè)前,王德駪對技術(shù)方向已有充分的系統(tǒng)性思考。此前,在亞馬遜Alexa擔任大模型組技術(shù)負責人期間,王德駪曾負責LLM的開發(fā)和部署,帶領(lǐng)數(shù)十人研發(fā)團隊,服務(wù)全球約6億用戶。
![]()
虛時科技CEO王德駪
過去幾年,AI領(lǐng)域的熱點仍聚焦在語言模型、圖像生成和多模態(tài)理解上,“空間智能”和“世界模型”尚未成為行業(yè)共識。但基于在大模型一線研發(fā)和產(chǎn)業(yè)落地中的經(jīng)驗,王德駪很早形成了一個方向性判斷。
在他看來,今天的AI之所以能在文本、圖像等二維信息的理解與生成上逼近甚至超越人類,是因為互聯(lián)網(wǎng)積累了海量的數(shù)字化語料和視覺數(shù)據(jù)。但人類智能從來不只是閱讀文字和觀看圖像的結(jié)果,更關(guān)鍵的一部分能力,是在與物理世界進行交互、感知、操控和反饋的閉環(huán)中塑造出來的。
這意味著,如果AI真的要邁向通用,它就不能永遠停留在屏幕里處理符號。它必須走出二維信息的繭房,進入三維的、有重力、有摩擦、有碰撞的物理世界,去理解空間、結(jié)構(gòu)、尺度、材質(zhì)和物理約束等更高維的信息。
而今天被行業(yè)反復討論的物理AI,本質(zhì)上也正是在回應一個問題——如何讓AI從理解數(shù)字世界,走向理解物理世界,并在物理世界中完成感知、交互和決策。
沿著這個方向推演,物理AI當前最核心的落地場景,無疑是具身智能。王德駪明確判斷,仿真數(shù)據(jù)固然是當前機器人訓練中成本最低、產(chǎn)能最大的數(shù)據(jù)路線。但前提是,仿真數(shù)據(jù)的生產(chǎn)本身必須從傳統(tǒng)的人工主導轉(zhuǎn)向模型驅(qū)動。
理論上,大模型是規(guī)模化生成這類數(shù)據(jù)的最佳候選。但受限于當前語言和視覺模型的訓練方式,模型并不具備理解和生成三維空間所需的“空間智能”。
此前,讓模型學習空間智能的一種思路,是通過“重建+表征學習”提高模型的空間理解能力,但這難以讓模型真正學習空間構(gòu)造的底層邏輯,因此也難以形成真正的空間智能。
是否能基于大語言模型的底層能力,走一條更符合空間智能形成機制的路徑?這正是王德駪技術(shù)構(gòu)想的起點。
我們?nèi)粘K幍拇罅靠臻g,本質(zhì)上都是由人類設(shè)計、建造和使用經(jīng)驗共同塑造出來的“人造空間”,內(nèi)含一套可被拆解、抽象和復用的結(jié)構(gòu)化邏輯。
專業(yè)建模過程,則是這套空間構(gòu)造邏輯在數(shù)字世界中的顯性表達。一個建模人員會先理解空間的功能、尺度、結(jié)構(gòu)和關(guān)系,再逐步完成資產(chǎn)建模、布局組織、材質(zhì)處理和可用性校驗,不只是簡單復刻空間的外觀。
在王德駪看來,這本質(zhì)上就是在空間生成領(lǐng)域的一條“思維鏈(CoT)”。
語言模型已被驗證能夠沿思維鏈學會深度推理,只要將人類構(gòu)造空間的思維過程解構(gòu)并重組,形成一套專屬于空間構(gòu)造的“CoT”,模型就能學會隱藏在人類建模背后的空間構(gòu)造邏輯,進而讓模型涌現(xiàn)出真正的“空間智能”。
空間生成能力跑通后,下一個挑戰(zhàn)是,生成結(jié)果如何規(guī)模化投入具身智能的訓練管線?
機器人需要在場景中進行千萬次試錯,每一次反饋都可能要求調(diào)整場景中的某個變量,而大模型的生成能力自帶隨機性,很難在這種高交互密度的訓練管線中靈活應變。
如何實現(xiàn)生成結(jié)果的高可控性?
虛時科技更進一步,以代碼作為輸出,模型不直接輸出3D視覺結(jié)果,而是生成建模過程對應的可執(zhí)行代碼,再將代碼編譯成最終的3D空間資產(chǎn)和場景——這是虛時科技最具突破性的創(chuàng)新。代碼本身可檢查、可修改、可約束、可迭代的特性,能夠天然適配具身訓練對場景變量的精細控制要求。
最終,虛時科技形成了獨創(chuàng)的Code-to-Space技術(shù)方案以及自研空間智能模型,通過深度發(fā)掘空間感知層背后的空間結(jié)構(gòu)、尺度關(guān)系、功能邏輯、交互方式和物理約束等空間信息,并將其壓縮成可推理、可編輯、可執(zhí)行的結(jié)構(gòu)化表示,從而規(guī)模化生成高質(zhì)量、高可控性的仿真空間。
這套技術(shù)方案的核心優(yōu)勢有三個層面:
第一,資產(chǎn)獨立可編輯。基于mesh的結(jié)構(gòu)化表達,桌子是桌子,杯子是杯子,可以像搭積木一樣自由移動、替換。而基于3D高斯?jié)姙R或NeRF等隱式表征路線生成的3D空間,所有資產(chǎn)和空間粘連在一起,作為一個整體模型存在,無法進行分離、編輯和獨立控制。
第二,生成空間自帶物理屬性。模型通過數(shù)值化參數(shù)生成精準材質(zhì),例如透明度、折射率、反光率、粗糙度、金屬度等。在此基礎(chǔ)上,模型中的生成式物理仿真模塊進一步結(jié)合資產(chǎn)幾何、材質(zhì)和空間上下文,預測重量、摩擦系數(shù)、碰撞相關(guān)參數(shù)等物理屬性,并自動寫入USD等通用仿真文件格式。傳統(tǒng)仿真流程中需要人工手動配置的環(huán)節(jié),被全面自動化。
第三,可規(guī)模化泛化。傳統(tǒng)基于掃描重建的數(shù)字孿生技術(shù),本質(zhì)上只能還原已有世界。而Code-to-Space不僅能還原特定場景,還能批量生成布局不同但空間合理的場景變體。這恰好切中了具身預訓練對場景多樣性的核心需求。
從更底層的視角看,Code-to-Space本質(zhì)是對仿真空間生產(chǎn)范式的變革。
傳統(tǒng)3D軟件的可視化界面,本質(zhì)上是面向建模師開發(fā)的操作層。用戶在界面上的每一次操作,最終都需要通過底層代碼被執(zhí)行;而Code-to-Space是面向大模型、面向Agent開發(fā)的空間生成方式,由模型直接生成底層代碼,并將其映射為可編輯、可交互、具備物理屬性的仿真空間。
技術(shù)路徑跑通后,公司開始思考如何將這套方案推向產(chǎn)業(yè)。
這正是王云峰加入虛時科技出任COO的核心原因。王云峰的履歷橫跨互聯(lián)網(wǎng)和AI兩個時代,他是搜狗搜索的核心創(chuàng)始成員之一,曾與王小川等五位聯(lián)創(chuàng)共同打造搜狗搜索,擔任過搜索架構(gòu)負責人、阿里云高級專家。加入虛時科技前,王云峰曾任上市公司值得買科技CTO,并主導其AI應用研究院的技術(shù)建設(shè)與應用探索。
![]()
虛時科技COO王云峰
正因為完整經(jīng)歷過搜索引擎、推薦系統(tǒng)、大語言模型三個技術(shù)周期,王云峰對數(shù)據(jù)基礎(chǔ)設(shè)施的價值有切身體會。這些技術(shù)的崛起,本質(zhì)上都建立在大規(guī)模、高質(zhì)量數(shù)據(jù)供給之上。物理AI要發(fā)展,回到最底層,同樣需要先解決“數(shù)據(jù)從哪里來”的問題。“真實世界數(shù)據(jù)太貴、太慢、太難覆蓋長尾場景,仿真數(shù)據(jù)生產(chǎn)又過度依賴人工,這里面一定會出現(xiàn)新的平臺型公司。”王云峰表示。
因此,他加入虛時科技,正是要將Code-to-Space這條技術(shù)路徑,轉(zhuǎn)化為物理AI時代的數(shù)據(jù)生產(chǎn)基礎(chǔ)設(shè)施,推向商業(yè)市場。
目前,團隊分工明確:王德駪負責整體方向、核心技術(shù)研發(fā)與模型路線判斷;王云峰負責商務(wù)、運營與外部合作的整體推進。一個主攻技術(shù)深度,一個主攻產(chǎn)業(yè)落地,形成互補。
3.聯(lián)手地瓜,完成關(guān)鍵下游驗證
2025年底,地瓜機器人關(guān)注到了虛時科技的技術(shù)與下游適配性。
整體來看,地瓜機器人有三大核心業(yè)務(wù)板塊:芯片(硬件底座)、機器人平臺能力(算法)、開發(fā)者生態(tài)(數(shù)據(jù)、工具)。這一布局某種程度上對標了英偉達“芯片+Omniverse+Newton生態(tài)”的架構(gòu)。
在這套架構(gòu)中,數(shù)據(jù)是連接硬件底座與算法能力的關(guān)鍵一環(huán),直接決定了開發(fā)者生態(tài)的完整性和可用性。地瓜機器人也一直在尋找能夠在這個環(huán)節(jié)進行更深戰(zhàn)略布局的機會。
對地瓜機器人而言,仿真數(shù)據(jù)一直是內(nèi)部算法研發(fā)的重要基礎(chǔ),也是完善下游開發(fā)者生態(tài)、服務(wù)下游客戶的關(guān)鍵能力之一。問題在于,能夠規(guī)模化供給高質(zhì)量仿真數(shù)據(jù)的方案長期缺位。正是在這個背景下,虛時科技進入了地瓜機器人的視野。
地瓜機器人具身智能算法負責人何泳澔看重的,除了單個仿真空間的生成質(zhì)量,還有仿真空間生成的多樣性和泛化能力。
在他看來,具身智能訓練需要兩類數(shù)據(jù),一是少量高精度場景,用于精細化調(diào)試;二是大規(guī)模、低成本、覆蓋不同空間尺度、物體組合、布局關(guān)系、任務(wù)條件和長尾情況的泛化數(shù)據(jù),用于預訓練階段的模型泛化能力建設(shè)。
許多廠商能夠憑借前者打造出精美的機器人Demo,但后者的供給長期嚴重匱乏,這也正是機器人在真實場景中落地困難重重的根源所在。
他進一步指出,具身模型的訓練,尤其是預訓練階段,數(shù)據(jù)的多樣性遠比重建精度更重要。而多數(shù)仿真數(shù)據(jù)生成方案始終無法同時滿足“可生成、可編輯、可仿真、可規(guī)模化、可泛化”這五個條件,可這恰恰是仿真數(shù)據(jù)真正大規(guī)模進入訓練管線的硬性門檻。
雙方接觸后,地瓜發(fā)現(xiàn),虛時科技的Code-to-Space路徑在這五個關(guān)鍵環(huán)節(jié)上形成了完整閉環(huán)。“從我們目前接觸和驗證過的技術(shù)路徑來看,虛時科技的Code-to-Space是目前少數(shù),甚至可以說是唯一真正能夠同時兼顧高質(zhì)量空間生成、物理屬性生成、可編輯性和規(guī)模化量產(chǎn)的仿真空間生成方案。”何泳澔表示。
![]()
3D仿真空間生成效果圖
基于這一判斷,雙方從數(shù)據(jù)驗證走向平臺共建,決定聯(lián)合開發(fā)3D仿真空間生成平臺。
當時,虛時科技剛完成Code-to-Space從0到1的技術(shù)驗證,正處于從技術(shù)走向市場的關(guān)鍵階段。對虛時科技而言,相比將數(shù)據(jù)賣給單一公司,更理想的模式是確立規(guī)模化生產(chǎn)仿真數(shù)據(jù)的技術(shù)標桿,占據(jù)更普適的生態(tài)位入口,將數(shù)據(jù)以平臺化方式持續(xù)供給更多下游企業(yè)。
達成共識后,雙方開始了為期三個月的技術(shù)驗證。地瓜機器人的算法團隊對生成質(zhì)量、流程穩(wěn)定性、物理屬性可用性和格式兼容性進行了反復測試。
今年3月,雙方簽訂戰(zhàn)略合作協(xié)議,正式啟動平臺開發(fā)。
合作過程中,雙方分工明確,形成優(yōu)勢互補。地瓜主要提供具身算法、工具鏈和開發(fā)平臺能力;虛時科技主要提供仿真空間生成模型,規(guī)模化生成自帶物理屬性的仿真數(shù)據(jù)。
5月12日,AnySceneGen Beta版本正式上線。
AnySceneGen的核心目標,是為具身智能仿真訓練批量化生成可閉環(huán)交互的仿真空間。用戶可基于多模態(tài)輸入快速生成不同類型的仿真空間,結(jié)合自身訓練需求采集合成數(shù)據(jù)并進行模型訓練。
在技術(shù)架構(gòu)上,AnySceneGen平臺采用基于mesh的結(jié)構(gòu)化輸出方案,相較于NeRF、3DGS等技術(shù)路徑,更適用于機器人仿真訓練、物理交互與可執(zhí)行任務(wù)建模。
同時,AnySceneGen生成的場景具備高度可控和可編輯能力。開發(fā)者可根據(jù)訓練需求,靈活調(diào)整空間布局、物體屬性、交互邏輯、材質(zhì)風格以及任務(wù)約束,快速構(gòu)造具備多樣性與泛化性的仿真訓練環(huán)境。
此外,平臺生成的空間不僅具備高質(zhì)量視覺屬性,也在生成過程中自動生成并寫入碰撞體、物理材質(zhì)、尺度關(guān)系、運動約束等物理屬性信息,可進一步提升機器人在仿真環(huán)境中的交互真實性與訓練穩(wěn)定性,為后續(xù)Sim2Real泛化提供更有效的數(shù)據(jù)基礎(chǔ)。
目前,平臺已經(jīng)深度集成虛時科技InteriorGen與地瓜機器人的TabletopGen能力,可生成桌面級與室內(nèi)級仿真空間。
基于AnySceneGen,地瓜機器人的具身團隊也已開始生成兩類仿真數(shù)據(jù):一類是Loco-manipulation,涉及硬件本體在仿真場景中的導航和操作數(shù)據(jù);另一類是空間感知,涉及多目異構(gòu)相機在空間中的深度或點云真值。
截至目前,前者已經(jīng)生成超過100萬episodes,后者已經(jīng)生產(chǎn)超過1000萬幀。
AnySceneGen平臺生成的仿真空間
接下來,平臺會分階段推進場景覆蓋能力——從桌面級場景和家庭空間起步,逐步延伸至辦公場所、工廠、超市、商業(yè)區(qū)等室內(nèi)場景。現(xiàn)階段,平臺重點聚焦機器人操作任務(wù),后續(xù)將進一步支持導航與操作結(jié)合的復合任務(wù),為下游開發(fā)者提供更豐富的訓練場景支撐。
![]()
虛時科技仿真空間生成案例圖
值得注意的是,AnySceneGen核心交付的是一套按需生成、持續(xù)供給的仿真數(shù)據(jù)生成能力。AnySceneGen的定位,更像是具身智能訓練體系中的上游數(shù)據(jù)生成平臺。
客觀來看,這是一次典型的雙贏。
地瓜機器人增強了自身開發(fā)者生態(tài)中數(shù)據(jù)供給的環(huán)節(jié),進一步完善了“芯片+算法+開發(fā)者生態(tài)”的全鏈路布局。
虛時科技則在完成技術(shù)自證后,獲得了一份來自頭部生態(tài)玩家的關(guān)鍵產(chǎn)業(yè)認可。這并非偶然,而是其技術(shù)路線、生態(tài)位選擇和下游驗證積累的一次集中兌現(xiàn)。
4.占據(jù)物理AI的基礎(chǔ)設(shè)施入口
AnySceneGen上線,是虛時科技的商業(yè)化起點,但遠不是終點。
當前,具身智能訓練的不同階段對數(shù)據(jù)的需求正在分化。預訓練階段需要足夠多樣化的場景數(shù)據(jù)來提升泛化能力,這是仿真數(shù)據(jù)優(yōu)勢最明顯的環(huán)節(jié);后訓練或微調(diào)階段則需要可控變量、長尾場景和失敗案例來進行系統(tǒng)評測和提升,仿真數(shù)據(jù)同樣是有力補充。
長期來看,下游需求的細化將一步步倒逼上游數(shù)據(jù)供給體系加速產(chǎn)業(yè)分工。
「甲子光年」梳理發(fā)現(xiàn),具身智能仿真訓練數(shù)據(jù)的供給體系正在加速分層,大致可以劃分為三層。
最上游是仿真空間生成,負責按訓練需求規(guī)模化產(chǎn)出帶物理屬性的3D場景,直接決定數(shù)據(jù)供給的產(chǎn)能上限;中間層是仿真器,如Isaac Sim、MuJoCo等,承擔物理計算與傳感器渲染任務(wù),目前這一層格局已相對成熟;最下游是具身訓練,由機器人廠商和算法團隊基于任務(wù)需求,將仿真數(shù)據(jù)導入訓練管線。
過去,這三層之間的協(xié)作高度耦合,仿真場景嚴重依賴人工定制,生產(chǎn)效率低下,迫使許多下游廠商不得不自建數(shù)據(jù)團隊,重復投入?yún)s難以規(guī)模化。
而隨著仿真數(shù)據(jù)的戰(zhàn)略價值被行業(yè)廣泛認可,三層之間的專業(yè)化分工正在加速,尤其是上游仿真空間生成環(huán)節(jié),正在成為一個獨立的、平臺化的新機會。
虛時科技選擇切入的,正是這一環(huán)節(jié)。
公司基于Code-to-Space路徑自研的空間智能模型,將傳統(tǒng)人工仿真數(shù)據(jù)生產(chǎn)流程轉(zhuǎn)化為模型驅(qū)動的平臺化供給能力,規(guī)模化生成足夠泛化、具備物理屬性、可編輯、可交互的3D仿真場景。
這也決定了,虛時科技與市面上一些仿真數(shù)據(jù)供應商有本質(zhì)區(qū)別。
多數(shù)供應商的核心模式,是圍繞具身智能的具體任務(wù),組織人力或半自動化地生產(chǎn)仿真數(shù)據(jù),本質(zhì)上解決的是“交付數(shù)據(jù)”的問題。而虛時科技的核心優(yōu)勢,是完成了從“人工交付數(shù)據(jù)”到“模型生成空間”的關(guān)鍵跨越,形成了一套可規(guī)模化生成仿真空間的底層模型能力。
這意味著,仿真數(shù)據(jù)并非這套模型能力的全部,而是其在具身智能訓練場景下最直接、最剛需的交付形態(tài)。虛時科技真正瞄準的,是物理AI時代對三維空間數(shù)據(jù)的底層需求:持續(xù)生成足夠多樣、足夠可控、足夠可交互,并且能夠直接進入訓練管線的仿真空間。
他們之所以選擇將商業(yè)化的第一步落在具身智能上,原因也很明確。在物理AI賽道中,具身智能的數(shù)據(jù)需求更剛性、規(guī)模化空間更大,也是檢驗基座能力、加速模型迭代的最優(yōu)戰(zhàn)場。在這個過程中,每一份進入真實訓練流程的仿真數(shù)據(jù),既是商業(yè)產(chǎn)出,也是模型能力的持續(xù)積累。
目前,行業(yè)已從“要不要用仿真數(shù)據(jù)”,進入“如何定義、采購和驗收高質(zhì)量仿真數(shù)據(jù)”的新階段。圍繞可訓練場景的類型、必要物理屬性、仿真平臺適配、任務(wù)包組織方式和商業(yè)化計費方式,虛時科技已在與地瓜機器人及下游客戶的驗證中形成了一套初步框架,并正通過AnySceneGen將其產(chǎn)品化、平臺化。
![]()
虛時科技產(chǎn)品流程圖
從生態(tài)位上看,虛時科技專注于補齊物理AI演進過程中最上游、也最容易被低估的一環(huán)——可規(guī)模化生成的仿真空間數(shù)據(jù)。
AnySceneGen的上線,標志著這套能力已經(jīng)從技術(shù)驗證進入產(chǎn)業(yè)生態(tài)。對于具身智能而言,下一階段的競爭不只在模型和本體,也在誰能持續(xù)生產(chǎn)足夠多、足夠泛化、足夠可用的訓練數(shù)據(jù)。虛時科技押注的,正是這個基礎(chǔ)設(shè)施級的大風向。
(文中圖片來源:虛時科技,封面圖來源:AI生成)
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.