![]()
機(jī)器之心發(fā)布
WorldArena 世界模型賽道從來都是競爭異常激烈,在經(jīng)歷了前幾次比賽過程中的放榜之后,CVPR 2026 WorldArena 世界模型賽道鎖定總成績,智元自研的世界模型 Genie Envisioner-Sim 2.0(以下簡稱 GE 2.0)拿下了最終的冠軍,成為了 “強(qiáng)者中的強(qiáng)者”。
![]()
WorldArena 是目前世界模型賽道最權(quán)威的榜單,擁有最嚴(yán)苛的評測基準(zhǔn),構(gòu)建了包含 16 項細(xì)分核心指標(biāo)和 3 大真實應(yīng)用任務(wù)的立體評估體系,旨在對具身世界模型的感知精度、物理規(guī)律理解、三維空間認(rèn)知以及動作預(yù)測與落地能力進(jìn)行最嚴(yán)苛的考察。由于其極高的學(xué)術(shù)嚴(yán)謹(jǐn)性與行業(yè)公信力,WorldArena 吸引了全球幾乎所有頭部世界模型團(tuán)隊同臺競技。
在該賽道評測中,智元團(tuán)隊使用了原生的世界模型 GE 2.0,并未針對賽題進(jìn)行特殊設(shè)計優(yōu)化,僅基于榜單數(shù)據(jù)進(jìn)行了基礎(chǔ)微調(diào)(Finetune)。“輕裝上陣” 依然拔得頭籌,充分印證了 GE 2.0 強(qiáng)大的通用適配性。面對近期世界模型方向的火熱關(guān)注和創(chuàng)業(yè)浪潮,智元始終保持自己的節(jié)奏,從長遠(yuǎn)第一性原理出發(fā) ,專注于打磨具身世界模型的堅實技術(shù)底座。此次登頂,是智元堅持長期技術(shù)演進(jìn)的實力見證。
![]()
- 項目鏈接:https://ge-sim-v2.github.io/
- Arxiv:https://arxiv.org/abs/2605.27491
- Github:https://github.com/AgibotTech/GE-Sim-V2
裸考封神
智元 GE 2.0 模型實力登頂
沒有針對 WorldArena 進(jìn)行特別調(diào)優(yōu),裸考出戰(zhàn)依然斷層領(lǐng)跑。在 GE 2.0 技術(shù)報告中,智元團(tuán)隊對模型進(jìn)行了全面的能力剖析。相比上一代模型,GE 2.0 不僅在單點性能上實現(xiàn)了躍升,更真正演進(jìn)為一個全功能、高可用的世界模擬器,構(gòu)建可試錯、可迭代、可進(jìn)化的虛擬仿真環(huán)境,讓機(jī)器人策略在虛擬場景中自主積累經(jīng)驗、完成動態(tài)試錯,規(guī)避真實場景的試錯成本,最終高效遷移至真實物理世界穩(wěn)定落地,真正實現(xiàn)從 “感知預(yù)測” 到 “仿真進(jìn)化、自主決策” 的閉環(huán)升級。
功能矩陣全面補(bǔ)齊:GE 2.0 在功能上首次全面覆蓋了長時序生成、多視角生成、本體狀態(tài)生成、近實時推理以及獎勵判別等核心環(huán)節(jié),構(gòu)建了世界模擬器完整的技術(shù)能力閉環(huán)。
![]()
長時序推演能力突破: 在長時序推理任務(wù)中,GE 2.0 表現(xiàn)出極強(qiáng)的穩(wěn)定性,畫面質(zhì)量隨推理時長的衰減顯著弱于行業(yè)基線方案。即使在連續(xù)推演 40-50 秒的長視頻片段時,其生成質(zhì)量依然超越了基線模型前 10 秒內(nèi)的表現(xiàn)。
![]()
高可靠的閉環(huán)評測:作為世界模擬器,核心在于能否真實反映物理世界。團(tuán)隊驗證了大量閉環(huán)評測結(jié)果,證明 GE 2.0 在多項任務(wù)上均與真實世界保持著強(qiáng)相關(guān)性。這種相關(guān)性不止步于宏觀統(tǒng)計意義上的 “成功率一致”,團(tuán)隊還進(jìn)行了逐案(Case-by-case)的 rollout 結(jié)果對比分析,并通過混淆矩陣(Confusion Matrix)提供了嚴(yán)謹(jǐn)?shù)牧炕糇C,強(qiáng)有力地證明了 GE 2.0 作為策略評測器的可靠性。
![]()
打通數(shù)據(jù)回流反哺機(jī)制:在獎勵模型(Reward Model)的加持下,GE 2.0 能夠?qū)﹂]環(huán)評測的 rollout 過程進(jìn)行自動化篩選,將世界模型中產(chǎn)出的有效高質(zhì)量數(shù)據(jù)精準(zhǔn)回流給策略模型(Policy Model)。實驗證明,這一機(jī)制在多項任務(wù)上均助力策略模型實現(xiàn)了顯著的性能漲點。
![]()
從技術(shù)沉淀來看,智元 GE 2.0 的登頂,是長期深耕底層算法、打磨物理 AI 核心能力的必然結(jié)果。相較于行業(yè)同類模型,該模型實現(xiàn)了全方位技術(shù)躍升,不僅補(bǔ)齊長時序穩(wěn)定推演、多視角精準(zhǔn)生成、實時物理還原、閉環(huán)獎勵判別等全維度能力,更突破傳統(tǒng)模型 “重視覺、輕物理、難落地” 的行業(yè)痛點。即便在 40-50 秒超長時序復(fù)雜場景推演中,依舊能保持畫面穩(wěn)定、物理邏輯精準(zhǔn)、空間結(jié)構(gòu)無偏差,生成數(shù)據(jù)可直接反哺機(jī)器人策略模型迭代,真正實現(xiàn)從 “視覺擬真” 到 “物理可信、可用、可落地” 的質(zhì)變,算法通用性、穩(wěn)定性、實用性全面領(lǐng)先行業(yè)水平。
ALL IN AI
智元定位 “具身智能的基礎(chǔ)模型公司”
區(qū)別于行業(yè)多數(shù)聚焦機(jī)器人硬件整機(jī)、場景應(yīng)用或單點技術(shù)優(yōu)化的企業(yè),智元堅定錨定具身智能基礎(chǔ)模型公司核心定位,核心邏輯不在于制造機(jī)器人本體,而在于打造支撐整個物理 AI 行業(yè)發(fā)展的底層基礎(chǔ)設(shè)施與通用基礎(chǔ)能力。不同于單點應(yīng)用技術(shù)的迭代,智元深耕通用具身基礎(chǔ)模型,打造可適配全場景、可通用泛化、可自主進(jìn)化的底層 AI 能力,為機(jī)器人的運動、感知、決策、作業(yè)提供核心大腦。
今年 4 月,智元連續(xù)一周進(jìn)行了 “ALL IN AI” 智元 AI WEEK 成果發(fā)布,完成了開源數(shù)據(jù)集、開源仿真平臺、基座大模型、世界仿真器、機(jī)器人部署應(yīng)用平臺五大核心維度的完整技術(shù)閉環(huán)搭建,構(gòu)建了行業(yè)獨一份的 “數(shù)據(jù)筑基 — 仿真賦能 — 模型進(jìn)化 — 應(yīng)用落地 — 生態(tài)開放” 全鏈路能力體系,徹底擺脫單點技術(shù)短板,成為具身智能領(lǐng)域全能型戰(zhàn)士。
- AGIBOT WORLD 2026:首個系統(tǒng)性覆蓋具身智能全域研究的開源數(shù)據(jù)集
- Genie Sim 3.0:首個大語言模型驅(qū)動的仿真開發(fā)平臺
- Genie Operator-2:通用具身基座大模型,定義 “知行合一” 新高度
- Genie Envisioner 2.0:世界模型驅(qū)動的環(huán)境模擬器
- Genie Studio Agent:面向具身作業(yè)場景的零代碼 Agent 應(yīng)用平臺
當(dāng)前行業(yè)普遍存在數(shù)據(jù)質(zhì)量參差不齊、仿真成本高、模型落地難、部署門檻高的痛點,智元通過全棧基礎(chǔ)技術(shù)布局,打通了完整價值閉環(huán),解決了制約行業(yè)發(fā)展的共性底層難題。同時,智元堅持 ALL IN AI 的核心戰(zhàn)略,所有技術(shù)迭代均圍繞通用基礎(chǔ)能力升級,而非單一場景定制優(yōu)化,其技術(shù)成果可覆蓋全品類機(jī)器人、全行業(yè)物理作業(yè)場景,具備極強(qiáng)的產(chǎn)業(yè)賦能屬性,真正承擔(dān)起具身智能領(lǐng)域基礎(chǔ)底座搭建者、行業(yè)標(biāo)準(zhǔn)定義者的角色,也是智元能夠拿下世界模型賽道全球總冠軍、持續(xù)領(lǐng)跑物理 AI 的核心根源。
真正的通用機(jī)器人,離不開硬件本體與智能系統(tǒng)的深度協(xié)同,更需要全棧自研的 AI 能力體系作為堅實底座。具身智能的未來,不在于零散的單點創(chuàng)新,而在于可持續(xù)進(jìn)化、可協(xié)同放大的系統(tǒng)性能力。從建成全球首個 3000 平方米機(jī)器人實景數(shù)據(jù)采集場地,到推出一站式仿真開發(fā)平臺 Genie Sim;從通用具身基礎(chǔ)模型 Genie Operator 1,到實現(xiàn)對物理世界深度理解的世界模型 Genie Envisioner;再到面向全量開發(fā)者的具身智能一站式開發(fā)平臺 Genie Studio:智元持續(xù)構(gòu)建面向物理 AI 的完整能力底座,打通技術(shù)價值閉環(huán),讓每一項 AI 能力都成為推動機(jī)器人邁向 “部署態(tài)” 的堅實支撐。
錨定 “部署態(tài)”
讓具身智能從炫技走向商用閉環(huán)
部署態(tài)是今年智元在 2026APC 合作伙伴大會上提出來的概念,智元依托全棧技術(shù)閉環(huán),實現(xiàn)機(jī)器人在真實復(fù)雜場景中大規(guī)模穩(wěn)定作業(yè)、持續(xù)迭代,具備可落地、可復(fù)用特質(zhì),真正標(biāo)志著具身智能從技術(shù)演示邁向規(guī)模化商用新階段。
成功實施 “部署態(tài)” 的核心在于底層算法的演進(jìn),智元 ALL IN AI 的核心邏輯始終圍繞真實物理世界、真實作業(yè)需求、真實商用落地,全部服務(wù)于機(jī)器人規(guī)模化部署:真實場景數(shù)據(jù)集保證模型適配復(fù)雜真實環(huán)境;生成式仿真大幅降低試錯成本;基座模型保障作業(yè)精準(zhǔn)穩(wěn)定;世界模型提升復(fù)雜任務(wù)自主決策能力;零代碼平臺徹底解決落地難、復(fù)制難、迭代難的產(chǎn)業(yè)痛點,實現(xiàn)技術(shù)價值到產(chǎn)業(yè)價值的完整閉環(huán)。
一次裸考登頂,是實力的印證;持續(xù)全域領(lǐng)跑,是強(qiáng)者的常態(tài)。智元本次登頂 WorldArena 世界模型總分冠軍,是智元長期堅持 All in AI 戰(zhàn)略的成果。算法是未來具身智能產(chǎn)業(yè)的競爭核心,只有持續(xù)迭代世界模型、基座大模型等核心算法能力,深化虛實融合技術(shù)閉環(huán),才能在具身智能這條長跑之路上,不斷引領(lǐng)向前。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.