剛剛，智元拿下WorldArena世界模型總分冠軍！

2026-05-29 21:54:56　來源: 機(jī)器之心Pro

河北舉報

分享至

機(jī)器之心發(fā)布

WorldArena 世界模型賽道從來都是競爭異常激烈，在經(jīng)歷了前幾次比賽過程中的放榜之后，CVPR 2026 WorldArena 世界模型賽道鎖定總成績，智元自研的世界模型 Genie Envisioner-Sim 2.0（以下簡稱 GE 2.0）拿下了最終的冠軍，成為了 “強(qiáng)者中的強(qiáng)者”。

WorldArena 是目前世界模型賽道最權(quán)威的榜單，擁有最嚴(yán)苛的評測基準(zhǔn)，構(gòu)建了包含 16 項細(xì)分核心指標(biāo)和 3 大真實應(yīng)用任務(wù)的立體評估體系，旨在對具身世界模型的感知精度、物理規(guī)律理解、三維空間認(rèn)知以及動作預(yù)測與落地能力進(jìn)行最嚴(yán)苛的考察。由于其極高的學(xué)術(shù)嚴(yán)謹(jǐn)性與行業(yè)公信力，WorldArena 吸引了全球幾乎所有頭部世界模型團(tuán)隊同臺競技。

在該賽道評測中，智元團(tuán)隊使用了原生的世界模型 GE 2.0，并未針對賽題進(jìn)行特殊設(shè)計優(yōu)化，僅基于榜單數(shù)據(jù)進(jìn)行了基礎(chǔ)微調(diào)（Finetune）。“輕裝上陣” 依然拔得頭籌，充分印證了 GE 2.0 強(qiáng)大的通用適配性。面對近期世界模型方向的火熱關(guān)注和創(chuàng)業(yè)浪潮，智元始終保持自己的節(jié)奏，從長遠(yuǎn)第一性原理出發(fā) ，專注于打磨具身世界模型的堅實技術(shù)底座。此次登頂，是智元堅持長期技術(shù)演進(jìn)的實力見證。

項目鏈接：https://ge-sim-v2.github.io/
Arxiv：https://arxiv.org/abs/2605.27491
Github：https://github.com/AgibotTech/GE-Sim-V2

裸考封神

智元 GE 2.0 模型實力登頂

沒有針對 WorldArena 進(jìn)行特別調(diào)優(yōu)，裸考出戰(zhàn)依然斷層領(lǐng)跑。在 GE 2.0 技術(shù)報告中，智元團(tuán)隊對模型進(jìn)行了全面的能力剖析。相比上一代模型，GE 2.0 不僅在單點性能上實現(xiàn)了躍升，更真正演進(jìn)為一個全功能、高可用的世界模擬器，構(gòu)建可試錯、可迭代、可進(jìn)化的虛擬仿真環(huán)境，讓機(jī)器人策略在虛擬場景中自主積累經(jīng)驗、完成動態(tài)試錯，規(guī)避真實場景的試錯成本，最終高效遷移至真實物理世界穩(wěn)定落地，真正實現(xiàn)從 “感知預(yù)測” 到 “仿真進(jìn)化、自主決策” 的閉環(huán)升級。

功能矩陣全面補(bǔ)齊：GE 2.0 在功能上首次全面覆蓋了長時序生成、多視角生成、本體狀態(tài)生成、近實時推理以及獎勵判別等核心環(huán)節(jié)，構(gòu)建了世界模擬器完整的技術(shù)能力閉環(huán)。

長時序推演能力突破：在長時序推理任務(wù)中，GE 2.0 表現(xiàn)出極強(qiáng)的穩(wěn)定性，畫面質(zhì)量隨推理時長的衰減顯著弱于行業(yè)基線方案。即使在連續(xù)推演 40-50 秒的長視頻片段時，其生成質(zhì)量依然超越了基線模型前 10 秒內(nèi)的表現(xiàn)。

高可靠的閉環(huán)評測：作為世界模擬器，核心在于能否真實反映物理世界。團(tuán)隊驗證了大量閉環(huán)評測結(jié)果，證明 GE 2.0 在多項任務(wù)上均與真實世界保持著強(qiáng)相關(guān)性。這種相關(guān)性不止步于宏觀統(tǒng)計意義上的 “成功率一致”，團(tuán)隊還進(jìn)行了逐案（Case-by-case）的 rollout 結(jié)果對比分析，并通過混淆矩陣（Confusion Matrix）提供了嚴(yán)謹(jǐn)?shù)牧炕糇C，強(qiáng)有力地證明了 GE 2.0 作為策略評測器的可靠性。

打通數(shù)據(jù)回流反哺機(jī)制：在獎勵模型（Reward Model）的加持下，GE 2.0 能夠?qū)﹂]環(huán)評測的 rollout 過程進(jìn)行自動化篩選，將世界模型中產(chǎn)出的有效高質(zhì)量數(shù)據(jù)精準(zhǔn)回流給策略模型（Policy Model）。實驗證明，這一機(jī)制在多項任務(wù)上均助力策略模型實現(xiàn)了顯著的性能漲點。

從技術(shù)沉淀來看，智元 GE 2.0 的登頂，是長期深耕底層算法、打磨物理 AI 核心能力的必然結(jié)果。相較于行業(yè)同類模型，該模型實現(xiàn)了全方位技術(shù)躍升，不僅補(bǔ)齊長時序穩(wěn)定推演、多視角精準(zhǔn)生成、實時物理還原、閉環(huán)獎勵判別等全維度能力，更突破傳統(tǒng)模型 “重視覺、輕物理、難落地” 的行業(yè)痛點。即便在 40-50 秒超長時序復(fù)雜場景推演中，依舊能保持畫面穩(wěn)定、物理邏輯精準(zhǔn)、空間結(jié)構(gòu)無偏差，生成數(shù)據(jù)可直接反哺機(jī)器人策略模型迭代，真正實現(xiàn)從 “視覺擬真” 到 “物理可信、可用、可落地” 的質(zhì)變，算法通用性、穩(wěn)定性、實用性全面領(lǐng)先行業(yè)水平。

ALL IN AI

智元定位 “具身智能的基礎(chǔ)模型公司”

區(qū)別于行業(yè)多數(shù)聚焦機(jī)器人硬件整機(jī)、場景應(yīng)用或單點技術(shù)優(yōu)化的企業(yè)，智元堅定錨定具身智能基礎(chǔ)模型公司核心定位，核心邏輯不在于制造機(jī)器人本體，而在于打造支撐整個物理 AI 行業(yè)發(fā)展的底層基礎(chǔ)設(shè)施與通用基礎(chǔ)能力。不同于單點應(yīng)用技術(shù)的迭代，智元深耕通用具身基礎(chǔ)模型，打造可適配全場景、可通用泛化、可自主進(jìn)化的底層 AI 能力，為機(jī)器人的運動、感知、決策、作業(yè)提供核心大腦。

今年 4 月，智元連續(xù)一周進(jìn)行了 “ALL IN AI” 智元 AI WEEK 成果發(fā)布，完成了開源數(shù)據(jù)集、開源仿真平臺、基座大模型、世界仿真器、機(jī)器人部署應(yīng)用平臺五大核心維度的完整技術(shù)閉環(huán)搭建，構(gòu)建了行業(yè)獨一份的 “數(shù)據(jù)筑基 — 仿真賦能 — 模型進(jìn)化 — 應(yīng)用落地 — 生態(tài)開放” 全鏈路能力體系，徹底擺脫單點技術(shù)短板，成為具身智能領(lǐng)域全能型戰(zhàn)士。

AGIBOT WORLD 2026：首個系統(tǒng)性覆蓋具身智能全域研究的開源數(shù)據(jù)集
Genie Sim 3.0：首個大語言模型驅(qū)動的仿真開發(fā)平臺
Genie Operator-2：通用具身基座大模型，定義 “知行合一” 新高度
Genie Envisioner 2.0：世界模型驅(qū)動的環(huán)境模擬器
Genie Studio Agent：面向具身作業(yè)場景的零代碼 Agent 應(yīng)用平臺

當(dāng)前行業(yè)普遍存在數(shù)據(jù)質(zhì)量參差不齊、仿真成本高、模型落地難、部署門檻高的痛點，智元通過全棧基礎(chǔ)技術(shù)布局，打通了完整價值閉環(huán)，解決了制約行業(yè)發(fā)展的共性底層難題。同時，智元堅持 ALL IN AI 的核心戰(zhàn)略，所有技術(shù)迭代均圍繞通用基礎(chǔ)能力升級，而非單一場景定制優(yōu)化，其技術(shù)成果可覆蓋全品類機(jī)器人、全行業(yè)物理作業(yè)場景，具備極強(qiáng)的產(chǎn)業(yè)賦能屬性，真正承擔(dān)起具身智能領(lǐng)域基礎(chǔ)底座搭建者、行業(yè)標(biāo)準(zhǔn)定義者的角色，也是智元能夠拿下世界模型賽道全球總冠軍、持續(xù)領(lǐng)跑物理 AI 的核心根源。

真正的通用機(jī)器人，離不開硬件本體與智能系統(tǒng)的深度協(xié)同，更需要全棧自研的 AI 能力體系作為堅實底座。具身智能的未來，不在于零散的單點創(chuàng)新，而在于可持續(xù)進(jìn)化、可協(xié)同放大的系統(tǒng)性能力。從建成全球首個 3000 平方米機(jī)器人實景數(shù)據(jù)采集場地，到推出一站式仿真開發(fā)平臺 Genie Sim；從通用具身基礎(chǔ)模型 Genie Operator 1，到實現(xiàn)對物理世界深度理解的世界模型 Genie Envisioner；再到面向全量開發(fā)者的具身智能一站式開發(fā)平臺 Genie Studio：智元持續(xù)構(gòu)建面向物理 AI 的完整能力底座，打通技術(shù)價值閉環(huán)，讓每一項 AI 能力都成為推動機(jī)器人邁向 “部署態(tài)” 的堅實支撐。

錨定 “部署態(tài)”

讓具身智能從炫技走向商用閉環(huán)

部署態(tài)是今年智元在 2026APC 合作伙伴大會上提出來的概念，智元依托全棧技術(shù)閉環(huán)，實現(xiàn)機(jī)器人在真實復(fù)雜場景中大規(guī)模穩(wěn)定作業(yè)、持續(xù)迭代，具備可落地、可復(fù)用特質(zhì)，真正標(biāo)志著具身智能從技術(shù)演示邁向規(guī)模化商用新階段。

成功實施 “部署態(tài)” 的核心在于底層算法的演進(jìn)，智元 ALL IN AI 的核心邏輯始終圍繞真實物理世界、真實作業(yè)需求、真實商用落地，全部服務(wù)于機(jī)器人規(guī)模化部署：真實場景數(shù)據(jù)集保證模型適配復(fù)雜真實環(huán)境；生成式仿真大幅降低試錯成本；基座模型保障作業(yè)精準(zhǔn)穩(wěn)定；世界模型提升復(fù)雜任務(wù)自主決策能力；零代碼平臺徹底解決落地難、復(fù)制難、迭代難的產(chǎn)業(yè)痛點，實現(xiàn)技術(shù)價值到產(chǎn)業(yè)價值的完整閉環(huán)。

一次裸考登頂，是實力的印證；持續(xù)全域領(lǐng)跑，是強(qiáng)者的常態(tài)。智元本次登頂 WorldArena 世界模型總分冠軍，是智元長期堅持 All in AI 戰(zhàn)略的成果。算法是未來具身智能產(chǎn)業(yè)的競爭核心，只有持續(xù)迭代世界模型、基座大模型等核心算法能力，深化虛實融合技術(shù)閉環(huán)，才能在具身智能這條長跑之路上，不斷引領(lǐng)向前。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.