2026年4月30日,由智元機(jī)器人主辦、在全球機(jī)器人領(lǐng)域頂級學(xué)術(shù)盛會ICRA 2026框架下舉辦的AGIBOT WORLD CHALLENGE@ICRA 2026正式完成線上初賽評選。在World Model(WM)賽道中,來自全球多個國家及地區(qū)的336支頂尖團(tuán)隊經(jīng)過兩個月角逐,最終決出10支優(yōu)勝戰(zhàn)隊。中科院自動化所模式識別實驗室與高德地圖CV Lab(視覺技術(shù)中心)的聯(lián)合團(tuán)隊NeoVerse-Abot登頂榜首,贏得本屆World Model賽道冠軍。
![]()
ICRA(國際機(jī)器人與自動化大會)自1984年創(chuàng)辦以來,始終引領(lǐng)機(jī)器人技術(shù)創(chuàng)新,每屆吸引超5000名全球頂尖學(xué)者、工程師及企業(yè)領(lǐng)袖參與。本屆大賽依托ICRA 2026與智元業(yè)界領(lǐng)先的全棧開發(fā)生態(tài)舉辦,是具身智能領(lǐng)域兼具學(xué)術(shù)公信力、產(chǎn)業(yè)標(biāo)桿意義與全球影響力的頂級賽事。
本次大賽的World Model賽道采用線上競賽形式,依托智元自研的EWMBench(Embodied World Model Benchmark)評測基準(zhǔn),參賽者基于AGIBOT WORLD開源數(shù)據(jù)集訓(xùn)練模型,在給定機(jī)器人動作序列與初始傳感器圖像的條件下,預(yù)測其在任務(wù)執(zhí)行過程中視覺視角的演變。相比主流視頻生成基準(zhǔn),EWMBench更關(guān)注物理世界的具身交互理解,在與人類主觀判斷一致性上表現(xiàn)更優(yōu)。評測聚焦Action-conditioned World Model細(xì)分賽道,從圖像質(zhì)量、場景一致性、軌跡遵循度三個維度提供穩(wěn)定可靠的性能反饋。賽制采用無人工全自動評測、實時榜單更新、指標(biāo)盲盒與每日提測限制,構(gòu)建嚴(yán)苛防hack的公平環(huán)境。區(qū)別于依賴仿真數(shù)據(jù)的基準(zhǔn),賽道依托AGIBOT WORLD百萬真機(jī)數(shù)據(jù)集構(gòu)建訓(xùn)練集,測試集中包含空抓、掉落等不完美軌跡,考察模型在分布外場景下對動作信號的跟隨能力及物理屬性模擬能力,更貼近世界模型的真實使用場景。
本屆World Model賽道競爭激烈程度空前。評測數(shù)據(jù)顯示,共有超過100支隊伍的成績超越基線模型,參賽隊伍成績分差極小,充分體現(xiàn)了全球研究團(tuán)隊在具身世界模型領(lǐng)域的整體技術(shù)水準(zhǔn)已躍升至新高度。最終,來自中科院自動化所模式識別實驗室與高德地圖CV Lab(視覺技術(shù)中心)的聯(lián)合團(tuán)隊NeoVerse-Abot登頂榜首,贏得本屆AGIBOT WORLD CHALLENGE World Model賽道的冠軍。NeoVerse-Abot團(tuán)隊成員長期聚焦世界模型、視覺感知、空間理解與場景建模,通過前沿學(xué)術(shù)研究與真實場景工程能力的結(jié)合,探索世界模型在機(jī)器人開放環(huán)境理解、任務(wù)泛化和智能決策中的應(yīng)用潛力。在視覺質(zhì)量以外,團(tuán)隊重點(diǎn)關(guān)注如何使生成模型絕對精準(zhǔn)地跟隨動作條件控制,克服概率模型天然的隨機(jī)性,同時保持在failure/novel action條件下的生成效果。參賽過程中,團(tuán)隊克服了將智能體的動作指令空間與視覺感知空間精準(zhǔn)對齊和視頻世界模型訓(xùn)練成本兩大核心挑戰(zhàn),在真實機(jī)器人任務(wù)導(dǎo)向的基準(zhǔn)上檢驗了自身的World Model方案,也幫助團(tuán)隊建立了更完整的實驗和工程體系。“我們認(rèn)為這次比賽非常有價值”,NeoVerse-Abot團(tuán)隊負(fù)責(zé)人表示,“首先,這次比賽的數(shù)據(jù)來自于主辦方之前發(fā)布的AgiBot World超大規(guī)模數(shù)據(jù)集,參賽隊伍能夠在足量的數(shù)據(jù)條件下去驗證和推進(jìn)當(dāng)前世界模型方法的真正性能邊界,拿到足夠可靠的結(jié)論,排除很多非本質(zhì)因素對科學(xué)結(jié)論的干擾。同時,比賽把 World Model 放在具身智能和機(jī)器人任務(wù)的真實環(huán)境下進(jìn)行評測,推動大家思考世界模型如何服務(wù)于機(jī)器人理解、預(yù)測和決策,是一項對領(lǐng)域發(fā)展很有推動意義的挑戰(zhàn)。”
WM賽道榜單還匯聚了來自中科院工業(yè)人工智能研究所、中科院計算技術(shù)研究所、中科大、重慶大學(xué)等頂尖科研機(jī)構(gòu)與高校的強(qiáng)勁團(tuán)隊。各支隊伍在生成質(zhì)量、動作跟隨、物理模擬與長程推理等核心維度上各具突破,共同推動了具身世界模型從視覺生成向智能決策的技術(shù)躍遷。亞軍物理智能團(tuán)隊(PAI@IAII)由中科院工業(yè)人工智能研究所徐凱研究員領(lǐng)銜,徐凱深耕計算機(jī)圖形學(xué)、三維視覺與工業(yè)具身智能、數(shù)字孿生領(lǐng)域,主持多項國家級重點(diǎn)基金,擔(dān)任圖形領(lǐng)域頂級國際期刊編委,連續(xù)多年入選全球前2%頂尖科學(xué)家榜單,是兼具深厚學(xué)術(shù)影響力與工程應(yīng)用實力的工業(yè)人工智能領(lǐng)域權(quán)威大咖。第五名VIPL-GENUN來自中科院計算技術(shù)研究所視覺信息處理與學(xué)習(xí)(VIPL)研究組,在計算機(jī)視覺、機(jī)器學(xué)習(xí)和人工智能領(lǐng)域享有盛譽(yù)。參賽團(tuán)隊主要圍繞視頻生成世界模型開展研究,關(guān)注如何利用生成式視頻模型對環(huán)境動態(tài)、物體交互、物理規(guī)律和智能體行為結(jié)果進(jìn)行建模。團(tuán)隊負(fù)責(zé)人表示,當(dāng)前世界模型從“能生成”到“能預(yù)測、能交互、能輔助決策”之間仍存在不少關(guān)鍵問題,此次比賽對他們的后續(xù)研究有著重要啟發(fā):“未來的視頻生成世界模型需要更強(qiáng)的記憶能力、更可靠的交互建模,以及更穩(wěn)定的長時一致性。這是我們通過此次比賽確認(rèn)的后續(xù)(研究)方向。”
本次AGIBOT WORLD CHALLENGE@ICRA 2026 World Model賽道的優(yōu)勝方案將為行業(yè)提供寶貴的技術(shù)參考,加速具身世界模型從開發(fā)研究到部署落地的進(jìn)程。智元將繼續(xù)攜手全球開發(fā)者,共筑具身智能新高度,見證具身智能從“開發(fā)態(tài)”向“部署態(tài)”躍遷的宏大時代浪潮。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.