網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

重磅！千尋智能開(kāi)源模型Spiritv1.5登頂RoboChallenge

2026-01-12 13:09:06　來(lái)源: 投資家

湖南舉報(bào)

分享至

投資家網(wǎng)獲悉，1月12日，千尋智能自研的具身智能模型Spirit v1.5在RoboChallenge評(píng)測(cè)中取得綜合排名第一，在任務(wù)得分與成功率兩個(gè)維度均超越Pi0.5。

為驗(yàn)證榜單成績(jī)來(lái)源于自研模型且真實(shí)有效，千尋智能同步開(kāi)源了Spirit v1.5的基模權(quán)重、推理代碼以及使用樣例，接受公眾與研究社區(qū)的獨(dú)立檢驗(yàn)。通過(guò)這一方式，研究者不僅可以復(fù)現(xiàn)榜單評(píng)測(cè)結(jié)果，也可以將Spirit v1.5作為具身智能基礎(chǔ)模型，在此基礎(chǔ)上開(kāi)展進(jìn)一步研究與創(chuàng)新。

RoboChallenge是2025年新成立的標(biāo)準(zhǔn)化評(píng)測(cè)體系，由Dexmal、Hugging Face等機(jī)構(gòu)聯(lián)合發(fā)起，聚焦具身智能模型的跨平臺(tái)能力驗(yàn)證。作為當(dāng)前具身智能領(lǐng)域強(qiáng)調(diào)真實(shí)機(jī)器人執(zhí)行能力的重要benchmark，其評(píng)測(cè)任務(wù)覆蓋復(fù)雜指令理解、多步驟操作規(guī)劃以及跨場(chǎng)景執(zhí)行穩(wěn)定性等多個(gè)維度。Spirit v1.5在該平臺(tái)取得第一名，顯示出其在通用機(jī)器人任務(wù)與真實(shí)執(zhí)行場(chǎng)景中的綜合能力。

RoboChallenge評(píng)測(cè)表現(xiàn)概覽

從評(píng)測(cè)結(jié)果來(lái)看，Spirit v1.5在多項(xiàng)任務(wù)中保持較高成功率，尤其在多任務(wù)連續(xù)執(zhí)行、復(fù)雜指令拆解以及跨構(gòu)型遷移等維度中表現(xiàn)穩(wěn)定。截至最新評(píng)測(cè)周期，其綜合得分超過(guò)Pi 0.5等此前領(lǐng)先模型，位列榜單首位。

RoboChallenge的評(píng)分體系不僅關(guān)注任務(wù)是否完成，還對(duì)模型的執(zhí)行過(guò)程進(jìn)行評(píng)估，包括空間定位、遮擋處理、長(zhǎng)時(shí)序穩(wěn)定性以及面對(duì)新任務(wù)時(shí)的遷移效率。這種評(píng)測(cè)方式對(duì)模型的泛化性、穩(wěn)定性與執(zhí)行準(zhǔn)確性提出了更高要求，也更貼近真實(shí)機(jī)器人應(yīng)用場(chǎng)景。

技術(shù)架構(gòu)與關(guān)鍵方法

在模型架構(gòu)上，Spirit v1.5采用Vision-Language-Action（VLA）統(tǒng)一建模框架，將視覺(jué)感知、語(yǔ)言理解與動(dòng)作生成整合在同一決策流程中，減少多模塊串聯(lián)帶來(lái)的信息損耗，并提升長(zhǎng)程任務(wù)中的整體穩(wěn)定性。

在訓(xùn)練方法上，Spirit v1.5的一個(gè)核心特點(diǎn)是不依賴高度精選的“干凈”演示數(shù)據(jù)。千尋智能在技術(shù)博客中提出，過(guò)度腳本化、受控環(huán)境下采集的數(shù)據(jù)，雖然有利于模型快速收斂，但會(huì)限制其在真實(shí)世界中的泛化能力。

因此，Spirit v1.5在預(yù)訓(xùn)練階段引入了開(kāi)放式、多樣化的數(shù)據(jù)采集范式。數(shù)據(jù)采集不再嚴(yán)格限定任務(wù)腳本，而是以“完成有意義目標(biāo)”為導(dǎo)向，允許操作過(guò)程中自然串聯(lián)多個(gè)子任務(wù)與原子技能。這種方式使模型在訓(xùn)練階段接觸到更接近真實(shí)世界的復(fù)雜性，包括遮擋、失敗恢復(fù)以及任務(wù)之間的自然過(guò)渡。

相關(guān)消融實(shí)驗(yàn)顯示，在相同數(shù)據(jù)規(guī)模下，基于多樣化數(shù)據(jù)預(yù)訓(xùn)練的模型，在新任務(wù)上的遷移效率明顯高于基于傳統(tǒng)演示數(shù)據(jù)訓(xùn)練的模型，達(dá)到相同性能所需的計(jì)算資源顯著減少。這一結(jié)果也解釋了Spirit v1.5在RoboChallenge多構(gòu)型、未見(jiàn)任務(wù)評(píng)測(cè)中的穩(wěn)定表現(xiàn)。

開(kāi)源路線與社區(qū)意義

在取得評(píng)測(cè)成績(jī)的同時(shí)，千尋智能選擇同步開(kāi)源Spirit v1.5模型權(quán)重、訓(xùn)練代碼以及榜單評(píng)測(cè)相關(guān)實(shí)現(xiàn)。通過(guò)這一方式，社區(qū)不僅可以驗(yàn)證模型性能，也可以將其作為具身智能研究的基礎(chǔ)模型進(jìn)行擴(kuò)展。

在當(dāng)前具身智能研究仍高度依賴少數(shù)技術(shù)路線的背景下，Spirit v1.5為學(xué)界和產(chǎn)業(yè)界提供了一條不同的數(shù)據(jù)范式與訓(xùn)練思路，有助于推動(dòng)更具泛化能力的通用機(jī)器人模型探索。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.