<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      一場機器人黑客松,讓具身智能的差距與機會同時顯形

      0
      分享至


      作者 | 姚戈

      上周一,我在深圳參加了一場機器人黑客松。

      前一晚九點抵達時,我原本以為自己會是少數還在工作的那一批人。走進場地才發(fā)現,燈還亮著,地上已經支起一排排帳篷。機械臂沒有停,選手們圍在工位前采數據、訓模型、盯評測結果。有人困得不行,就在場邊睡一會兒,醒來繼續(xù)干。


      現場流傳著一句話:“我可以歇著,卡不能歇。”

      這是迄今為止全球最大規(guī)模的線下具身智能開發(fā)者大賽之一。

      自變量為所有參賽隊伍免費開放高質量數據集和相關數采設備,并提供訓練環(huán)境和高性能雙臂操作平臺以及算力資源。

      參賽隊伍可以在 3 天內,完成從數據采集、模型訓練到真機部署的整個閉環(huán)。而通常情況下,專業(yè)研究實驗室完成類似搭建至少需要 6 個月。

      主辦方從大量候選任務中篩出了四類核心能力:抓取放置、語言理解、精細操作和長時序決策。對應到比賽里,選手可以選擇套環(huán)、按指令分類水果、插電源線、拼寫單詞等任務持續(xù)攻關。最終成績不只看有沒有完成步驟,也看成功率、穩(wěn)定性和泛化表現。

      這個被極致壓縮到 3 天的比賽,讓具身智能行業(yè)的差距與機會同時顯形。

      3 天,兩個大學生,就能做出一個學術論文里的視頻 demo

      3 天是什么概念?

      按學術研究的節(jié)奏,一篇論文從實驗到發(fā)表,往往要以年為單位計算。

      但如果只看某個具體任務的完成效果——許多由 00 后大學生組成的團隊,借助自變量提供的算力、數據和基礎模型,只用兩天時間,就能讓機器人完成 pick-and-place 這類常見于論文和演示視頻中的任務,做出一個“看起來很像那么回事”的 demo。

      這正是這場黑客松最值得注意的地方:3 天既是一個令人興奮的數字,也是一個容易制造錯覺的數字。

      先看它令人興奮的一面。

      自變量此次黑客松的賽制分為 A 榜和 B 榜兩個階段。A 榜任務公開,選手可以圍繞明確目標進行訓練和優(yōu)化;B 榜則不會提前公布具體任務和數據分布,更側重考察模型在真實環(huán)境中的泛化能力。

      比賽前兩天,選手們主要攻堅 A 榜任務,包括套環(huán)、按指令分類水果、插電源線、拼寫單詞等。這些任務的操作要求和 KPI 都非常明確。以“按指令分類水果”為例,水果種類固定,抓取點和放置點也基本固定,模型可以圍繞一組相對穩(wěn)定的條件反復訓練,因此短時間內就能迅速提分。


      自變量算法合伙人甘如飴提到,比賽第一天,大家的成績普遍不高,套環(huán)任務的成功率大多只有 20% 到 70%;但到了第二天,很多團隊已經迅速摸清了自己擅長的方向,開始集中優(yōu)化,一些團隊甚至在單一任務上出現明顯過擬合,成功率逼近 100%。

      這意味著什么?

      它意味著,在今天的具身智能行業(yè)里,把一個模型快速調到“能完成某個具體任務”,已經不再像很多人想象中那么遙遠。對解決方案提供商和落地工廠來說,這當然是一個足以提振信心的信號。過去,工業(yè)機器人切換一個任務,往往意味著漫長的預編程、仿真、工程調試和現場磨合;而現在,如果某些任務的適配周期真的可以被壓縮到幾天,即便這還遠遠不能說明“通用”,也足以改變很多人對機器人進入工廠、承擔具體工作的預期。

      但問題也恰恰出在這里。

      一個任務能在幾天內被迅速做出來,并不意味著模型的泛化性得到提高。

      也正是在 A 榜成績快速拉高、一些團隊開始接近滿分的時候,自變量放出了隱藏的 B 榜。

      當任務不再已知,原本圍繞單一目標優(yōu)化出來的模型,很快暴露出局限。

      此次比賽獲得三等獎、來自南京郵電大學的參賽者袁浩寬對 InfoQ 表示,他們選擇的是“按指令分類水果”任務。到了 B 榜階段,比賽不僅新增了水果種類,還加入了干擾項,并改變了抓取與放置的空間結構?!爸搬槍?A 榜做的微調基本用不上了,只能回到 base model,重新采集更有多樣性的真機數據?!?/strong>

      他們在現場補采了約 30 條隨機擺放的數據,微調了約 1 小時、總計約 1 萬步,但效果依然不理想,主要問題在于數據量和多樣性都不夠。

      這也不是個別隊伍的偶發(fā)問題,而是許多隊伍在 B 榜階段的共同反饋。針對單一任務做出高分并不算太難,但一旦任務開始引入泛化要求,比如增加水果種類、改變擺放方式,模型就很難穩(wěn)定跟上。

      在這場黑客松里我看到兩件事。

      一方面,任務適配的速度確實在變快,機器人進入真實場景的門檻正在被拉低;另一方面,哪些團隊是在認真做 base model,哪些團隊只是借助現成基座和任務微調做出表面成績,也會以更快的方式被區(qū)分出來。

      一個開源基座模型,加上一些現場采集的數據,再配幾張算力卡,圍繞特定任務做短周期微調,就有機會復現論文或宣傳視頻里的效果。

      這樣的結果當然不是毫無價值,它說明現有基座模型和工具鏈已經足以支撐某些任務的快速實現;但它也不應被誤讀為“模型已經具備通用能力”。因為這類 demo 的前提,往往是明確任務、固定環(huán)境和有限變量,而不是開放世界中的持續(xù)適應。

      真正把具身公司拉開差距的,是誰擁有更強的 base model,誰能在任務變化、環(huán)境變化和連續(xù)執(zhí)行中保持穩(wěn)定。

      也就是說,認真做基座模型的團隊,與套殼做過擬合的團隊,未來的差距只會越來越大。

      如果說這場黑客松帶來了什么最直接的教訓,那就是:今天衡量一個模型,已經不能再滿足于它有沒有一段漂亮的真機 demo,而要看它能否在真機環(huán)境中承受多任務、陌生任務和連續(xù)任務的壓力。

      也正因為如此,國內越來越多廠商開始推出自己的真機評測體系和挑戰(zhàn)賽。原力靈機有 RoboChallenge,智元有 AgiBot World Challenge,自變量則推出了 ManipArena。它們背后的共識其實很簡單:如果不把模型從 demo 里拖出來,放到真機、多任務、帶約束的環(huán)境里反復測,行業(yè)就很容易被演示效果牽著走。

      當然,今天的許多榜單仍然很難做到絕對透明。為了降低參評方對泄密的擔憂,不少測評體系不會強制公開模型歸屬,也會通過接口隔離的方式,讓模型參數和代碼本身不被直接暴露。

      這種安排有現實合理性,但它也意味著,行業(yè)仍然需要一套更成熟的標準,去區(qū)分“針對任務打榜的能力”與“真正可泛化的能力”。

      從這個意義上說,黑客松上那些兩天就能做出來的過擬合結果,并不只是一個比賽現象,它更像一次提醒:行業(yè)應該對模型表現變得更警覺,也應該倒逼模型團隊拿出更經得住真機和多任務壓力的結果。

      自變量的選擇:不為垂直場景的快速落地,堆積針對性模型系統(tǒng)和工程補丁

      賽場上的教訓,也在某種程度上印證了自變量自己的思路。

      對很多參賽隊伍來說,比賽很快暴露出一個問題:后訓練和參數微調可以補足一部分能力,但到了某個階段,決定模型上限的仍然是基礎模型本身。

      基于這一判斷,自變量在場景選擇上沒有選擇更容易通過工程手段優(yōu)化效果的場景,而是將家庭等更復雜的環(huán)境放在相對靠前的位置,希望在真實交互中積累數據,并據此持續(xù)迭代基礎模型。

      自變量 CTO 王昊在與包括 InfoQ 在內的媒體交流時表示,公司的核心方向是“保持基模不停往前迭代”。在他看來,團隊當然可以去場景里做探索,驗證基模能力,看看它是否能在某些場景里實現規(guī)?;瘧?;但有一點必須克制,即不要為了讓機器人在垂直場景里更快落地,而堆太多針對性的模型系統(tǒng)和工程補丁。比如發(fā)現視覺上有盲區(qū),就再加一個視覺小模型去做檢測和彌補,這類方法“短期來看可以幫助你加快落地,但是長期來看,對基模的提升是有害的”。

      這句話不止技術判斷,也是商業(yè)判斷。

      從外部合作輪廓看,自變量并非沒有工業(yè)客戶,但它投入更多精力的場景,明顯偏向家庭、養(yǎng)老院、酒店等服務環(huán)境。

      王昊并不回避這一點。他對我們表示,從產品戰(zhàn)略和商業(yè)策略來說,自變量希望機器人能夠盡早大規(guī)模部署,更早進入商業(yè)場景,而家庭、養(yǎng)老院、酒店這樣的服務場景之所以重要,是因為“這種場景才能給我們提供數據的來源”。

      與此同時,自變量認為家庭是最復雜、最開放的環(huán)境之一,朝著這樣的復雜場景推進能力,再回頭覆蓋更垂直的場景,本質上是一個先做通用、再做“降維”的過程:當基模足夠強時,垂類場景對模型提出的額外要求反而會下降。

      而通用能力,最終還是要落回基礎模型能力。

      這也是為什么,具身廠商開始把目標指向“具身原生”的模型。

      從工程實踐看,當前具身大腦的主流方案已經形成某種共識:視覺、語言,最多再加觸覺等模態(tài)輸入,經由大語言模型處理,輸出動作;世界模型更多用于生成仿真數據或構建環(huán)境。

      但問題在于,這種架構,是否真的適合物理世界?

      在王昊看來,過去訓練路徑里有一個典型誤區(qū):不同模態(tài)的數據各自訓練,最后再把它們對齊起來;或者先把語言做到足夠泛化,再讓視覺去對齊語言。這種方式在很多時候會犧牲視覺能力,因為它默認了視覺只是為語言服務的。但具身場景并不是這樣。語言更擅長表達宏觀意圖,卻很難精確描述一個動作在厘米級空間、秒級時間里的連續(xù)變化;而視頻模型雖然關注像素級細節(jié),卻未必天然理解哪些接觸、運動和碰撞在物理上更關鍵。

      自變量給出的新方向,是在端到端框架下,把世界模型和 VLA 融合得更深,通過聯合建模,讓視覺與動作在更早階段對齊,從而讓預測更符合物理規(guī)律。

      這并不意味著放棄大語言模型。

      王昊對 InfoQ 表示,大語言模型仍然是訓練的基礎,但關鍵變化在于表達空間的重構:“大語言模型這個訓練基礎還是要用,只是我們要把語言、動作拉到一個空間當中,而不是像以前,所有視覺都是服務語言?!?/strong>

      在他看來,語言、視覺與動作之間的差異,首先體現在信息尺度上。語言更偏向宏觀表達——“語言描述的信息很宏觀”,很難精確刻畫一個物體在厘米級空間、秒級時間里的連續(xù)變化;而視頻模型則恰恰相反,聚焦像素層面的細節(jié)——“每個像素的顏色、明暗都能預測得很準”。這兩種尺度的信息,要在同一個模型中自然融合,本身就具有難度。

      在這一框架下,動作不再只是輸出結果,而成為關鍵模態(tài)之一。

      按照王昊的說法,動作的價值在于它同時具備宏觀和微觀兩層表達能力:“動作是非常好的模態(tài),它在宏觀上可以表達這段行為意味著什么、會導致什么結果,在微觀上又可以幫助視覺更好地觀察運動中的關鍵變化?!?/strong>這也意味著,模型不再只是“看見靜態(tài)世界”,而是要理解運動本身,將視覺從靜態(tài)感知推進到對動態(tài)過程的建模。

      “把這幾個模態(tài)放在一起,”王昊總結說,“就可以構建一個真正屬于物理世界的模型?!?/p>

      圍繞這一目標,動作在模型中的編碼方式也隨之發(fā)生變化。它不再被視為單一模態(tài)的輸出,而是可以與語言、視覺進行聯合編碼或條件編碼,并在更細粒度的時間尺度上表達。

      模型結構的選擇,也直接影響數據路線。

      今天幾乎所有具身公司都在講自己的“數據金字塔”,但不同公司對金字塔底部到底該放什么,理解并不相同。

      以星海圖和自變量為例,兩家公司都強調 Egocentric data 的重要性,但對這個概念的理解其實并不一樣。星海圖的 Egocentric 核心數據基座,更多是指人類第一視角視頻。自變量的 Egocentric 數據則包括人的可穿戴設備。王昊表示:“從自由度視角來看,Egocentric 的數據完全和人的自由度一致,所有的手持式、穿戴各種設備是介于人的自由度和機器的自由度之間的形態(tài)?!?/strong>

      看起來這只是數據分類方法的不同,實際上對應的卻是對“通用能力從哪里來”的不同判斷。有人認為,先讓模型擁有大量人類視角經驗最重要;有人認為,要盡快獲得更貼近機器人控制結構的數據;也有人更看重真機接管、遙操作和真實任務反饋??瓷先ニ腥硕荚谡剶祿嬲姆制?,往往恰恰藏在對數據最底層定義的不同里。

      三天時間,足夠做出一個像模像樣的結果。這意味著,demo 不再稀缺,甚至不再可信。

      真實世界需要的是基模能力的持續(xù)提升,需要真正“hands dirty”的過程——去理解模型、理解硬件、理解數據,也理解那些不會出現在視頻里的失敗與邊界。

      在這樣的標準下,很多差距才剛剛開始顯現。

      聲明:本文為 AI 前線整理,不代表平臺觀點,未經許可禁止轉載。

      會議推薦

      QCon 全球軟件開發(fā)大會·2026 北京站將于 4 月 16 日 -18 日正式舉辦。本屆大會以“Agentic AI 時代的軟件工程重塑”為主題,聚焦 100+ 重磅議題,匯聚來自阿里、騰訊、字節(jié)跳動、小米、百度等一線科技企業(yè)與創(chuàng)新團隊的技術專家,圍繞 AI 工程化、系統(tǒng)架構與研發(fā)模式演進展開深入探討。更多詳情可掃碼或聯系票務經理 18514549229 進行咨詢。

      今日薦文


      你也「在看」嗎?

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      事態(tài)嚴重了!《監(jiān)獄來的媽媽》除了主演封殺,導演秦曉宇惹怒國人

      事態(tài)嚴重了!《監(jiān)獄來的媽媽》除了主演封殺,導演秦曉宇惹怒國人

      小椰的奶奶
      2026-05-20 07:49:43
      馬斯克輸了

      馬斯克輸了

      牛彈琴
      2026-05-19 07:47:04
      心態(tài)崩了!賽力斯跌破80元,28萬散戶深套,有人已虧超36萬

      心態(tài)崩了!賽力斯跌破80元,28萬散戶深套,有人已虧超36萬

      財經智多星
      2026-05-19 12:37:19
      祖墳冒青煙啦,失業(yè)小伙偶然買彩票中了一千萬,從此走向幸福生活

      祖墳冒青煙啦,失業(yè)小伙偶然買彩票中了一千萬,從此走向幸福生活

      地球第一個元嬰大能
      2026-05-20 11:05:34
      普京專機剛落地,俄軍6.4萬人就在家門口掀了桌子!

      普京專機剛落地,俄軍6.4萬人就在家門口掀了桌子!

      做個平凡的軒友
      2026-05-20 09:49:03
      你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

      你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

      夜深愛雜談
      2026-02-21 21:37:02
      不能二次加熱的6種食物!醫(yī)生提醒:吃不完或倒掉,別亂節(jié)儉

      不能二次加熱的6種食物!醫(yī)生提醒:吃不完或倒掉,別亂節(jié)儉

      冷眼看世界728
      2026-05-12 20:46:26
      新亞洲一哥!西決首秀創(chuàng)4大記錄!20歲攻防一體,未來或超越哈登

      新亞洲一哥!西決首秀創(chuàng)4大記錄!20歲攻防一體,未來或超越哈登

      兵哥籃球故事
      2026-05-19 14:55:19
      64歲吳鎮(zhèn)宇真下得去口,嘴對嘴吻郝蕾,一旁劉濤被驚呆

      64歲吳鎮(zhèn)宇真下得去口,嘴對嘴吻郝蕾,一旁劉濤被驚呆

      尋墨閣
      2026-05-19 01:16:51
      55年毛主席查看授銜名單,面露不悅:井岡山籍的將軍怎么只有1個

      55年毛主席查看授銜名單,面露不悅:井岡山籍的將軍怎么只有1個

      墨香秋韻
      2026-05-20 10:04:50
      今日最慘股提前出爐,25萬股東被套,超大跌停封單,新利空又襲來

      今日最慘股提前出爐,25萬股東被套,超大跌停封單,新利空又襲來

      丁丁鯉史紀
      2026-05-20 10:46:27
      OpenAI、Anthropic都開始押注FDE,FDE才是Agent時代的PMF范式?

      OpenAI、Anthropic都開始押注FDE,FDE才是Agent時代的PMF范式?

      FounderPark
      2026-05-18 20:31:50
      霸總楊子家族被查,靠繩子編故事套現28億?

      霸總楊子家族被查,靠繩子編故事套現28億?

      大貓財經Pro
      2026-05-19 13:13:40
      我爸是公司的副總,有個刺頭下屬經常和他拍桌子,公開辱罵我爸。后來才知道,那人竟是我爸的親信。

      我爸是公司的副總,有個刺頭下屬經常和他拍桌子,公開辱罵我爸。后來才知道,那人竟是我爸的親信。

      不二大叔
      2026-05-19 21:49:42
      打遍中東無敵手,伊朗退場,土耳其補位?以色列迎來真正的勁敵?

      打遍中東無敵手,伊朗退場,土耳其補位?以色列迎來真正的勁敵?

      別吵吵
      2026-05-20 08:23:10
      原來好老公都是“搶”來的!網友:聰明女人最好命!

      原來好老公都是“搶”來的!網友:聰明女人最好命!

      夜深愛雜談
      2026-05-19 21:20:31
      5月18日,國乒消息:向鵬深夜的發(fā)文,把國乒“后臺”全炸出來了

      5月18日,國乒消息:向鵬深夜的發(fā)文,把國乒“后臺”全炸出來了

      云舟史策
      2026-05-19 14:33:37
      領先22分還能輸?米切爾29分5板6斷,哈登15分6失誤,騎士遭逆轉

      領先22分還能輸?米切爾29分5板6斷,哈登15分6失誤,騎士遭逆轉

      無術不學
      2026-05-20 11:49:44
      他們?yōu)槭裁匆囊徊侩娪皝砻阑粋€殺人犯?

      他們?yōu)槭裁匆囊徊侩娪皝砻阑粋€殺人犯?

      星空區(qū)塊鏈
      2026-05-19 13:18:59
      《監(jiān)獄來的媽媽》得獎,對共產主義的背叛!

      《監(jiān)獄來的媽媽》得獎,對共產主義的背叛!

      紅色少女主播
      2026-05-18 22:32:03
      2026-05-20 12:28:49
      AI前線 incentive-icons
      AI前線
      面向AI愛好者、開發(fā)者和科學家,提供AI領域技術資訊。
      1509文章數 149關注度
      往期回顧 全部

      科技要聞

      一文看懂谷歌I/O2026:谷歌打響智能體大戰(zhàn)

      頭條要聞

      洪水最高沒過2樓樓頂 女子紅了眼眶:家里東西全沒了

      頭條要聞

      洪水最高沒過2樓樓頂 女子紅了眼眶:家里東西全沒了

      體育要聞

      文班亞馬:沒拿到MVP,就證明自己是MVP

      娛樂要聞

      舒淇大方承認:卸了妝就是50 歲的模樣

      財經要聞

      白酒榜|汾酒營收凈利雙增 口子窖"造富"

      汽車要聞

      煥新極氪009上市41.38萬起 齊家版讓MPV回歸家庭

      態(tài)度原創(chuàng)

      手機
      本地
      家居
      時尚
      公開課

      手機要聞

      蘋果預告iOS 27輔助功能,語音控制支持自然語言操作

      本地新聞

      別搜晉江小說了,去看真的晉江

      家居要聞

      日常印記 靜謐溫馨

      為了攻克漸凍癥,她把自己活成了“破冰”的人

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版
      主站蜘蛛池模板: 亚洲欧洲精品日韩av| 真正免费**毛片在线播放| 日韩人妻无码精品久久久不卡| 国产超碰AV人人做人人爽| 国产美女牲交视频| 撕开奶罩揉吮奶头高潮av| 亚洲精品一区二区三| 麻豆精品视频在线观看| 黄片福利社| 翘臀少妇被扒开屁股日出水爆乳| av三区在线| 真实单亲乱l仑对白视频| 大帝AV在线一区二区三区| 中文字幕精品无码一区二区三区| 久久熟女| 天堂网狠狠影音先锋| 国产免费一级在线观看| 天天干-天天日| 国产亚洲av手机在线观看| 久久视频在线视频| 无码午夜福利| 在线观看美女网站大全免费| 免费国产高清在线精品一区| 老司机精品成人无码AV| 国产 高速 亚洲 欧美 在线| 99自拍视频| 激情综合色区网激情五月| 国产成人午夜福利在线播放| 亚洲国产精品久久无套| 亚洲人成网站观看在线播放| 国产97视频人人做人人爱| 国产97在线?|?日韩| 日韩人妻精品中文字幕免费| 欧美激情肉欲高潮视频| 久久久久人妻一区精品色| 成人无码午夜在线观看| 日本理伦片午夜理伦片| 国产亚洲第一午夜福利合集 | 大香蕉综合网| 国产在线91在线电影| 午夜在线观看成人av|