<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      從「座上賓」到「主戰場」:具身智能如何完成對計算機視覺的「范式奪權」?| CVPR 2026

      0
      分享至


      當機器從識別圖像走向介入現實,視覺研究的邊界也被重新劃定。

      作者丨鄭佳美

      編輯丨馬曉寧

      如果您漫步在 CVPR 2026 的會場,會產生一種強烈的錯覺:自己是不是跑錯了場館,誤入了 ICRA 或者 IROS 的現場?滿屏的機械臂抓取、足式機器人的越野導航、以及在虛擬沙盒中進行千億次迭代的物理模擬。

      具身智能(Embodied AI)已經不再是視覺領域的一個“邊緣分支”,而是以一種占據主舞臺的姿態,成為視覺頂會最難被忽視的敘事之一。

      這種范式的易位,讓人們不禁回想起 2017 年機器人學界的頂級盛會 IROS。當時,機器人專家們打破了固守多年的運動學控制圈層,邀請計算機視覺泰斗、ImageNet 奠基人李飛飛做主題演講。

      在那個時刻,視覺對于機器人而言,更像是一個“尊貴的外部插件”:機器人學是主,計算機視覺是客。機器人真正的知識核心,仍然是運動學、動力學、控制、規劃、執行器和系統工程;視覺負責把外部世界翻譯成機器人能夠使用的狀態信息,卻并不真正決定機器人學的問題邊界。

      九年之后,機器人和計算機視覺的融合已進入新的里程碑。在計算機視覺領域,我們甚至可以看到具身智能“反客為主”的表現。

      這種“反客為主”,并不是說機器人論文在視覺頂會中數量變多了,也不是說 CVPR 正在變成另一個 ICRA 或 IROS。真正重要的是,具身智能正在改變計算機視覺判斷自身價值的方式。

      過去,視覺研究的中心問題是:機器如何從圖像中提取語義,從視頻中理解事件,從多視角中還原三維結構。今天,具身智能把問題推進到了另一層:視覺系統不僅要看懂世界,還要支持一個智能體進入世界、改變世界,并在行動反饋中重新校正自己對世界的理解。

      這才是所謂“范式奪權”的本質。一個方向真正完成“奪權”,從來不是靠論文數量取勝,而是靠重新定義整個領域的問題入口、評價標準和技術路線。

      如果說過去的計算機視覺是在屏幕中理解世界,那么具身智能正在迫使它走出屏幕,在真實空間、真實物體和真實動作中重新證明自己。

      01


      Ted Xiao「三大時代」里的具身智能拐點

      要理解具身智能為什么會在 CVPR 2026 中形成如此強的存在感,不能只從這一屆會議本身看起。更準確的切口,是 Ted Xiao 對機器人學習過去十年發展的三階段復盤:存在性證明時代、基礎模型時代和 Scaling 時代。

      這個框架之所以重要,是因為它解釋了一個關鍵問題:具身智能并不是突然進入計算機視覺中心的,而是在機器人學習自身演進到某個階段之后,必然開始向視覺研究索取更深層的能力。

      換句話說,CVPR 2026 所呈現出的變化,不是一個會議熱點的偶然輪換,而是機器人學習從控制問題、數據問題,進一步演變成世界理解問題后的自然結果。

      第一個階段是存在性證明時代。這個階段的核心問題是:端到端的數據驅動方法到底能不能在真實機器人上工作?強化學習能不能控制機械臂?模仿學習能不能完成抓取?真實硬件采集的數據能不能訓練出穩定策略?

      這一時期的機器人學習還帶有很強的“實驗室證明”色彩。研究者需要先證明,深度學習不只是能在 Atari、圍棋和圖像分類中奏效,也能面對真實世界中連續、高維、噪聲極強的物理系統。

      在這個階段,視覺當然重要,但它更多是機器人系統中的輸入模塊。機器人需要視覺來感知物體位置、場景狀態和外部環境,但機器人學習的主要壓力仍然來自控制穩定性、硬件誤差、樣本效率、數據采集成本和真實環境不確定性。視覺是必要條件,卻還不是范式重組的中心。

      第二個階段是基礎模型時代。隨著大語言模型、視覺語言模型和多模態大模型的發展,機器人學習開始發生第一次重要轉向。機器人不再只是學習某個單一技能,而是開始吸收互聯網規模數據中形成的語義理解能力。

      它不僅要知道機械臂如何移動,還要理解“把紅色杯子放到盤子旁邊”這樣的自然語言指令;不僅要識別物體,還要理解開放詞匯、空間關系、任務意圖和人類常識。

      SayCan、RT-1、RT-2 這類路線的意義正在于此。它們并不只是讓機器人“聽懂更多話”,而是讓視覺、語言和動作第一次被壓進同一個建模框架中:語言給出目標,視覺理解狀態,模型生成動作,動作改變世界,世界反饋又回到視覺輸入之中。

      到了這個階段,計算機視覺和機器人學習的關系已經開始變化。機器人對視覺的需求,不再只是“幫我看見物體在哪里”,而是“幫我理解一個開放世界,并把這種理解轉化為行動”。這已經不是傳統意義上的視覺模塊調用,而是對視覺研究提出了更高層的要求。

      第三個階段是 Scaling 時代。也正是在這個階段,CVPR 的位置變得不可替代。因為一旦機器人學習進入規?;枰幕A設施幾乎全部與計算機視覺深度綁定:

      它需要從海量視頻中學習人類動作和物體交互,需要用 3D 場景理解支撐空間推理,需要用世界模型預測動作后果,需要通過仿真和合成數據彌補真實機器人數據的稀缺,需要把語言目標映射到視覺狀態和動作序列,也需要在長程任務中維持對場景、記憶和目標的持續理解。

      這就是為什么具身智能會在 CVPR 2026 中顯得像一次集中爆發。機器人學習早期更像是在解決“能不能讓機器人動起來”;基礎模型時代開始解決“能不能讓機器人理解指令和場景”;而到了 Scaling 時代,真正的問題變成了“能不能讓機器人在開放世界中規?;貙W習、泛化和行動”。

      這個問題已經不再是機器人學單獨能夠完成的,它必須借助計算機視覺在視覺表征、視頻理解、三維重建、多模態對齊、生成建模和世界建模上的長期積累。因此,Ted Xiao 的三大時代復盤實際上揭示了這場“范式奪權”的歷史條件:只有當機器人學習進入 Scaling 階段,視覺才會從機器人系統中的外部插件,變成物理智能的底層基礎設施。

      02


      三重「奪權」:

      問題、標準與路線的重寫

      有了 Ted Xiao 的時間線,再回到 CVPR 2026,很多現象就不再顯得孤立。

      VLA、機器人操作、移動導航、人形機器人、世界模型、Sim2Real、物理仿真、3D 空間智能和自動駕駛等主題集中出現,并不是多個熱點并排爆發,而是同一條范式遷移鏈路在視覺頂會中的集中顯影。

      過去,CVPR 的很多核心任務可以被理解為從視覺輸入到視覺表征的映射:圖像到類別,圖像到框,圖像到 mask,圖像到 depth,圖像到 3D,視頻到事件,文本到圖像。

      具身智能則要求建立一條更長的鏈路:視覺輸入進入語言理解,語言目標進入任務規劃,任務規劃進入動作生成,動作結果回到視覺反饋,反饋再更新模型對世界的判斷。

      這條鏈路一旦成為主流,計算機視覺的研究對象就會發生變化。圖像不再只是被理解的對象,而是行動決策的起點;視頻不再只是時間序列,而是動作、變化和因果后果的載體;三維重建不再只是幾何恢復,而是智能體導航、操作和交互的空間底座;生成模型不再只是為了生成逼真的內容,而是要生成可用于訓練、預測和評估行動策略的世界。

      這就是 CVPR 2026 的標志性意義。它不是具身智能第一次出現在視覺頂會中,卻可能是具身智能第一次如此清晰地改變視覺頂會的敘事重心。過去,機器人是視覺技術的應用場景;現在,機器人問題開始成為視覺研究重新定義自身的一面鏡子。

      而所謂具身智能的“范式奪權”,正是從這里開始的:它首先改變了計算機視覺的問題定義。

      傳統計算機視覺最常問的是:這是什么?它在哪里?這個場景如何重建?這段視頻發生了什么?這些問題共同指向一個目標:讓機器更好地表征世界。

      具身智能把問題改寫了。一個機器人看見桌上的杯子,任務并不會停在“識別這是杯子”。它還要判斷杯子的重心、材質、杯柄朝向、可抓取區域、周圍障礙物、機械臂運動路徑,以及拿起之后世界狀態會如何改變。也就是說,具身智能真正問的是:我能對它做什么?

      這一步改變了視覺研究的底層對象。物體不再只是類別標簽,而是可抓取、可推動、可打開、可阻擋、可支撐的實體;空間不再只是幾何結構,而是可導航、可探索、可交互的任務場;視頻不再只是時間序列,而是動作、變化和因果后果的線索。

      問題一旦被改寫,評價標準也會隨之變化。傳統視覺的成功大多建立在離線數據集上:分類看準確率,檢測看 mAP,分割看 IoU,重建看誤差,生成看保真度和語義一致性。具身智能帶來的標準更苛刻:模型“看對了”并不等于任務成功。

      機器人識別出了杯子,但抓取失敗,視覺理解仍然不夠;模型重建出了房間,但機器人無法安全導航,空間表征仍然不夠;視頻生成看起來逼真,但不能預測動作后果,世界模型仍然不夠。

      所以,具身智能把評價標準從“輸出是否正確”,推向“行動是否有效”。計算機視覺過去可以在視覺空間內部自洽,現在則必須接受物理世界的檢驗。

      當問題定義和評價標準都發生變化,方法路線也會被重寫。VLA 模型之所以重要,并不是因為它把 Vision、Language、Action 三個詞放在一起,而是因為它重建了智能系統的基本接口:人類用語言表達目標,機器人通過視覺理解當前世界,再把語言目標和視覺狀態轉化為動作序列。

      世界模型和物理仿真解決的,則是行動之前的后果預測。機器人拿起杯子,桌面狀態會改變;推開箱子,路徑可達性會改變;打開抽屜,新的物體會出現。如果視覺模型不能推演這些變化,它就很難支撐規劃。

      3D 空間智能也因此被重新賦予意義。過去,三維重建關注幾何是否準確、紋理是否真實;現在,具身智能要求三維世界是可行動的:哪里能走,哪里能抓,哪里會撞,哪里需要探索。

      這就是具身智能對計算機視覺方法路線的重寫。它把視覺模型從“感知器”推向“行動系統的一部分”,把 3D 從幾何恢復推向空間決策,把視頻生成從內容合成推向物理預測,把多模態模型從視覺問答推向任務執行。

      而學術范式的變化,最終還需要產業現實來確認。過去,計算機視覺的產業化多發生在相對可控的感知和內容場景中。安防識別、工業檢測、自動駕駛感知、手機影像和 AIGC,都可以在一定程度上把視覺輸出作為獨立結果來使用。

      但機器人不同。機器人要求視覺結果直接進入行動鏈條。模型不能只是“看起來理解了”,它必須把貨箱搬起來,把零件放到位,把路線走通,把門打開,把錯誤恢復過來。

      這使得視覺模型的錯誤成本發生了變化。一次識別錯誤可能導致抓取失敗,一次空間誤判可能導致碰撞,一次物理預測錯誤可能讓策略失效。

      因此,產業需要的不是單點視覺能力,而是一整套面向物理世界的視覺基礎設施:穩定的 3D 世界表征、低延遲動作生成、高質量機器人數據、可交互仿真環境、可靠的 Sim2Real 遷移,以及失敗后的恢復機制。

      只要 AI 繼續從屏幕走向物理世界,計算機視覺就必然從“感知模型”走向“行動基礎設施”。這也是具身智能奪取范式解釋權的現實基礎。

      03


      從開放世界之橋,到物理智能底座

      回到 2017 年 IROS 的歷史現場,李飛飛的出現象征著機器人學界對視覺智能的主動擁抱。那時,機器人如果要進入開放世界,就必須借助視覺理解對象、場景和人類意圖。視覺是機器人通往開放世界的一座橋。

      而現在 CVPR 2026 的具身智能熱潮構成了另一個歷史鏡像:機器人問題開始反過來迫使計算機視覺重新理解自身。沒有視覺,機器人無法理解開放世界;但沒有行動,視覺智能也很容易停留在描述世界的層面,無法證明自己是否真正理解世界。

      這就是“從座上賓到主戰場”的真正含義。

      它不是機器人取代計算機視覺,也不是 CVPR 變成機器人會議,而是具身智能奪取了計算機視覺的范式解釋權。它重新定義了什么是重要問題,什么是有效方法,什么是成功結果,也重新定義了視覺智能必須面對的世界。

      過去,計算機視覺的核心是讓機器看見世界;后來,它變成讓機器理解世界;現在,具身智能正在要求機器進入世界。看見是感知,理解是表征,行動才是對理解的最終檢驗。

      這次去 CVPR 現場,一定不要錯過

      【認識大牛+賺外快】的機會

      需要你做什么:把你最關注的10個大會報告,每頁PPT都拍下來

      你能獲得什么?

      認識大牛:你將可以進入CVPR名師博士社群;

      錢多活少:提供豐厚獎金,任務量精簡;

      聽會自由:你的行程你做主,順手就把外快賺。拍下你最感興趣的10個報告PPT即可。

      如果你即將前往CVPR,想邊聽會邊賺錢,還能順便為AI學術社區做貢獻、認識更多大牛,歡迎聯系我們:[添加微信號:MS_Yahei]

      【限額5位,先到先得】

      未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!

      公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      鐘南山發現:能活到90歲的老人,基本在60歲,就已經不做這6事了

      鐘南山發現:能活到90歲的老人,基本在60歲,就已經不做這6事了

      醫學科普匯
      2026-05-13 23:30:08
      會談結束!中美談足135分鐘,中方一錘定音,臺灣問題有了定論

      會談結束!中美談足135分鐘,中方一錘定音,臺灣問題有了定論

      阿物評論哥
      2026-05-14 16:58:40
      獨造5球導演大逆轉!梅西:我已經為世界杯做好準備

      獨造5球導演大逆轉!梅西:我已經為世界杯做好準備

      體壇周報
      2026-05-14 12:37:14
      看完特朗普訪華新聞,11歲的兒子問我:為什么馬斯克和黃仁勛,在同一架飛機上?

      看完特朗普訪華新聞,11歲的兒子問我:為什么馬斯克和黃仁勛,在同一架飛機上?

      萌芽研究所BUD
      2026-05-14 21:10:33
      中美關系,有了新定位

      中美關系,有了新定位

      中國新聞周刊
      2026-05-14 16:01:38
      不瞞了!馬斯克罕見承認:美國是第一,但第二到第十全都來自中國

      不瞞了!馬斯克罕見承認:美國是第一,但第二到第十全都來自中國

      瀲滟晴方DAY
      2026-04-25 23:29:34
      世界杯轉播權天價談判破裂,5億美金贊助打水漂,誰才是輸家?

      世界杯轉播權天價談判破裂,5億美金贊助打水漂,誰才是輸家?

      老特有話說
      2026-05-13 21:47:59
      售罄!女歌手演唱會門票低至40元!網友熱議

      售罄!女歌手演唱會門票低至40元!網友熱議

      深圳晚報
      2026-05-14 18:32:02
      北京四季酒店連續三天滿房,特朗普要住這了,為何選這個地方?

      北京四季酒店連續三天滿房,特朗普要住這了,為何選這個地方?

      李昕言溫度空間
      2026-05-13 06:00:20
      肖磊:特朗普訪華團隊里有個人非常特殊

      肖磊:特朗普訪華團隊里有個人非常特殊

      肖磊看世界
      2026-05-14 14:06:24
      基本盤被指用來嘲諷有愛國情懷的人

      基本盤被指用來嘲諷有愛國情懷的人

      映射生活的身影
      2026-05-13 21:13:11
      馬斯克站C位,黃仁勛皮衣換西裝!17位大佬同框暴露“霸總相”

      馬斯克站C位,黃仁勛皮衣換西裝!17位大佬同框暴露“霸總相”

      商務范
      2026-05-14 15:12:10
      雷軍開打價格戰,小米廉價車型要來了

      雷軍開打價格戰,小米廉價車型要來了

      科技頭版Pro
      2026-05-14 14:36:27
      小米SU7全車攝像頭突然集體失靈!4S店:外力滲液,不保修!車主蒙了:我沒撞沒泡水啊

      小米SU7全車攝像頭突然集體失靈!4S店:外力滲液,不保修!車主蒙了:我沒撞沒泡水啊

      魯中晨報
      2026-05-14 17:14:03
      看!外媒鏡頭下的“中國排面”

      看!外媒鏡頭下的“中國排面”

      上觀新聞
      2026-05-14 20:18:08
      正國級接機,外交禮儀的頂配

      正國級接機,外交禮儀的頂配

      阜成門六號院
      2026-05-14 18:10:50
      18年了!汶川地震丟下學生逃跑的“范跑跑”,如今竟過成了這樣?

      18年了!汶川地震丟下學生逃跑的“范跑跑”,如今竟過成了這樣?

      一盅情懷
      2026-05-14 09:05:26
      馬斯克用中文發貼:我的兒子正在學普通話

      馬斯克用中文發貼:我的兒子正在學普通話

      鳳凰網科技
      2026-05-14 20:36:05
      停更3年,千萬粉絲網紅改名宣布回歸,4小時漲粉240萬

      停更3年,千萬粉絲網紅改名宣布回歸,4小時漲粉240萬

      天津生活通
      2026-05-14 10:34:09
      詹姆斯下家最新賠率:騎士領跑勇士第四 續約湖人與退役同為第二

      詹姆斯下家最新賠率:騎士領跑勇士第四 續約湖人與退役同為第二

      羅說NBA
      2026-05-14 19:16:18
      2026-05-14 22:44:51
      AI科技評論 incentive-icons
      AI科技評論
      點評學術,服務AI
      7274文章數 20751關注度
      往期回顧 全部

      科技要聞

      馬斯克說會談很順利 黃仁勛點贊 庫克比耶

      頭條要聞

      女子稱關閉支付寶支付功能被扣款捐贈184萬 多方回應

      頭條要聞

      女子稱關閉支付寶支付功能被扣款捐贈184萬 多方回應

      體育要聞

      爭議抽象天王山,和季后賽最穩定中鋒

      娛樂要聞

      何九華官宣當爸!全程不提孩子媽

      財經要聞

      李強會見美國工商界代表

      汽車要聞

      雙零重力座椅/AI智能體/調光天幕 啟境GT7內飾發布

      態度原創

      家居
      手機
      教育
      藝術
      公開課

      家居要聞

      精神奢享 對話塔尖需求

      手機要聞

      蘋果“液態玻璃”飽受爭議 卻斬獲重量級設計大獎

      教育要聞

      中央財政安排5億元支持提升校園足球特色學校能力水平

      藝術要聞

      竣工!無錫奧體一期驚艷亮相,全城沸騰!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 中文字幕亚洲乱亚洲乱妇| 成人va亚洲va欧美天堂| 国产亚洲av毛片一区二区三区| caoporn成人免费公开| 久久综合伊人77777| 996热这里只有精品| 曲沃县| 久久99国产精品久久99软件| 亚洲产在线精品亚洲第一站一| 亚洲AV成人无码精品电影在线| 欧美日韩国产综合草草| 超碰w| 日本中文一区二区三区亚洲| 99精品国产福利在线观看| 丁香五月天堂| 黑人好猛厉害爽受不了好大撑| 国产一区二区三区不卡自拍| 亚洲成在人线AV品善网好看| 国产成人综合亚洲欧美日韩| 无码中文字| 国产精品白浆视频免费观看| 亚洲AV成人无码久久WWW| 亚洲日韩国产精品第一页一区 | 日韩免费中文字幕| 91丨国产丨精品丨丝袜| 中文字幕亚洲人妻系列| 最新国产精品好看的精品| 加勒比一区二区三区精品 | 久久婷婷国产精品香蕉| 69精品丰满人妻无码视频a片| 激情无码人妻又粗又大| 色综合久88| 国产午夜毛片V一区二区三区| 日韩精品无码人妻一区二区三区| 国内自拍视频一区二区三区| 久久蜜臀av一区三区| 中文字幕A片无码免费看| 国产人妻精品一区二区三区| 把女人弄爽大黄A大片片| 五月亚洲| 久久ww精品w免费人成|