<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      李飛飛李曼玲團隊發布空間理論:AI的空間智能還在三歲小孩階段

      0
      分享至

      1983 年,心理學家設計了一個簡單實驗:Sally 把彈珠放進籃子然后離開,Anne 趁她不注意把彈珠挪到盒子里。問題是,Sally 回來后,會去哪里找彈珠?

      四歲孩子能答對:去籃子,因為 Sally 不知道彈珠被移走了。三歲以下的孩子會答錯,他們分不清“自己知道”和“別人知道”的區別。這就是發展心理學里著名的 Sally-Anne 測試,它標定了人類認知發展的一道重要分水嶺。這種能力被稱為“心智理論”(Theory of Mind)。


      (動圖來源:受訪者)

      四十多年后,美國斯坦福大學李飛飛教授和美國西北大學李曼玲教授團隊把這個實驗搬到了 AI 面前,只不過這次考察的是物理世界。他們設計了一套叫“空間理論”(Theory of Space)的評估框架,目的是想弄清楚一件事:當大模型必須自己去探索、去發現、去拼湊信息時,它的空間智能究竟進化到了哪一級?


      圖 | 從左到右:李飛飛、李曼玲(來源:資料圖)

      從被動答題到主動探索,AI 掉了好幾個臺階

      傳統測試 AI 空間能力的方式,有點像開卷考試。給一張圖,問里面物體的位置關系,模型答對了就算過關。前沿模型在這種測試里得分都不錯,讓人以為它們已經挺懂空間了。

      但李飛飛和李曼玲團隊覺得這還不夠。真實世界不是開卷考,沒有人會把所有信息一次性擺在你面前。你推開一扇門只看到客廳一角,走過走廊瞥見臥室一角,要理解整個房子的布局,你得把這些碎片拼起來,還得知道自己還有什么沒看到,下一步該往哪看。

      研究中,他們設計了一套測試環境,有文本版和視覺版兩種,讓模型在多個房間里主動探索,收集信息,構建腦海中的認知地圖。過去評估只看最終答對答錯,這篇工作第一次能給 AI 大腦拍 X 光,他們讓模型顯式探測這張認知地圖,在每個時間步輸出自己認為物體都在什么位置。


      (動圖來源:受訪者)

      結果發現,模型在被動模式下表現尚可,一旦切換到主動探索模式,性能應聲而落。以視覺世界為例,GPT-5.2 從 57.1% 掉到 46.0%,Gemini-3 Pro 從 60.5% 掉到 57.3%,而這就是他們所說的主動被動差距。


      (來源:https://theory-of-space.github.io/paper/Theory_of_S)

      差距從哪來?他們用一套精細的診斷工具來逐層拆解模型的認知過程。

      第一個問題是效率低。規則代理平均 9 步就能覆蓋整個環境,基礎模型往往需要 14 步以上,而且覆蓋率更低。GPT-5.2 有個毛病,一看到門就沖過去,經常忘了把當前房間看完。Gemini-3 Pro 好一些,會先原地旋轉觀察再移動,但也沒有規則代理高效。

      第二個問題更致命。他們設計了一個錯誤信念測試,在模型完成初次探索后,悄悄移動或旋轉幾個物體。當模型再次經過并直接觀察到新布局時,一個令人不安的現象出現了:GPT-5.2 在視覺世界中的朝向慣性高達 68.9%,即近七成的情況下仍然堅持報告物體的舊朝向。同一模型在文本世界中慣性只有 5.5%。


      (來源:https://theory-of-space.github.io/paper/Theory_of_S)

      其實這就是信念慣性,模型親眼看到變化,但內部表征缺乏足夠的可塑性來完成舊信念到新信念的覆寫,也就是它無法更新自己的認知。這和 Sally-Anne 測試里三歲幼兒的失敗何其相似,只不過幼兒失敗是因為認知能力尚未發育,模型失敗是因為內部機制存在缺陷。

      認知地圖會漂移,視覺世界更高難

      他們還發現一個叫信念漂移的現象。那就是模型在初次觀察物體時的感知誤差雖然存在,不過還沒嚴重到影響整體判斷。真正的問題是,這份初始保真度無法在后續步驟中維持。隨著探索推進、信息增多,那些早先正確的記憶開始悄然退化,被后續步驟的錯誤更新覆蓋,或者在拼接不同房間的信息時產生內部矛盾。


      (動圖來源:受訪者)

      最終認知地圖的低準確率,在很大程度上來自拼不住。模型缺乏穩定維護長程空間信息的機制,新的觀察不僅沒有鞏固已有認知,反而在不斷侵蝕它。這個特點可能人類也存在,比如筆者曾去參觀故宮,一個宮殿接一個地觀看,而這些宮殿又很相似,那么就很有可能看了下一個、忘記了上一個。


      (來源:https://theory-of-space.github.io/paper/Theory_of_S)

      但是,這些問題在視覺世界中會被放大。人類被試在視覺世界中的準確率高達 96.4%(使用簡單工具后達 99.0%),在文本世界中是 86.7%。模型卻正好相反,文本表現遠好于視覺。視覺信息對人類而言是天然、直覺的空間認知通道,而當前多模態模型尚未學會從像素中高效提取空間結構。

      尤其是物體朝向識別,模型幾乎接近隨機猜測。這解釋了為什么它們在視角推理任務(如 Perspective Taking)上得分慘淡,大約只有 36% 的準確率。

      而這套評估框架的價值,在于它把空間智能從會不會答這道題的二元判定,變成了一個可以逐級診斷的連續過程。它告訴我們的不只是模型還差多遠,更是它具體在哪一級開始失靈。

      如果模型連“記住剛才看到的沙發在哪”都做不到,那指望它在一個真實環境里主動導航,比如在災區搜救中定位幸存者,還有很長的路要走。


      (來源:https://theory-of-space.github.io/paper/Theory_of_S)

      目前,相關論文已被機器學習頂級會議 ICLR 2026 接收。論文、代碼和數據集都已開源。該研究由西北大學、斯坦福大學、華盛頓大學與康奈爾大學聯合完成。研究團隊里集齊了多位《麻省理工科技評論》“35 歲以下科技創新 35 人”的入選者,李曼玲教授是 2025 年全球入選者,美國斯坦福大學的吳佳俊教授和美國華盛頓大學的 Ranjay Krishna 教授分別入選了 2024 與 2025 年度亞太區名單。

      參考資料:

      相關論文 https://theory-of-space.github.io/paper/Theory_of_Space.pdf

      https://limanling.github.io/

      https://profiles.stanford.edu/fei-fei-li

      運營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      越來越猖狂的早餐店“鋁包子”,我們應提高警惕,該如何辨別呢?

      越來越猖狂的早餐店“鋁包子”,我們應提高警惕,該如何辨別呢?

      心中的麥田
      2026-05-04 18:47:55
      俄副部長叛逃美國,俄軍每天最低傷亡千人,仍在組織新攻勢!

      俄副部長叛逃美國,俄軍每天最低傷亡千人,仍在組織新攻勢!

      知兵
      2026-05-04 16:06:33
      妻子和情夫私通35年,丈夫不吵不鬧不離婚,直到丈夫退休他作出反擊

      妻子和情夫私通35年,丈夫不吵不鬧不離婚,直到丈夫退休他作出反擊

      麥子情感故事
      2026-05-04 23:24:12
      奧尼爾開噴!37歲場均20+5+6!這年紀這表現還不夠?

      奧尼爾開噴!37歲場均20+5+6!這年紀這表現還不夠?

      籃球大圖
      2026-05-05 11:26:40
      以穆斯林占99%的土耳其,性交易為何合法140年?

      以穆斯林占99%的土耳其,性交易為何合法140年?

      石辰搞笑日常
      2026-05-04 08:45:17
      曝曼聯6250萬先生賽季提前結束,休養備戰世界杯!仨隊友競爭首發

      曝曼聯6250萬先生賽季提前結束,休養備戰世界杯!仨隊友競爭首發

      羅米的曼聯博客
      2026-05-05 10:00:22
      中美放下電話,不到24小時,聯合國傳來重要消息,中方身份變了

      中美放下電話,不到24小時,聯合國傳來重要消息,中方身份變了

      健身狂人
      2026-05-04 20:03:17
      斯威士蘭國王有15個老婆,為了避免女人間的爭風吃醋,買19輛豪車

      斯威士蘭國王有15個老婆,為了避免女人間的爭風吃醋,買19輛豪車

      魔都姐姐雜談
      2026-05-04 16:14:24
      7年前,那個婚前拋棄女友,賣房賣車救妹妹的山西小伙,如今怎樣

      7年前,那個婚前拋棄女友,賣房賣車救妹妹的山西小伙,如今怎樣

      李橑在北漂
      2026-05-04 09:33:44
      公安部提醒:換身份證后別急著走!這3個關鍵步驟多數人忽略

      公安部提醒:換身份證后別急著走!這3個關鍵步驟多數人忽略

      老特有話說
      2026-05-04 16:04:22
      事業沒了,婚也離了!封殺5年后趙薇罕見露面,原來她早留好退路

      事業沒了,婚也離了!封殺5年后趙薇罕見露面,原來她早留好退路

      仙味少女心
      2026-05-05 08:41:44
      伊朗媒體:美軍襲擊民用船只致5人死亡

      伊朗媒體:美軍襲擊民用船只致5人死亡

      界面新聞
      2026-05-05 09:18:08
      人到中年后,為什么很難快樂起來?網友:都是陳塘關村民罷了!

      人到中年后,為什么很難快樂起來?網友:都是陳塘關村民罷了!

      夜深愛雜談
      2026-05-05 10:24:06
      普京簽署法令將長城汽車工廠投資合同延長至2034年

      普京簽署法令將長城汽車工廠投資合同延長至2034年

      俄羅斯衛星通訊社
      2026-05-04 15:09:10
      戴手套!“72小時可奪命”,又有人中招了

      戴手套!“72小時可奪命”,又有人中招了

      番禺臺
      2026-05-04 11:37:55
      權志龍穿涉種族歧視T恤登臺!公司火速道歉

      權志龍穿涉種族歧視T恤登臺!公司火速道歉

      喜歡歷史的阿繁
      2026-05-04 20:04:49
      他若不死必是十大元帥之首?毛主席:他比我厲害十倍

      他若不死必是十大元帥之首?毛主席:他比我厲害十倍

      小豫講故事
      2026-05-04 06:00:15
      官方:東契奇因左腿筋傷勢缺席與雷霆西部半決賽G1

      官方:東契奇因左腿筋傷勢缺席與雷霆西部半決賽G1

      懂球帝
      2026-05-05 12:16:03
      瀏陽煙花廠爆炸已造成21人死亡

      瀏陽煙花廠爆炸已造成21人死亡

      上峰視點
      2026-05-05 09:16:31
      馬克龍時代將畫上句號,梅朗雄宣布競選法國總統,對華態度已曝光

      馬克龍時代將畫上句號,梅朗雄宣布競選法國總統,對華態度已曝光

      達文西看世界
      2026-05-05 09:47:35
      2026-05-05 14:15:00
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16658文章數 514917關注度
      往期回顧 全部

      科技要聞

      OpenAI/Anthropic同日被曝拉攏華爾街建合資公司

      頭條要聞

      吳宜澤18-17奪冠:1家3口"兵分兩路"10年 已押上一切

      頭條要聞

      吳宜澤18-17奪冠:1家3口"兵分兩路"10年 已押上一切

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      英皇25周年演唱會 張敬軒被救護車拉走

      財經要聞

      五一假期,中國年輕人的“首爾病”犯了

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      家居
      數碼
      本地
      手機
      親子

      家居要聞

      靈動實用 生活藝術場

      數碼要聞

      蘋果正考慮與英特爾和三星合作 為其生產主要設備芯片

      本地新聞

      用青花瓷的方式,打開西溪濕地

      手機要聞

      蘋果2026旗艦18 Pro\\Max,iPhone Ultra 折疊怎么選?一文說透不糾結

      親子要聞

      為什么古代育兒總離不開這兩樣東西?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲一区二区三区精品影院| 蜜桃成熟色综合久久av| 久热这里有精品视频在线| 精品视频一区二区三区在线观看| 亚洲熟妇色自偷自拍另类| 国产精品无码免费播放| 国产午夜成人av在线播放| 午夜一区欧美二区高清三区| 国产高清自产拍av在线| 亚洲无码网址| 国产乱人伦真实精品视频| 18禁免费无码无遮挡不卡网站| 超碰人人摸| 国产在线线精品宅男网址| 99精品成人无码观看免费| 国产精品国语对白露脸在线播放| 亚洲V色| 无码人妻少妇| 国产公开久久人人97超碰| 久久日韩在线观看视频| 国产亚洲精品自在久久vr| 亚洲 日韩 欧美 成人 在线| 亚洲AV无码无在线观看红杏 | 污污污污污污WWW网站免费| 国内精品一区二区在线观看| 国产精品福利自产拍在线观看| 亚洲美免无码中文字幕在线| 群交射精白浆视频| 精品日本一区二区视频| 中文字幕无码专区一VA亚洲V专| 日本边添边摸边做边爱喷水| 久久这里只有精品免费| 日本一区二区视频| 久久精品aⅴ无码中文字字幕重口| 国产欧美VA天堂在线观看视频| 久久福利导航| 亚洲天堂欧美| 国产在线精品一区二区在线看| 精品无码人妻| 亚洲综合在线一区二区三区 | 精品亚洲成在人线av无码|