網易首頁 > 網易號 > 正文申請入駐

谷歌AI掌門人、諾獎得主Demis：AGI 需要打破“金魚記憶”，而谷歌無論泡沫破裂與否都將是贏家

2026-01-29 18:30:44　來源: AI科技大本營

北京舉報

分享至

作者 | Big Technology Podcast

編譯 | 王啟隆

出品丨AI 科技大本營（ID：rgznai100）

如果說 Sam Altman 是 AI 時代的布道者，善于用宏大的愿景點燃公眾的想象力；那么 Demis Hassabis 更像是一位在實驗室里盯著顯微鏡的科學家，冷靜、嚴謹，對“炒作”有著天然的免疫力。

一年前，當整個硅谷都在因為 ChatGPT 的紅利期似乎見頂而焦慮，甚至開始討論“大語言模型（LLM）是否撞墻”時，Demis 卻感到困惑。在他看來，進步從未停止。他掌舵的 Google DeepMind 剛剛經歷了 AlphaFold 3 的高光時刻，正試圖將 AI 的觸角從簡單的聊天機器人延伸到生物學、物理學乃至材料科學的最深處。

在達沃斯的一間木質會議室里，Demis 近期接受了 Big Technology 播客的專訪。這場對話的特別之處在于，他沒有回避那些尖銳的問題：現在的 AI 是不是只有“金魚記憶”？谷歌會不會為了財報在 Gemini 里塞滿廣告？所謂的 AGI 究竟是營銷話術還是科學定義？

最令人印象深刻的是他對“智能載體”的斷言。在紀錄片《The Thinking Game》中，這位曾開發出 AlphaGo 的天才不得不拿著手機，笨拙地對著物體詢問 AI。他在采訪中直言不諱：“這種體驗太蠢了。” 他預言，智能眼鏡才是 AI 的終極形態，而這個未來甚至不需要等到明年。

不同于外界對“AI 泡沫”的恐慌，Demis 展現出了一種巨頭的從容：“如果泡沫破裂，那是 PPT 公司的災難。對于谷歌這樣擁有深厚技術棧和龐大業務底座的公司，無論何種情況，我們都處于有利位置。”

以下是這場對話的完整記錄，涵蓋了從技術架構到人類未來的方方面面。

打破“撞墻論”與 AI 的“金魚記憶”

Alex Kantrowitz： 讓我們把時間撥回一年前。當時行業里彌漫著一種質疑聲，大家都在問：AI 的進步是不是要停滯了？大語言模型（LLM）是不是要撞墻了？但這一年過去了，這種質疑似乎已經被事實打破了。你能告訴我們，具體發生了什么，讓 AI 行業從去年的質疑時刻走到了今天的繁榮？

Demis Hassabis： 說實話，對于我們 DeepMind 內部來說，我們要澄清一點：我們從未質疑過這一點。

我們一直看到性能在穩步、巨大的提升。所以，當我們聽到外界這種“撞墻論”時，甚至感到有些困惑。當時人們主要的擔憂是數據枯竭——認為互聯網上的高質量文本數據已經被訓練光了。這確實有一定道理，人們擔心如果沒有新數據，或者合成數據（Synthetic Data）不夠好，模型就會停滯。

但事實證明，我們可以從現有的架構和數據中“榨取”出更多的果汁。無論是在預訓練（Pre-training）階段，還是后訓練（Post-training）階段，亦或是思維鏈（Thinking Paradigms）的引入，甚至是將這些技術組合的方式上，都還有巨大的優化空間。僅僅是利用我們已知的技術進行微調和創新，我們就已經獲得了巨大的提升，而且這種提升空間依然很大。

Alex Kantrowitz： 這里我想扮演一下懷疑論者的角色。批評者會說，過去一年的很多進步，其實是在 LLM 上面加了一層“技巧”。比如現在的 AI 可以聯網搜索了，但這通常是通過“腳手架”（Scaffolding）或“編排”（Orchestration）來實現的。

最典型的例子是：AI 雖然能用工具去搜索網頁，但它記不住它學到的東西。一旦我關掉這個對話窗口，它就忘得一干二凈。這就像是“金魚的記憶”。 這難道不是大語言模型范式的一個根本性局限嗎？

Demis Hassabis： 我完全理解這個觀點。事實上，我自己也屬于那個陣營：我認為在通往 AGI（通用人工智能）的道路上，我們可能還需要一兩個巨大的突破。

僅僅靠把現有的模型做大（Scaling），可能不足以解決所有問題。我認為這些突破將發生在以下幾個方向：

持續學習（Continual Learning）： 讓模型在部署后還能通過交互更新自己的權重。
更好的記憶機制： 不是簡單地把所有東西都塞進上下文窗口（Context Window），而是像人腦一樣，只記住重要的、關鍵的信息。這才是更高效的記憶方式。
長期規劃與推理（Long-term Planning and Reasoning）： 讓 AI 能夠為了一個長遠目標進行多步推理。

現在的爭論焦點在于：是簡單地通過擴大現有技術的規模就能涌現出這些能力？還是我們需要發明全新的架構？ 如果你非要逼我選邊站，我會傾向于后者——我們需要一些新的發明。

但是，無論你屬于哪個陣營，有一點我是確信的：大模型（Foundation Models）將是最終 AGI 系統的核心組件。 我不同意像 Yann LeCun 那樣的觀點，認為大模型是死胡同。我認為哪怕有新突破，大模型也會是那個最重要的基石。DeepMind 的優勢在于，我們有足夠深厚的研究底蘊，可以雙管齊下：一邊將現有的 Transformer 架構推向極致，一邊探索那些全新的、藍天般的架構創新。

Alex Kantrowitz： 如果一個系統里有很多硬編碼（Hard-coded）的東西，它還能被稱作 AGI 嗎？

Demis Hassabis： 這取決于你對“很多”的定義。我對混合系統（Hybrid Systems），或者叫神經符號系統（Neuro-symbolic）非常感興趣。

你看我們的 AlphaFold 和 AlphaGo，它們其實就是混合系統。它們結合了神經網絡（深度學習）和經典的搜索算法（如蒙特卡洛樹搜索）。這種結合創造了歷史。

但我認為，是否屬于 AGI 的核心在于“學習”。學習是智能的同義詞。如果我們說一個系統是通用的（General），那意味著它必須具備通用學習能力。它必須能學習新知識，并且能跨領域學習。如果一個系統只能靠工程師手動寫入規則，那它肯定不是 AGI。

Alex Kantrowitz： 關于持續學習，你剛才提到這是目前的短板。現在的模型只要會話結束就“失憶”了。你對于如何解決這個問題有理論了嗎？

Demis Hassabis： 我們有一些線索，也在非常努力地攻克它。

如果你看 AlphaZero（AlphaGo 的進階版），它就是從零開始學習的。它不需要人類的棋譜，完全通過自我對弈來積累知識。但問題是，游戲是一個非常封閉、規則明確的領域。現實世界則要混亂得多。

我們目前知道的方法在狹窄領域（如游戲）是有效的，但能否擴展（Scale）并泛化（Generalize）到混亂的現實世界，還有待觀察。但我們目前的 AI 系統已經能做很多令人印象深刻的事情了。現在的挑戰是，能否將這種“從經驗中學習”的能力，融合進預訓練的大模型中。

目前的大模型，雖然在訓練階段是在“學習”，但我們更希望它能在“出廠”后，在與用戶的交互中繼續學習。這不僅僅是把你的數據放進上下文窗口那么簡單，而是要讓模型本身發生改變。這一步，目前還沒有被完美解決。

AGI 不是營銷術語，而是要能拿諾貝爾獎

Alex Kantrowitz： 我們已經多次提到 AGI 了。去年年底我采訪 Sam Altman 時，他說 AGI 的定義其實很模糊，他甚至希望大家能達成一個共識：既然定義不清，不如這就當做我們已經“嗖”地一下經過了 AGI，直接邁向超級智能了。你同意這種說法嗎？

Demis Hassabis： （笑）我肯定他希望大家這么想。但我絕對不同意。AGI 不應該被變成一個為了商業利益服務的營銷術語。

AGI 應該有一個科學的定義。我的定義一直是：一個能夠執行人類所能做的所有認知任務的系統。

請注意，我說的是“所有”。這意味著它不僅要能像現在的 AI 這樣寫代碼、畫圖，它還要能達到人類創造力的巔峰。

它不僅要能解一道已知的數學題，還要能像 拉馬努金 那樣，憑借直覺提出全新的數學猜想。
它不僅要能解決已知的科學問題，還要能像 愛因斯坦 提出廣義相對論那樣，提出全新的物理理論。
它不僅要能模仿藝術風格，還要能像 畢加索 或 莫扎特 那樣，開創前所未有的藝術流派。

目前我們的系統，無論解決了多少像 AlphaFold 這樣的難題，距離這種真正的“創造性突破”還有很長的路要走。人類的大腦做到了這一點，最聰明的人類做到了，所以這在物理上是可行的。但 AGI 必須具備在任何領域都能做到這一點的潛力。

此外，我還要加上物理智能（Physical Intelligence）。不僅僅是腦力勞動。看看達沃斯街頭的運動員，或者普通的藍領工人，他們對身體的控制能力、在物理世界中的靈巧性，是目前的機器人望塵莫及的。AGI 必須包含這種與物理世界交互的能力。

所以我認為，真正的 AGI 離我們還有 5 到 10 年的距離。

Alex Kantrowitz： 如果一個系統能做到你說的這一切——提出相對論、開創藝術流派、像運動員一樣運動——那這不已經是“超級智能”了嗎？為什么你覺得這還是 AGI？

Demis Hassabis： 不，這只是達到了人類智能的巔峰。

所謂的超級智能（Superintelligence），在我看來，是指那些人類大腦完全無法理解的維度。比如，人類很難在 14 維空間里進行直觀思考；人類無法直接將大腦連接到氣象衛星上處理海量數據。如果一個系統能做到這些人類生理結構做不到的事情，那才是超級智能。那是 AGI 之后的話題。

Alex Kantrowitz： 在 Google DeepMind 的播客里，有人問你現在有沒有哪個系統接近 AGI。你的回答讓我很驚訝。你沒有說 Gemini Ultra，你說的是 Nano Banana（注：DeepMind 內部的一個圖像生成模型代號）。為什么一個畫圖的模型會比大語言模型更接近 AGI？

Demis Hassabis： （笑）那是開玩笑的名字，有時候你得給這些項目起點有趣的名字。

但我提它是有原因的。不僅僅是圖像生成，還有我們的視頻生成模型 Veo。如果你仔細想想，一個視頻模型能生成一段 10 秒、20 秒極其逼真的視頻，這意味著什么？這意味著它內部構建了一個物理世界的模型（World Model）。它擁有了“直覺物理學”——它知道杯子掉在地上會碎，水倒出來會流，物體之間有遮擋關系。

這種對物理世界因果關系和運作機制的“理解”，是實現 AGI 的關鍵。想象一下機器人技術。如果你想要一個能為你做家務的機器人，它必須能在腦海中“模擬”未來：如果我這么做，會發生什么？它需要預測未來的軌跡。目前的語言模型雖然能寫詩，但缺乏這種對物理世界的扎實理解。

所以，多模態模型（Gemini 從一開始就是原生多模態）之所以重要，是因為它試圖將視覺、聽覺、視頻和語言融合在一起，形成一個完整的世界認知。這才是通往通用助手的必經之路。

智能眼鏡的“iPhone 時刻”與廣告的信任危機

Alex Kantrowitz： 讓我們聊聊產品。我看了你們的紀錄片《The Thinking Game》，有 300 多萬人也看了。片子里有個細節特別逗：你和你那個才華橫溢的團隊，居然還得像普通游客一樣，拿著手機對著某個物體，然后問 AI 助手“這是什么？”或者“發生了什么？”。

我在屏幕前都忍不住喊：“這哥們需要一副眼鏡啊！”手機這個形態顯然不對勁。

Demis Hassabis： 你完全說到了點子上。這也正是我們在內部“狗糧”（Dogfooding，意為內部測試）產品時得出的結論。

當你真的在現實生活中使用這些多模態 AI 時，你會發現舉著手機去探索世界、去獲得推薦，雖然技術上很神奇，但體驗上很笨重、很傻。

我心中的殺手級應用是“通用數字助理”。它應該是一個時刻伴隨你的助手，無論你是在電腦前工作，還是在城市里漫步，亦或是你在做飯。對于后者——當你在物理世界移動時——智能眼鏡顯然是最佳形態。你需要解放雙手。

谷歌有著悠久的做眼鏡的歷史（Google Glass），也許我們在過去做得太早了。那時的眼鏡太笨重、電池不行、樣子也奇怪。但現在，這些硬件問題基本解決了。

Alex Kantrowitz： 你的愿景是什么？這款眼鏡什么時候能普及？

Demis Hassabis： 我們的愿景是讓 AI 能夠“看”你所看，“聽”你所聽。想象一下，你在一個陌生的城市，你不需要掏出手機，只需要問一句：“前面那棟建筑是什么？”或者你在做飯，眼鏡直接告訴你這一步該放多少鹽。甚至對于視障人士，這簡直是上帝的禮物，能幫他們理解周圍的世界。

要實現這種無縫的體驗，必須是眼鏡。我們正在與 Warby Parker、Gentle Monster 以及三星等伙伴合作，打造下一代設備。我認為這會是一個全新的、定義品類的技術產品。至于時間點，既然我們已經在使用原型機了，我相信很快——也許就在今年——你就能看到成熟的產品。

Alex Kantrowitz： 接下來說個敏感話題：廣告。就在我們見面之前，有新聞報道說谷歌計劃在 Gemini 聊天機器人中引入廣告。而在最近的財報電話會上，Sundar Pichai 也暗示了這一點。有人在社交媒體上嘲諷說：如果這真的是改變世界的技術，為什么還要靠廣告賺錢？這就好比在發明電的時候，想著怎么在電燈泡上貼廣告。你怎么看？

Demis Hassabis： 首先我要澄清：我們目前沒有在 Gemini App 中加入廣告的計劃。

我們要非常小心。這里存在一個核心矛盾：如果你想要一個真正為你服務的、全能的私人助理，信任（Trust）是第一位的。你需要確信這個 AI 助理是在為你工作，它是站在你的立場上，為你爭取最大利益。

如果廣告模式滲入其中，導致用戶產生困惑——“這是 AI 覺得最好的建議，還是因為有人付了錢讓它這么說的？”——那就會瞬間摧毀這種信任關系。一旦信任崩塌，你就不會愿意把你的生活、你的隱私交給這個助理。

當然，這并不是非黑即白的。在某些特定的場景下，比如我問 AI：“我要去圣地亞哥過周末，幫我推薦住處。”在這個語境下，Airbnb 或者酒店的廣告其實是有用信息。用戶甚至可能希望在對話中直接完成預訂。

但這必須建立在用戶完全知情、且完全可控的前提下。這種“原生”的商業模式創新是可能的，而不是簡單地在對話框里貼橫幅廣告。

不過，作為 DeepMind 的負責人，我的首要任務是確保基礎技術的強大和通用性。至于商業模式，谷歌內部有很多人在思考，但我個人的看法是：千萬不要讓商業化損害了用戶對 AI 助理的核心信任。

反擊 Anthropic 與“泡沫論”

Alex Kantrowitz： 既然提到了競爭，我們不得不提 Anthropic。他們的 Claude 在編程領域表現非常出色，甚至有前亞馬遜高管說他用 Claude 在一個周末就寫出了一個 CRM 系統。這種“一人抵十人”的生產力爆發正在發生。谷歌怎么應對？

Demis Hassabis： 首先，我要給 Anthropic 點贊，Claude 是一個非常優秀的模型。

但我們對 Gemini 3 的編程能力也非常有信心。事實上，我自己最近就在用 Gemini 來寫代碼原型，做一些小游戲。這讓我也找回了當年做游戲開發者的樂趣。這種“Vibe Coding”（憑感覺編程）的趨勢非常令人興奮，它讓沒有深厚編程背景的人也能釋放創造力。

我們最近發布了 AlphaCode 的相關技術，以及內部使用的開發工具。雖然 Anthropic 現在在這個垂直領域（Coding）備受關注，但這只是 AI 巨大版圖中的一塊。我們看到的是更廣泛的戰場：從多模態搜索、到 YouTube 的創作工具、再到安卓系統的底層整合。

而且，我們正在將 AI 深度整合進谷歌現有的龐大產品線中。比如 Gmail 的“幫我寫”、Docs 的自動摘要。這些不僅是新功能，更是 AI 落地的最佳場景。

Alex Kantrowitz： 我有一個關于 AI 行業崩潰的理論，想聽聽你的看法。第一步：大家發現大模型訓練的回報率開始下降（邊際效應遞減）。第二步：像 Gemini Flash 這樣的“閃電模型”讓 AI 推理變得極其便宜，甚至接近免費。第三步：巨頭們投入的數千億基建（顯卡、數據中心）因此變得過剩，導致巨大的資本浪費和行業崩盤。你覺得這個劇本合理嗎？

Demis Hassabis： 這是一個合理的推演，但我認為這不是最可能發生的情況。

關于“泡沫”，我的看法是：這不是非黑即白的問題。確實，當我們看到一些初創公司，手里沒有核心技術，只有幾張 PPT，卻能拿到數十億美元的種子輪融資，這看起來非常像泡沫，也是不可持續的。這種狂熱最終會冷卻。

但是，對于像 Alphabet（谷歌母公司）這樣擁有深厚技術積累和龐大業務底座的公司來說，無論泡沫是否破裂，我們都能贏。為什么？因為即使明天 AI 的進步突然停止（雖然我認為這不可能），僅僅是現有的技術，就已經足夠讓我們的搜索、YouTube、辦公套件等業務產生巨大的效率提升和體驗變革。

我們是在“實業”的基礎上做 AI，而不是靠 AI 的概念去融資。那些沒有護城河、僅靠 API 套殼的公司可能會在泡沫破裂中消失，但這只會讓擁有底層模型和基礎設施的巨頭變得更強。

宇宙的本質是信息，人類的未來在何方？

Alex Kantrowitz： 我之前聽你說過一個非常哲學的觀點，我想請你詳細解釋一下。你說你有一個理論：信息（Information）才是宇宙最基本的單元，而不是能量或物質。 這是什么意思？

Demis Hassabis： 這確實是我世界觀的核心。雖然只有兩分鐘可能講不完，但我盡量簡述。

如果你看物理學，能量和物質通常被認為是守恒的、基礎的。但我認為，信息才是理解宇宙演化的鑰匙。看看生物學。生命系統是什么？生命本質上是一個信息處理系統。我們在做什么？我們在抵抗熱力學第二定律（熵增）。我們在混亂的宇宙中，努力維持自身的結構，維持信息的有序性。

這就是進化的本質：通過選擇壓力，篩選出那些能夠穩定保存和復制信息的結構。再把視角放大到宇宙。行星、恒星、星系的形成，其實也是在引力等物理法則的作用下，從混沌中涌現出的“信息結構”。

為什么這很重要？因為如果我們把宇宙看作是一個信息處理過程，那么 AI 就是這一過程的加速器。AI 本質上是在幫助我們以更高效的方式，去解構、理解和重組宇宙中的信息。

以 AlphaFold 為例。蛋白質折疊問題困擾了人類 50 年。蛋白質的結構數量幾乎是無限的，如同大海撈針。但 AlphaFold 通過學習已知數據的“信息拓撲結構”，找到了其中的規律，從而預測了所有已知蛋白質的結構。這不僅是生物學的勝利，更是“信息論”視角的勝利。

我們正在用 AI 這個工具，去破解物質、能量、生命背后的信息密碼。這將幫助我們發現新材料（比如室溫超導體）、設計新藥、解決氣候變化。

Alex Kantrowitz： 最后一個問題。你的 AlphaGo 曾擊敗了李世石，那是圍棋界的“悲傷時刻”，李世石甚至因此退役。現在，AI 開始進入知識工作領域，甚至能寫代碼、畫畫。人類會面臨同樣的命運嗎？我們會變得多余嗎？

Demis Hassabis： 我不這么看。我們要換個角度。

雖然深藍（Deep Blue）早在 90 年代就擊敗了卡斯帕羅夫，但今天國際象棋比以往任何時候都更受歡迎。甚至因為 AI 的輔助訓練，人類棋手的水平也提高了。沒人愛看兩臺電腦下棋，我們依然熱衷于看人類大師的對決，看那其中的心理博弈、失誤和天才靈感。

在科學領域，AI 是工具，就像望遠鏡。哈勃望遠鏡沒有奪走天文學家的工作，它讓他們看得更遠了。AlphaFold 預測了蛋白質結構，并沒有讓生物學家失業，而是讓他們跳過了枯燥、耗時數年的晶體衍射測定工作，直接去研究疾病機理和藥物設計。

這就是我看到的未來：AI 負責那些繁重、枯燥的信息處理工作，讓人類騰出手來。我們將有更多的時間去思考更高級的科學問題，去創造更有意義的藝術，去尋找真正的目的和意義。

如果 AI 能幫我們解決疾病、能源和氣候問題，哪怕那是“它的功勞”，我想也是值得的。這可能是一次堪比工業革命的劇變，甚至影響力大 10 倍，但人類總是擅長適應。我們將重新定義什么是“有意義的工作”，就像我們在農業社會轉向工業社會時所做的那樣。

視頻鏈接：https://www.youtube.com/watch?v=bgBfobN2A7A

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.