作者 | Big Technology Podcast
編譯 | 王啟隆
出品丨AI 科技大本營(ID:rgznai100)
如果說 Sam Altman 是 AI 時代的布道者,善于用宏大的愿景點燃公眾的想象力;那么 Demis Hassabis 更像是一位在實驗室里盯著顯微鏡的科學家,冷靜、嚴謹,對“炒作”有著天然的免疫力。
一年前,當整個硅谷都在因為 ChatGPT 的紅利期似乎見頂而焦慮,甚至開始討論“大語言模型(LLM)是否撞墻”時,Demis 卻感到困惑。在他看來,進步從未停止。他掌舵的 Google DeepMind 剛剛經歷了 AlphaFold 3 的高光時刻,正試圖將 AI 的觸角從簡單的聊天機器人延伸到生物學、物理學乃至材料科學的最深處。
在達沃斯的一間木質會議室里,Demis 近期接受了 Big Technology 播客的專訪。這場對話的特別之處在于,他沒有回避那些尖銳的問題:現在的 AI 是不是只有“金魚記憶”?谷歌會不會為了財報在 Gemini 里塞滿廣告?所謂的 AGI 究竟是營銷話術還是科學定義?
![]()
最令人印象深刻的是他對“智能載體”的斷言。在紀錄片《The Thinking Game》中,這位曾開發出 AlphaGo 的天才不得不拿著手機,笨拙地對著物體詢問 AI。他在采訪中直言不諱:“這種體驗太蠢了。” 他預言,智能眼鏡才是 AI 的終極形態,而這個未來甚至不需要等到明年。
不同于外界對“AI 泡沫”的恐慌,Demis 展現出了一種巨頭的從容:“如果泡沫破裂,那是 PPT 公司的災難。對于谷歌這樣擁有深厚技術棧和龐大業務底座的公司,無論何種情況,我們都處于有利位置。”
以下是這場對話的完整記錄,涵蓋了從技術架構到人類未來的方方面面。
![]()
打破“撞墻論”與 AI 的“金魚記憶”
Alex Kantrowitz: 讓我們把時間撥回一年前。當時行業里彌漫著一種質疑聲,大家都在問:AI 的進步是不是要停滯了?大語言模型(LLM)是不是要撞墻了?但這一年過去了,這種質疑似乎已經被事實打破了。你能告訴我們,具體發生了什么,讓 AI 行業從去年的質疑時刻走到了今天的繁榮?
Demis Hassabis: 說實話,對于我們 DeepMind 內部來說,我們要澄清一點:我們從未質疑過這一點。
我們一直看到性能在穩步、巨大的提升。所以,當我們聽到外界這種“撞墻論”時,甚至感到有些困惑。當時人們主要的擔憂是數據枯竭——認為互聯網上的高質量文本數據已經被訓練光了。這確實有一定道理,人們擔心如果沒有新數據,或者合成數據(Synthetic Data)不夠好,模型就會停滯。
但事實證明,我們可以從現有的架構和數據中“榨取”出更多的果汁。無論是在預訓練(Pre-training)階段,還是后訓練(Post-training)階段,亦或是思維鏈(Thinking Paradigms)的引入,甚至是將這些技術組合的方式上,都還有巨大的優化空間。僅僅是利用我們已知的技術進行微調和創新,我們就已經獲得了巨大的提升,而且這種提升空間依然很大。
Alex Kantrowitz: 這里我想扮演一下懷疑論者的角色。批評者會說,過去一年的很多進步,其實是在 LLM 上面加了一層“技巧”。比如現在的 AI 可以聯網搜索了,但這通常是通過“腳手架”(Scaffolding)或“編排”(Orchestration)來實現的。
最典型的例子是:AI 雖然能用工具去搜索網頁,但它記不住它學到的東西。一旦我關掉這個對話窗口,它就忘得一干二凈。這就像是“金魚的記憶”。 這難道不是大語言模型范式的一個根本性局限嗎?
Demis Hassabis: 我完全理解這個觀點。事實上,我自己也屬于那個陣營:我認為在通往 AGI(通用人工智能)的道路上,我們可能還需要一兩個巨大的突破。
僅僅靠把現有的模型做大(Scaling),可能不足以解決所有問題。我認為這些突破將發生在以下幾個方向:
持續學習(Continual Learning): 讓模型在部署后還能通過交互更新自己的權重。
更好的記憶機制: 不是簡單地把所有東西都塞進上下文窗口(Context Window),而是像人腦一樣,只記住重要的、關鍵的信息。這才是更高效的記憶方式。
長期規劃與推理(Long-term Planning and Reasoning): 讓 AI 能夠為了一個長遠目標進行多步推理。
現在的爭論焦點在于:是簡單地通過擴大現有技術的規模就能涌現出這些能力?還是我們需要發明全新的架構? 如果你非要逼我選邊站,我會傾向于后者——我們需要一些新的發明。
但是,無論你屬于哪個陣營,有一點我是確信的:大模型(Foundation Models)將是最終 AGI 系統的核心組件。 我不同意像 Yann LeCun 那樣的觀點,認為大模型是死胡同。我認為哪怕有新突破,大模型也會是那個最重要的基石。DeepMind 的優勢在于,我們有足夠深厚的研究底蘊,可以雙管齊下:一邊將現有的 Transformer 架構推向極致,一邊探索那些全新的、藍天般的架構創新。
Alex Kantrowitz: 如果一個系統里有很多硬編碼(Hard-coded)的東西,它還能被稱作 AGI 嗎?
Demis Hassabis: 這取決于你對“很多”的定義。我對混合系統(Hybrid Systems),或者叫神經符號系統(Neuro-symbolic)非常感興趣。
你看我們的 AlphaFold 和 AlphaGo,它們其實就是混合系統。它們結合了神經網絡(深度學習)和經典的搜索算法(如蒙特卡洛樹搜索)。這種結合創造了歷史。
但我認為,是否屬于 AGI 的核心在于“學習”。學習是智能的同義詞。如果我們說一個系統是通用的(General),那意味著它必須具備通用學習能力。它必須能學習新知識,并且能跨領域學習。如果一個系統只能靠工程師手動寫入規則,那它肯定不是 AGI。
Alex Kantrowitz: 關于持續學習,你剛才提到這是目前的短板。現在的模型只要會話結束就“失憶”了。你對于如何解決這個問題有理論了嗎?
Demis Hassabis: 我們有一些線索,也在非常努力地攻克它。
如果你看 AlphaZero(AlphaGo 的進階版),它就是從零開始學習的。它不需要人類的棋譜,完全通過自我對弈來積累知識。但問題是,游戲是一個非常封閉、規則明確的領域。現實世界則要混亂得多。
我們目前知道的方法在狹窄領域(如游戲)是有效的,但能否擴展(Scale)并泛化(Generalize)到混亂的現實世界,還有待觀察。但我們目前的 AI 系統已經能做很多令人印象深刻的事情了。現在的挑戰是,能否將這種“從經驗中學習”的能力,融合進預訓練的大模型中。
目前的大模型,雖然在訓練階段是在“學習”,但我們更希望它能在“出廠”后,在與用戶的交互中繼續學習。這不僅僅是把你的數據放進上下文窗口那么簡單,而是要讓模型本身發生改變。這一步,目前還沒有被完美解決。
![]()
AGI 不是營銷術語,而是要能拿諾貝爾獎
Alex Kantrowitz: 我們已經多次提到 AGI 了。去年年底我采訪 Sam Altman 時,他說 AGI 的定義其實很模糊,他甚至希望大家能達成一個共識:既然定義不清,不如這就當做我們已經“嗖”地一下經過了 AGI,直接邁向超級智能了。你同意這種說法嗎?
Demis Hassabis: (笑)我肯定他希望大家這么想。但我絕對不同意。AGI 不應該被變成一個為了商業利益服務的營銷術語。
AGI 應該有一個科學的定義。我的定義一直是:一個能夠執行人類所能做的所有認知任務的系統。
請注意,我說的是“所有”。這意味著它不僅要能像現在的 AI 這樣寫代碼、畫圖,它還要能達到人類創造力的巔峰。
它不僅要能解一道已知的數學題,還要能像 拉馬努金 那樣,憑借直覺提出全新的數學猜想。
它不僅要能解決已知的科學問題,還要能像 愛因斯坦 提出廣義相對論那樣,提出全新的物理理論。
它不僅要能模仿藝術風格,還要能像 畢加索 或 莫扎特 那樣,開創前所未有的藝術流派。
目前我們的系統,無論解決了多少像 AlphaFold 這樣的難題,距離這種真正的“創造性突破”還有很長的路要走。人類的大腦做到了這一點,最聰明的人類做到了,所以這在物理上是可行的。但 AGI 必須具備在任何領域都能做到這一點的潛力。
此外,我還要加上物理智能(Physical Intelligence)。不僅僅是腦力勞動。看看達沃斯街頭的運動員,或者普通的藍領工人,他們對身體的控制能力、在物理世界中的靈巧性,是目前的機器人望塵莫及的。AGI 必須包含這種與物理世界交互的能力。
所以我認為,真正的 AGI 離我們還有 5 到 10 年的距離。
Alex Kantrowitz: 如果一個系統能做到你說的這一切——提出相對論、開創藝術流派、像運動員一樣運動——那這不已經是“超級智能”了嗎?為什么你覺得這還是 AGI?
Demis Hassabis: 不,這只是達到了人類智能的巔峰。
所謂的超級智能(Superintelligence),在我看來,是指那些人類大腦完全無法理解的維度。 比如,人類很難在 14 維空間里進行直觀思考;人類無法直接將大腦連接到氣象衛星上處理海量數據。如果一個系統能做到這些人類生理結構做不到的事情,那才是超級智能。那是 AGI 之后的話題。
Alex Kantrowitz: 在 Google DeepMind 的播客里,有人問你現在有沒有哪個系統接近 AGI。你的回答讓我很驚訝。你沒有說 Gemini Ultra,你說的是 Nano Banana(注:DeepMind 內部的一個圖像生成模型代號)。為什么一個畫圖的模型會比大語言模型更接近 AGI?
Demis Hassabis: (笑)那是開玩笑的名字,有時候你得給這些項目起點有趣的名字。
但我提它是有原因的。不僅僅是圖像生成,還有我們的視頻生成模型 Veo。 如果你仔細想想,一個視頻模型能生成一段 10 秒、20 秒極其逼真的視頻,這意味著什么?這意味著它內部構建了一個物理世界的模型(World Model)。它擁有了“直覺物理學”——它知道杯子掉在地上會碎,水倒出來會流,物體之間有遮擋關系。
這種對物理世界因果關系和運作機制的“理解”,是實現 AGI 的關鍵。 想象一下機器人技術。如果你想要一個能為你做家務的機器人,它必須能在腦海中“模擬”未來:如果我這么做,會發生什么?它需要預測未來的軌跡。目前的語言模型雖然能寫詩,但缺乏這種對物理世界的扎實理解。
所以,多模態模型(Gemini 從一開始就是原生多模態)之所以重要,是因為它試圖將視覺、聽覺、視頻和語言融合在一起,形成一個完整的世界認知。這才是通往通用助手的必經之路。
![]()
智能眼鏡的“iPhone 時刻”與廣告的信任危機
Alex Kantrowitz: 讓我們聊聊產品。我看了你們的紀錄片《The Thinking Game》,有 300 多萬人也看了。片子里有個細節特別逗:你和你那個才華橫溢的團隊,居然還得像普通游客一樣,拿著手機對著某個物體,然后問 AI 助手“這是什么?”或者“發生了什么?”。
我在屏幕前都忍不住喊:“這哥們需要一副眼鏡啊!”手機這個形態顯然不對勁。
Demis Hassabis: 你完全說到了點子上。這也正是我們在內部“狗糧”(Dogfooding,意為內部測試)產品時得出的結論。
當你真的在現實生活中使用這些多模態 AI 時,你會發現舉著手機去探索世界、去獲得推薦,雖然技術上很神奇,但體驗上很笨重、很傻。
我心中的殺手級應用是“通用數字助理”。它應該是一個時刻伴隨你的助手,無論你是在電腦前工作,還是在城市里漫步,亦或是你在做飯。 對于后者——當你在物理世界移動時——智能眼鏡顯然是最佳形態。你需要解放雙手。
谷歌有著悠久的做眼鏡的歷史(Google Glass),也許我們在過去做得太早了。那時的眼鏡太笨重、電池不行、樣子也奇怪。但現在,這些硬件問題基本解決了。
Alex Kantrowitz: 你的愿景是什么?這款眼鏡什么時候能普及?
Demis Hassabis: 我們的愿景是讓 AI 能夠“看”你所看,“聽”你所聽。 想象一下,你在一個陌生的城市,你不需要掏出手機,只需要問一句:“前面那棟建筑是什么?”或者你在做飯,眼鏡直接告訴你這一步該放多少鹽。甚至對于視障人士,這簡直是上帝的禮物,能幫他們理解周圍的世界。
要實現這種無縫的體驗,必須是眼鏡。我們正在與 Warby Parker、Gentle Monster 以及三星等伙伴合作,打造下一代設備。我認為這會是一個全新的、定義品類的技術產品。至于時間點,既然我們已經在使用原型機了,我相信很快——也許就在今年——你就能看到成熟的產品。
Alex Kantrowitz: 接下來說個敏感話題:廣告。 就在我們見面之前,有新聞報道說谷歌計劃在 Gemini 聊天機器人中引入廣告。而在最近的財報電話會上,Sundar Pichai 也暗示了這一點。 有人在社交媒體上嘲諷說:如果這真的是改變世界的技術,為什么還要靠廣告賺錢?這就好比在發明電的時候,想著怎么在電燈泡上貼廣告。你怎么看?
Demis Hassabis: 首先我要澄清:我們目前沒有在 Gemini App 中加入廣告的計劃。
我們要非常小心。這里存在一個核心矛盾:如果你想要一個真正為你服務的、全能的私人助理,信任(Trust)是第一位的。 你需要確信這個 AI 助理是在為你工作,它是站在你的立場上,為你爭取最大利益。
如果廣告模式滲入其中,導致用戶產生困惑——“這是 AI 覺得最好的建議,還是因為有人付了錢讓它這么說的?”——那就會瞬間摧毀這種信任關系。一旦信任崩塌,你就不會愿意把你的生活、你的隱私交給這個助理。
當然,這并不是非黑即白的。在某些特定的場景下,比如我問 AI:“我要去圣地亞哥過周末,幫我推薦住處。”在這個語境下,Airbnb 或者酒店的廣告其實是有用信息。用戶甚至可能希望在對話中直接完成預訂。
但這必須建立在用戶完全知情、且完全可控的前提下。這種“原生”的商業模式創新是可能的,而不是簡單地在對話框里貼橫幅廣告。
不過,作為 DeepMind 的負責人,我的首要任務是確保基礎技術的強大和通用性。至于商業模式,谷歌內部有很多人在思考,但我個人的看法是:千萬不要讓商業化損害了用戶對 AI 助理的核心信任。
![]()
反擊 Anthropic 與“泡沫論”
Alex Kantrowitz: 既然提到了競爭,我們不得不提 Anthropic。他們的 Claude 在編程領域表現非常出色,甚至有前亞馬遜高管說他用 Claude 在一個周末就寫出了一個 CRM 系統。這種“一人抵十人”的生產力爆發正在發生。谷歌怎么應對?
Demis Hassabis: 首先,我要給 Anthropic 點贊,Claude 是一個非常優秀的模型。
但我們對 Gemini 3 的編程能力也非常有信心。事實上,我自己最近就在用 Gemini 來寫代碼原型,做一些小游戲。這讓我也找回了當年做游戲開發者的樂趣。這種“Vibe Coding”(憑感覺編程)的趨勢非常令人興奮,它讓沒有深厚編程背景的人也能釋放創造力。
我們最近發布了 AlphaCode 的相關技術,以及內部使用的開發工具。雖然 Anthropic 現在在這個垂直領域(Coding)備受關注,但這只是 AI 巨大版圖中的一塊。我們看到的是更廣泛的戰場:從多模態搜索、到 YouTube 的創作工具、再到安卓系統的底層整合。
而且,我們正在將 AI 深度整合進谷歌現有的龐大產品線中。比如 Gmail 的“幫我寫”、Docs 的自動摘要。這些不僅是新功能,更是 AI 落地的最佳場景。
Alex Kantrowitz: 我有一個關于 AI 行業崩潰的理論,想聽聽你的看法。 第一步:大家發現大模型訓練的回報率開始下降(邊際效應遞減)。 第二步:像 Gemini Flash 這樣的“閃電模型”讓 AI 推理變得極其便宜,甚至接近免費。 第三步:巨頭們投入的數千億基建(顯卡、數據中心)因此變得過剩,導致巨大的資本浪費和行業崩盤。 你覺得這個劇本合理嗎?
Demis Hassabis: 這是一個合理的推演,但我認為這不是最可能發生的情況。
關于“泡沫”,我的看法是:這不是非黑即白的問題。確實,當我們看到一些初創公司,手里沒有核心技術,只有幾張 PPT,卻能拿到數十億美元的種子輪融資,這看起來非常像泡沫,也是不可持續的。這種狂熱最終會冷卻。
但是,對于像 Alphabet(谷歌母公司)這樣擁有深厚技術積累和龐大業務底座的公司來說,無論泡沫是否破裂,我們都能贏。 為什么?因為即使明天 AI 的進步突然停止(雖然我認為這不可能),僅僅是現有的技術,就已經足夠讓我們的搜索、YouTube、辦公套件等業務產生巨大的效率提升和體驗變革。
我們是在“實業”的基礎上做 AI,而不是靠 AI 的概念去融資。那些沒有護城河、僅靠 API 套殼的公司可能會在泡沫破裂中消失,但這只會讓擁有底層模型和基礎設施的巨頭變得更強。
![]()
宇宙的本質是信息,人類的未來在何方?
Alex Kantrowitz: 我之前聽你說過一個非常哲學的觀點,我想請你詳細解釋一下。你說你有一個理論:信息(Information)才是宇宙最基本的單元,而不是能量或物質。 這是什么意思?
Demis Hassabis: 這確實是我世界觀的核心。雖然只有兩分鐘可能講不完,但我盡量簡述。
如果你看物理學,能量和物質通常被認為是守恒的、基礎的。但我認為,信息才是理解宇宙演化的鑰匙。 看看生物學。生命系統是什么?生命本質上是一個信息處理系統。我們在做什么?我們在抵抗熱力學第二定律(熵增)。我們在混亂的宇宙中,努力維持自身的結構,維持信息的有序性。
這就是進化的本質:通過選擇壓力,篩選出那些能夠穩定保存和復制信息的結構。 再把視角放大到宇宙。行星、恒星、星系的形成,其實也是在引力等物理法則的作用下,從混沌中涌現出的“信息結構”。
為什么這很重要?因為如果我們把宇宙看作是一個信息處理過程,那么 AI 就是這一過程的加速器。AI 本質上是在幫助我們以更高效的方式,去解構、理解和重組宇宙中的信息。
以 AlphaFold 為例。蛋白質折疊問題困擾了人類 50 年。蛋白質的結構數量幾乎是無限的,如同大海撈針。但 AlphaFold 通過學習已知數據的“信息拓撲結構”,找到了其中的規律,從而預測了所有已知蛋白質的結構。這不僅是生物學的勝利,更是“信息論”視角的勝利。
我們正在用 AI 這個工具,去破解物質、能量、生命背后的信息密碼。這將幫助我們發現新材料(比如室溫超導體)、設計新藥、解決氣候變化。
Alex Kantrowitz: 最后一個問題。你的 AlphaGo 曾擊敗了李世石,那是圍棋界的“悲傷時刻”,李世石甚至因此退役。現在,AI 開始進入知識工作領域,甚至能寫代碼、畫畫。人類會面臨同樣的命運嗎?我們會變得多余嗎?
Demis Hassabis: 我不這么看。我們要換個角度。
雖然深藍(Deep Blue)早在 90 年代就擊敗了卡斯帕羅夫,但今天國際象棋比以往任何時候都更受歡迎。甚至因為 AI 的輔助訓練,人類棋手的水平也提高了。沒人愛看兩臺電腦下棋,我們依然熱衷于看人類大師的對決,看那其中的心理博弈、失誤和天才靈感。
在科學領域,AI 是工具,就像望遠鏡。哈勃望遠鏡沒有奪走天文學家的工作,它讓他們看得更遠了。AlphaFold 預測了蛋白質結構,并沒有讓生物學家失業,而是讓他們跳過了枯燥、耗時數年的晶體衍射測定工作,直接去研究疾病機理和藥物設計。
這就是我看到的未來:AI 負責那些繁重、枯燥的信息處理工作,讓人類騰出手來。我們將有更多的時間去思考更高級的科學問題,去創造更有意義的藝術,去尋找真正的目的和意義。
如果 AI 能幫我們解決疾病、能源和氣候問題,哪怕那是“它的功勞”,我想也是值得的。這可能是一次堪比工業革命的劇變,甚至影響力大 10 倍,但人類總是擅長適應。我們將重新定義什么是“有意義的工作”,就像我們在農業社會轉向工業社會時所做的那樣。
視頻鏈接:https://www.youtube.com/watch?v=bgBfobN2A7A
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.