網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

谷歌用 AI 「殺死」谷歌，這場發(fā)布會看得人缺氧

2026-05-20 06:00:24　來源: 愛范兒

廣東舉報(bào)

分享至

Gemini App 月活超 9 億，月 Token 處理量每月 3200 萬億，Nano Banana 生成超過 500 億張圖片……

在今天凌晨剛剛結(jié)束的 Google I/O 大會上，Google CEO Demis Hassabis 上來就拋出了這些數(shù)字。

過去一年，AI 成了所有行業(yè)的主旋律，Gemini 在 Google 的定位，也開始從一個(gè)獨(dú)一的 App，成了所有 Google 產(chǎn)品里的最重要的 AI 底層能力。

這次發(fā)布會也先從模型開始，進(jìn)一步帶到 Coding 和 Agent 產(chǎn)品。

Gemini Omni 把 Google 的視頻生成推向「世界模型」方向，Gemini 3.5 Flash 則是和 AI 編程工具一起推向 Agent 開發(fā)平臺。

這兩個(gè)能力隨后進(jìn)入 Google 的完整生態(tài)，搜索、Gemini App、Flow、Spark、Chrome、XR 眼鏡和電商場景。

Gemini Omni 登場，視頻界的「Nano Banana」時(shí)刻來了

發(fā)布會最先被重點(diǎn)展開的是 Gemini Omni。

DeepMind CEO 將 Gemini Omni 描述為一個(gè)能夠「從任何輸入創(chuàng)造任何內(nèi)容」的新模型。它把 Gemini 的推理能力與 Google 既有的生成式媒體模型結(jié)合起來，目標(biāo)是提升模型對世界的理解、多模態(tài)生成能力和編輯能力。

Google 強(qiáng)調(diào)，Veo、Nano Banana、Genie 等模型已經(jīng)能生成視頻、圖片和交互式模擬，但 Gemini Omni 更進(jìn)一步，開始處理動(dòng)能、重力等更接近物理世界的問題。

發(fā)布會現(xiàn)場展示的案例包括蛋白質(zhì)折疊解釋視頻。用戶只需要輸入類似「生成一個(gè)關(guān)于蛋白質(zhì)折疊的黏土動(dòng)畫解釋」的提示，Omni 就能把抽象科學(xué)概念轉(zhuǎn)化成視頻內(nèi)容。

它還支持更自然的視頻編輯。用戶可以上傳自己的視頻，再用對話方式修改風(fēng)格、加入元素、調(diào)整細(xì)節(jié)，甚至把一個(gè)普通圓形轉(zhuǎn)成黑洞，把夜晚散步場景變成更具戲劇感的畫面。

Google 的說法是，Gemini Omni 先從視頻開始，之后會逐步走向「任意輸入到任意輸出」。這也是 Google 一直把 Gemini 設(shè)計(jì)成多模態(tài)模型的原因。

首個(gè) Omni 家族模型 Gemini Omni Flash 已在上線到 Google 產(chǎn)品中，Omni Pro 會在之后公布更多信息。Gemini App 中的 Omni 功能也面向 Google AI Plus、Pro 和 Ultra 訂閱用戶開放。

這意味著，Gemini Omni 不只是一個(gè)視頻生成模型。Google 想把它放進(jìn)「世界模型」的敘事里：模型不僅生成畫面，還要理解畫面中的物理關(guān)系、運(yùn)動(dòng)關(guān)系和場景邏輯。

在進(jìn)入 Gemini App、Google Flow 和 YouTube Shorts 這些應(yīng)用之后， Omni 也會讓 Google 的生成式創(chuàng)作工具從圖片編輯擴(kuò)展到視頻編輯。

Gemini 3.5 Flash 上線，AI 寫代碼進(jìn)入極速模式

如果 Gemini Omni 對應(yīng)的是生成和編輯，Gemini 3.5 Flash 對應(yīng)的就是速度、成本和執(zhí)行能力。

Google 在發(fā)布會上推出 Gemini 3.5 Flash，稱它是 Gemini 3.5 系列第一批模型之一，重點(diǎn)面向 agentic coding、長周期任務(wù)和真實(shí)工作流。

相比 3.1 Pro，3.5 Flash 在幾乎所有基準(zhǔn)測試中提升明顯，尤其是代碼能力，以及 GDPVal 這類更接近真實(shí)經(jīng)濟(jì)任務(wù)的評測。

Google 還強(qiáng)調(diào)，3.5 Flash 在輸出 tokens 速度上比其他前沿模型快 4 倍，在 Antigravity 中經(jīng)過專門優(yōu)化后，速度可達(dá)到 12 倍。

值得一提的是，今年 3 月，Google 內(nèi)部開發(fā)相關(guān)任務(wù)每天處理約 5000 億 tokens，之后每隔幾周翻倍，目前已經(jīng)超過每天 3 萬億 tokens。Google 把這稱為一個(gè)反饋循環(huán)，用大規(guī)模真實(shí)使用繼續(xù)改進(jìn) 3.5 Flash。

與模型同步推出的是 Antigravity 2.0。

它從原來的 agent powered IDE，升級為一個(gè)獨(dú)立桌面應(yīng)用，重點(diǎn)轉(zhuǎn)向 agent first。用戶不再只是讓 AI 在編輯器里輔助寫代碼，而是通過 Agent 對話、Agent 產(chǎn)物和多 Agent 協(xié)同來完成開發(fā)任務(wù)。

Antigravity 2.0 加入完整 CLI、Antigravity SDK、Gemini 音頻模型原生語音支持，并集成 Android、Firebase、Google AI Studio 等服務(wù)。Antigravity 2.0 作為獨(dú)立桌面應(yīng)用，也已經(jīng)面向全球用戶開放。

Google 在現(xiàn)場用一個(gè)高強(qiáng)度演示解釋 Antigravity 2.0 的方向：讓 Agent 從零構(gòu)建一個(gè)可運(yùn)行操作系統(tǒng)。這個(gè)任務(wù)由 93 個(gè)子 Agent 并行執(zhí)行，持續(xù) 12 小時(shí)，發(fā)起超過 1.5 萬次模型請求，處理 26 億 tokens，從空項(xiàng)目生成調(diào)度器、內(nèi)存管理、文件系統(tǒng)等核心模塊。

Google 稱，這件事在 Gemini 3.1 Pro 上無法完成，而使用 Gemini 3.5 Flash 消耗不到 1000 美元 API credits。

現(xiàn)場還演示了這個(gè)系統(tǒng)運(yùn)行 SL 小火車程序和 Doom。由于系統(tǒng)最初缺少視頻和鍵盤驅(qū)動(dòng)，Antigravity 又繼續(xù)生成相關(guān)代碼并修復(fù)，讓 Doom 能夠運(yùn)行。Google 還稱，類似方式已經(jīng)測試過照片編輯套件、實(shí)時(shí)消息應(yīng)用、多用戶協(xié)作平臺等項(xiàng)目，原本需要多天的工程工作被壓縮到數(shù)小時(shí)甚至更短。

Gemini 3.5 Flash 已面向所有用戶開放，覆蓋 Google 產(chǎn)品和 API。Gemini 3.5 Pro 仍在內(nèi)部使用和改進(jìn)中，預(yù)計(jì)下個(gè)月開放。

從搜索框到信息 Agent，Google 重做 AI 搜索

模型和開發(fā)工具之后，Google 把重點(diǎn)轉(zhuǎn)向搜索。Google 搜索也就是 AI 搜索。

Google 表示，AI Mode 已經(jīng)超過 10 億月活，查詢量自推出以來每季度翻倍。

今天起，AI Mode 升級到 Gemini 3.5。新的智能搜索框也從當(dāng)天開始推送。它支持文本、圖片、文件和視頻輸入，并在用戶輸入問題時(shí)給出 AI 建議。

AI Overviews 和 AI Mode 也被合并成更連續(xù)的 AI 搜索體驗(yàn)。用戶可以先在主搜索結(jié)果頁看到 AI 回答，再進(jìn)入 AI Mode 繼續(xù)追問，上下文會被保留。這個(gè)新搜索體驗(yàn)已在發(fā)布會當(dāng)天面向全球桌面端和移動(dòng)端上線。

更大的變化是搜索 Agent。

Google 表示，用戶今年夏天可以在 Search 中創(chuàng)建信息 Agent，讓它持續(xù)跟蹤某類信息。例如，用戶可以讓它監(jiān)控市盈率低于 15、現(xiàn)金流為正、負(fù)債較低的大型生物科技股票；也可以讓它長期跟蹤租房信息、球鞋聯(lián)名和商品上新。當(dāng)條件變化時(shí)，Agent 會給用戶發(fā)送綜合更新。

Google 還把 Antigravity 的 agentic coding 能力帶入搜索。

之后搜索不只返回網(wǎng)頁、摘要或卡片，也能為具體問題生成交互界面。比如用戶問「黑洞如何影響時(shí)空」，Search 可以生成一個(gè)交互式視覺組件；繼續(xù)追問「雙黑洞如何產(chǎn)生引力波」，Search 會重新生成一個(gè)可調(diào)參數(shù)的動(dòng)態(tài)界面。Generative UI with Antigravity 將在今年夏天面向所有用戶免費(fèi)推出。

更復(fù)雜的自定義體驗(yàn)也在路上。

Google 現(xiàn)場展示了一個(gè)周末計(jì)劃器，Search 會結(jié)合天氣、地圖、用戶偏好、Gmail、Calendar 等信息，生成一個(gè)可以繼續(xù)修改、分享和同步日歷的小型工具。這類自定義體驗(yàn)將在未來幾個(gè)月先面向訂閱用戶開放。

關(guān)機(jī)也能跑，Gemini Spark 把 Agent 能力搬進(jìn)個(gè)人生活

消費(fèi)端最重要的新產(chǎn)品是 Gemini Spark。

Gemini Spark 是一個(gè)個(gè)人 AI Agent，運(yùn)行在 Google Cloud 的專用虛擬機(jī)上，可以全天候執(zhí)行任務(wù)。它由 Gemini 3.5 和 Antigravity harness 驅(qū)動(dòng)，支持長時(shí)間后臺任務(wù)。

用戶關(guān)掉電腦后，Spark 仍能繼續(xù)工作。它先接入 Google 自家工具，未來幾周會通過 MCP 接入第三方工具。

發(fā)布會展示了 Spark 的幾個(gè)典型場景。

用戶可以讓它匯總過去一周 Gemini Live 的發(fā)布和進(jìn)展，從 Docs、Gmail 和聊天記錄里提取信息，再用個(gè)人寫作風(fēng)格生成團(tuán)隊(duì)郵件。也可以讓它管理街區(qū)派對，維護(hù) Google Sheets RSVP 表格，跟蹤誰帶了什么東西，給沒報(bào)名的鄰居生成提醒郵件草稿，并自動(dòng)生成 Google Slides 宣傳頁。

Spark 還支持手機(jī)端語音輸入。

用戶可以一次說出多項(xiàng)任務(wù)，比如把所有與 Sundar 的會標(biāo)成亮粉色，給新鄰居寫邀請信，創(chuàng)建孩子學(xué)年結(jié)束前待辦文檔。Spark 會把這些內(nèi)容分成多個(gè)獨(dú)立任務(wù)，并在后臺執(zhí)行，結(jié)果可以在手機(jī)和電腦之間同步。

Gemini Spark 本周面向可信測試者開放，下周以 beta 形式面向美國 Google AI Ultra 訂閱用戶推出。

Google 同時(shí)推出每月 100 美元的新 Ultra 計(jì)劃，并把最高檔 Ultra 計(jì)劃從每月 250 美元降至 200 美元。今年夏天晚些時(shí)候，Spark 將進(jìn)入 Chrome，成為能在網(wǎng)頁中執(zhí)行任務(wù)的智能體瀏覽器。

Gemini App 大改版，還有 Google 版「AI 晨報(bào)」

Gemini App 本身也迎來了一次脫胎換骨的大改版。

Google 引入了全新的設(shè)計(jì)語言 Neural Expressive，加入流體動(dòng)畫、鮮艷色彩、新字體和觸覺反饋。

新版 Gemini App 不再把回答呈現(xiàn)為大段文字，而是會根據(jù)內(nèi)容實(shí)時(shí)生成更適合閱讀和操作的布局，包括交互圖片、時(shí)間線、嵌入式視頻等。Neural Expressive 現(xiàn)在已經(jīng)在 Android、iOS 和網(wǎng)頁端全球推送。

Gemini Live 也被重做，打開后可以直接進(jìn)入實(shí)時(shí)對話。區(qū)域口音選擇將在未來幾周推出。

Gemini App 還加入 Daily Brief。這是一個(gè)面向早晨使用的個(gè)性化摘要 Agent，會綜合 Gmail、Calendar、Tasks 等信息，整理用戶當(dāng)天需要關(guān)注的事項(xiàng)，并給出下一步行動(dòng)入口。

Daily Brief 今天起面向美國 Google AI Plus、Pro 和 Ultra 訂閱用戶推出。

在更大的 Gemini 敘事之外，Google 也更新了幾個(gè)日常產(chǎn)品。

Google Maps 最近完成十年來最大升級，并加入 Ask Maps。它允許用戶提出更長、更復(fù)雜的問題。例如，發(fā)布會舉了一個(gè)場景：孩子掉進(jìn)鴨塘，婚禮 30 分鐘后開始，用戶想知道哪里可以步行買到新裙子。

Docs 也獲得新的語音創(chuàng)建能力。用戶不需要輸入精確提示詞，可以直接用語音把想法說出來，讓 Gemini 從 Drive 調(diào)取簡歷，從 Gmail 找到活動(dòng)信息，再生成 Google Docs 草稿。這個(gè)能力將在今年夏天面向 Pro 和 Ultra 訂閱用戶推出，同類語音能力也會進(jìn)入 Gmail。

生成能力升級后，內(nèi)容來源識別也變得愈發(fā)重要。

Google 稱，SynthID 推出三年來，已為超過 1000 億張圖片和視頻，以及相當(dāng)于 6 萬年時(shí)長的音頻加上不可見水印。接下來，SynthID 和內(nèi)容憑證驗(yàn)證會擴(kuò)展到 Search 和 Chrome。

用戶可以通過圈選搜索，或者在 Chrome 中右鍵詢問內(nèi)容是否由 AI 生成，系統(tǒng)會顯示內(nèi)容來自 AI、相機(jī)，還是曾被生成式 AI 工具編輯。

Google 還宣布，OpenAI、Kakao 和 ElevenLabs 將采用 SynthID 2。此前英偉達(dá)已經(jīng)加入 SynthID 體系。對 Google 來說，SynthID 不只是安全功能，也是爭取 AI 內(nèi)容透明標(biāo)準(zhǔn)的一部分。

Google 創(chuàng)作全家桶，開始圍攻圖片、設(shè)計(jì)和視頻

在創(chuàng)意工具領(lǐng)域，Google 密集發(fā)布了多款重磅產(chǎn)品。

Google Pics 是 Google Workspace 中的新圖片創(chuàng)建和編輯產(chǎn)品，面向派對海報(bào)、信息圖、宣傳圖等場景。用戶可以從一張基礎(chǔ)圖開始，刪除元素、調(diào)整對象大小、編輯文字和翻譯文字。Pics 生成內(nèi)容會帶有 SynthID 水印。Google Pics 將在今年夏天推出。

設(shè)計(jì)產(chǎn)品 Stitch 也迎來更新。用戶可以通過一句 prompt 生成網(wǎng)站或應(yīng)用界面，再通過文字或語音繼續(xù)修改，比如放大標(biāo)題、調(diào)整菜單、突出更多披薩選項(xiàng)。Stitch 支持把設(shè)計(jì)導(dǎo)出為代碼，或直接發(fā)布網(wǎng)站，相關(guān)更新現(xiàn)已發(fā)布。

Google Flow 的更新尤為關(guān)注。Gemini Omni 進(jìn)入 Flow 后，用戶可以基于原始視頻改變環(huán)境、添加視覺效果、加入新角色，同時(shí)盡量保留原有表演。

Flow 還加入新 Agent，支持一次執(zhí)行多個(gè)動(dòng)作。比如從單張圖片生成 16 個(gè)不同機(jī)位的視頻，或把一組清晨場景批量改成深夜場景。

Flow Tools 則允許用戶在 Flow 中創(chuàng)建自己的創(chuàng)意工具，比如視頻特效、手繪動(dòng)畫和文字分層工具，并支持分享和 remix。

Google Flow Music 可以把一段鋼琴 riff 擴(kuò)展成帶風(fēng)格方向的音樂 demo。Google Flow 和 Google Flow Music 的這些新功能已上線。

押注智能眼鏡，Google 再闖下一代入口

硬件部分，Google 也把 Android XR 這個(gè)操作系統(tǒng)級平臺，從頭顯、XR 設(shè)備，進(jìn)一步擴(kuò)展到智能眼鏡形態(tài)。

Android XR 是 Google 與三星合作，并針對 Qualcomm Snapdragon 優(yōu)化的平臺。

Google 表示，AI 眼鏡會分成兩類：一類是帶小型鏡片的顯示眼鏡，另一類是音頻眼鏡。顯示眼鏡去年已在 I/O 展示，今年首批開發(fā)者已經(jīng)開始創(chuàng)建顯示體驗(yàn)，可信測試者計(jì)劃將在今年晚些時(shí)候擴(kuò)大。

更早上市的是音頻眼鏡。

Google 宣布，首批音頻眼鏡將在今年秋季推出，由三星參與硬件和體驗(yàn)構(gòu)建，Warby Parker 與 Gentle Monster 負(fù)責(zé)眼鏡設(shè)計(jì)。這些眼鏡連接手機(jī)，支持 Android 和 iOS。Gemini 的回答通過耳機(jī)私密播放，而不是顯示在鏡片上。

發(fā)布會上，演示者可以通過眼鏡讓 Gemini 導(dǎo)航到上周和朋友見面的地方，中途加入咖啡店；也可以讓 Gemini 打開 DoorDash 自動(dòng)下單咖啡，等待用戶確認(rèn)；

還可以讓它總結(jié)靜音消息，并把家庭晚餐寫入日歷。眼鏡還可以與手表配合，讓用戶拍攝現(xiàn)場照片，并用 Nano Banana 生成卡通圖像，再在手表上預(yù)覽。

發(fā)布會最后，Gemini 的使用場景也延伸到了網(wǎng)絡(luò)安全場景。

Google 介紹了 CodeMender。它是一個(gè)代碼安全 Agent，能夠自動(dòng)尋找和修復(fù)關(guān)鍵軟件漏洞。Google 將邀請一批專家測試 CodeMender API，之后會更廣泛推出。

整場發(fā)布會看下來，信息量大到讓人有些缺氧。只是當(dāng)這些 AI 功能真正開放給幾千萬、幾億人使用時(shí)，一個(gè)最現(xiàn)實(shí)的算賬問題就直接擺在了面前：這筆龐大的算力開銷，Google 要怎么掙回來？

過去二十多年，Google 代表的是一種典型的免費(fèi)互聯(lián)網(wǎng)模式。用戶用注意力和數(shù)據(jù)換服務(wù)，Google 用廣告和分發(fā)賺錢。這套模式讓 Google 成為互聯(lián)網(wǎng)時(shí)代最強(qiáng)的基礎(chǔ)設(shè)施公司。

但大模型推理的成本，和查詢一次搜索結(jié)果完全不在一個(gè)量級。

長上下文記憶、多模態(tài)生成、跨應(yīng)用 Agent、企業(yè)級自動(dòng)化，這些能力背后都是持續(xù)運(yùn)行的算力消耗。AI 越深入，Google 越難繼續(xù)用「免費(fèi)功能升級」的方式來消化成本。

這就是為什么整場發(fā)布會下來， Google I/O 看似講的是體驗(yàn)升級，背后指向的卻是訂閱、企業(yè)合同、算力賬單和長期服務(wù)費(fèi)。

免費(fèi)入口當(dāng)然不會消失，因?yàn)槟侨匀皇?Google 獲取用戶、數(shù)據(jù)和生態(tài)位置的基礎(chǔ)。但在這些入口之上，Google 正在疊加一個(gè)新的智能服務(wù)層：更強(qiáng)的模型、更長的記憶、更深的系統(tǒng)權(quán)限、更復(fù)雜的任務(wù)執(zhí)行，以及更穩(wěn)定的企業(yè)級服務(wù)。

換言之，Google 正在從免費(fèi)互聯(lián)網(wǎng)服務(wù)公司，進(jìn)一步變成 AI 訂閱基礎(chǔ)設(shè)施公司。

只是，問題也隨之而來，用戶愿意為搜索付費(fèi)嗎？通常情況下，不會。

可是，如果這是一個(gè)能替你全天候處理郵件、統(tǒng)籌任務(wù)、分析報(bào)表、接管智能家居，甚至還能幫你寫代碼開發(fā) App 的「超級全能助理」呢？你愿意為它每月掏出幾十上百美元嗎？

這，正是今年 Google I/O 迫切想要驗(yàn)證的核心商業(yè)命題。而環(huán)顧如今狂熱的市場，答案似乎早已不言而喻。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.