![]()
Gemini App 月活超 9 億,月 Token 處理量每月 3200 萬億,Nano Banana 生成超過 500 億張圖片……
在今天凌晨剛剛結(jié)束的 Google I/O 大會上,Google CEO Demis Hassabis 上來就拋出了這些數(shù)字。
過去一年,AI 成了所有行業(yè)的主旋律,Gemini 在 Google 的定位,也開始從一個(gè)獨(dú)一的 App,成了所有 Google 產(chǎn)品里的最重要的 AI 底層能力。
![]()
這次發(fā)布會也先從模型開始,進(jìn)一步帶到 Coding 和 Agent 產(chǎn)品。
Gemini Omni 把 Google 的視頻生成推向「世界模型」方向,Gemini 3.5 Flash 則是和 AI 編程工具一起推向 Agent 開發(fā)平臺。
這兩個(gè)能力隨后進(jìn)入 Google 的完整生態(tài),搜索、Gemini App、Flow、Spark、Chrome、XR 眼鏡和電商場景。
Gemini Omni 登場,視頻界的「Nano Banana」時(shí)刻來了
發(fā)布會最先被重點(diǎn)展開的是 Gemini Omni。
DeepMind CEO 將 Gemini Omni 描述為一個(gè)能夠「從任何輸入創(chuàng)造任何內(nèi)容」的新模型。它把 Gemini 的推理能力與 Google 既有的生成式媒體模型結(jié)合起來,目標(biāo)是提升模型對世界的理解、多模態(tài)生成能力和編輯能力。
![]()
Google 強(qiáng)調(diào),Veo、Nano Banana、Genie 等模型已經(jīng)能生成視頻、圖片和交互式模擬,但 Gemini Omni 更進(jìn)一步,開始處理動(dòng)能、重力等更接近物理世界的問題。
發(fā)布會現(xiàn)場展示的案例包括蛋白質(zhì)折疊解釋視頻。用戶只需要輸入類似「生成一個(gè)關(guān)于蛋白質(zhì)折疊的黏土動(dòng)畫解釋」的提示,Omni 就能把抽象科學(xué)概念轉(zhuǎn)化成視頻內(nèi)容。
![]()
它還支持更自然的視頻編輯。用戶可以上傳自己的視頻,再用對話方式修改風(fēng)格、加入元素、調(diào)整細(xì)節(jié),甚至把一個(gè)普通圓形轉(zhuǎn)成黑洞,把夜晚散步場景變成更具戲劇感的畫面。
![]()
Google 的說法是,Gemini Omni 先從視頻開始,之后會逐步走向「任意輸入到任意輸出」。這也是 Google 一直把 Gemini 設(shè)計(jì)成多模態(tài)模型的原因。
首個(gè) Omni 家族模型 Gemini Omni Flash 已在上線到 Google 產(chǎn)品中,Omni Pro 會在之后公布更多信息。Gemini App 中的 Omni 功能也面向 Google AI Plus、Pro 和 Ultra 訂閱用戶開放。
![]()
這意味著,Gemini Omni 不只是一個(gè)視頻生成模型。Google 想把它放進(jìn)「世界模型」的敘事里:模型不僅生成畫面,還要理解畫面中的物理關(guān)系、運(yùn)動(dòng)關(guān)系和場景邏輯。
在進(jìn)入 Gemini App、Google Flow 和 YouTube Shorts 這些應(yīng)用之后, Omni 也會讓 Google 的生成式創(chuàng)作工具從圖片編輯擴(kuò)展到視頻編輯。
Gemini 3.5 Flash 上線,AI 寫代碼進(jìn)入極速模式
如果 Gemini Omni 對應(yīng)的是生成和編輯,Gemini 3.5 Flash 對應(yīng)的就是速度、成本和執(zhí)行能力。
![]()
Google 在發(fā)布會上推出 Gemini 3.5 Flash,稱它是 Gemini 3.5 系列第一批模型之一,重點(diǎn)面向 agentic coding、長周期任務(wù)和真實(shí)工作流。
相比 3.1 Pro,3.5 Flash 在幾乎所有基準(zhǔn)測試中提升明顯,尤其是代碼能力,以及 GDPVal 這類更接近真實(shí)經(jīng)濟(jì)任務(wù)的評測。
Google 還強(qiáng)調(diào),3.5 Flash 在輸出 tokens 速度上比其他前沿模型快 4 倍,在 Antigravity 中經(jīng)過專門優(yōu)化后,速度可達(dá)到 12 倍。
![]()
值得一提的是,今年 3 月,Google 內(nèi)部開發(fā)相關(guān)任務(wù)每天處理約 5000 億 tokens,之后每隔幾周翻倍,目前已經(jīng)超過每天 3 萬億 tokens。Google 把這稱為一個(gè)反饋循環(huán),用大規(guī)模真實(shí)使用繼續(xù)改進(jìn) 3.5 Flash。
與模型同步推出的是 Antigravity 2.0。
它從原來的 agent powered IDE,升級為一個(gè)獨(dú)立桌面應(yīng)用,重點(diǎn)轉(zhuǎn)向 agent first。用戶不再只是讓 AI 在編輯器里輔助寫代碼,而是通過 Agent 對話、Agent 產(chǎn)物和多 Agent 協(xié)同來完成開發(fā)任務(wù)。
![]()
Antigravity 2.0 加入完整 CLI、Antigravity SDK、Gemini 音頻模型原生語音支持,并集成 Android、Firebase、Google AI Studio 等服務(wù)。Antigravity 2.0 作為獨(dú)立桌面應(yīng)用,也已經(jīng)面向全球用戶開放。
Google 在現(xiàn)場用一個(gè)高強(qiáng)度演示解釋 Antigravity 2.0 的方向:讓 Agent 從零構(gòu)建一個(gè)可運(yùn)行操作系統(tǒng)。這個(gè)任務(wù)由 93 個(gè)子 Agent 并行執(zhí)行,持續(xù) 12 小時(shí),發(fā)起超過 1.5 萬次模型請求,處理 26 億 tokens,從空項(xiàng)目生成調(diào)度器、內(nèi)存管理、文件系統(tǒng)等核心模塊。
![]()
Google 稱,這件事在 Gemini 3.1 Pro 上無法完成,而使用 Gemini 3.5 Flash 消耗不到 1000 美元 API credits。
現(xiàn)場還演示了這個(gè)系統(tǒng)運(yùn)行 SL 小火車程序和 Doom。由于系統(tǒng)最初缺少視頻和鍵盤驅(qū)動(dòng),Antigravity 又繼續(xù)生成相關(guān)代碼并修復(fù),讓 Doom 能夠運(yùn)行。Google 還稱,類似方式已經(jīng)測試過照片編輯套件、實(shí)時(shí)消息應(yīng)用、多用戶協(xié)作平臺等項(xiàng)目,原本需要多天的工程工作被壓縮到數(shù)小時(shí)甚至更短。
Gemini 3.5 Flash 已面向所有用戶開放,覆蓋 Google 產(chǎn)品和 API。Gemini 3.5 Pro 仍在內(nèi)部使用和改進(jìn)中,預(yù)計(jì)下個(gè)月開放。
從搜索框到信息 Agent,Google 重做 AI 搜索
模型和開發(fā)工具之后,Google 把重點(diǎn)轉(zhuǎn)向搜索。Google 搜索也就是 AI 搜索。
![]()
Google 表示,AI Mode 已經(jīng)超過 10 億月活,查詢量自推出以來每季度翻倍。
今天起,AI Mode 升級到 Gemini 3.5。新的智能搜索框也從當(dāng)天開始推送。它支持文本、圖片、文件和視頻輸入,并在用戶輸入問題時(shí)給出 AI 建議。
![]()
AI Overviews 和 AI Mode 也被合并成更連續(xù)的 AI 搜索體驗(yàn)。用戶可以先在主搜索結(jié)果頁看到 AI 回答,再進(jìn)入 AI Mode 繼續(xù)追問,上下文會被保留。這個(gè)新搜索體驗(yàn)已在發(fā)布會當(dāng)天面向全球桌面端和移動(dòng)端上線。
![]()
更大的變化是搜索 Agent。
Google 表示,用戶今年夏天可以在 Search 中創(chuàng)建信息 Agent,讓它持續(xù)跟蹤某類信息。例如,用戶可以讓它監(jiān)控市盈率低于 15、現(xiàn)金流為正、負(fù)債較低的大型生物科技股票;也可以讓它長期跟蹤租房信息、球鞋聯(lián)名和商品上新。當(dāng)條件變化時(shí),Agent 會給用戶發(fā)送綜合更新。
![]()
Google 還把 Antigravity 的 agentic coding 能力帶入搜索。
之后搜索不只返回網(wǎng)頁、摘要或卡片,也能為具體問題生成交互界面。比如用戶問「黑洞如何影響時(shí)空」,Search 可以生成一個(gè)交互式視覺組件;繼續(xù)追問「雙黑洞如何產(chǎn)生引力波」,Search 會重新生成一個(gè)可調(diào)參數(shù)的動(dòng)態(tài)界面。Generative UI with Antigravity 將在今年夏天面向所有用戶免費(fèi)推出。
![]()
更復(fù)雜的自定義體驗(yàn)也在路上。
Google 現(xiàn)場展示了一個(gè)周末計(jì)劃器,Search 會結(jié)合天氣、地圖、用戶偏好、Gmail、Calendar 等信息,生成一個(gè)可以繼續(xù)修改、分享和同步日歷的小型工具。這類自定義體驗(yàn)將在未來幾個(gè)月先面向訂閱用戶開放。
關(guān)機(jī)也能跑,Gemini Spark 把 Agent 能力搬進(jìn)個(gè)人生活
消費(fèi)端最重要的新產(chǎn)品是 Gemini Spark。
![]()
Gemini Spark 是一個(gè)個(gè)人 AI Agent,運(yùn)行在 Google Cloud 的專用虛擬機(jī)上,可以全天候執(zhí)行任務(wù)。它由 Gemini 3.5 和 Antigravity harness 驅(qū)動(dòng),支持長時(shí)間后臺任務(wù)。
用戶關(guān)掉電腦后,Spark 仍能繼續(xù)工作。它先接入 Google 自家工具,未來幾周會通過 MCP 接入第三方工具。
![]()
發(fā)布會展示了 Spark 的幾個(gè)典型場景。
用戶可以讓它匯總過去一周 Gemini Live 的發(fā)布和進(jìn)展,從 Docs、Gmail 和聊天記錄里提取信息,再用個(gè)人寫作風(fēng)格生成團(tuán)隊(duì)郵件。也可以讓它管理街區(qū)派對,維護(hù) Google Sheets RSVP 表格,跟蹤誰帶了什么東西,給沒報(bào)名的鄰居生成提醒郵件草稿,并自動(dòng)生成 Google Slides 宣傳頁。
![]()
Spark 還支持手機(jī)端語音輸入。
用戶可以一次說出多項(xiàng)任務(wù),比如把所有與 Sundar 的會標(biāo)成亮粉色,給新鄰居寫邀請信,創(chuàng)建孩子學(xué)年結(jié)束前待辦文檔。Spark 會把這些內(nèi)容分成多個(gè)獨(dú)立任務(wù),并在后臺執(zhí)行,結(jié)果可以在手機(jī)和電腦之間同步。
Gemini Spark 本周面向可信測試者開放,下周以 beta 形式面向美國 Google AI Ultra 訂閱用戶推出。
![]()
Google 同時(shí)推出每月 100 美元的新 Ultra 計(jì)劃,并把最高檔 Ultra 計(jì)劃從每月 250 美元降至 200 美元。今年夏天晚些時(shí)候,Spark 將進(jìn)入 Chrome,成為能在網(wǎng)頁中執(zhí)行任務(wù)的智能體瀏覽器。
![]()
Gemini App 大改版,還有 Google 版「AI 晨報(bào)」
Gemini App 本身也迎來了一次脫胎換骨的大改版。
Google 引入了全新的設(shè)計(jì)語言 Neural Expressive,加入流體動(dòng)畫、鮮艷色彩、新字體和觸覺反饋。
新版 Gemini App 不再把回答呈現(xiàn)為大段文字,而是會根據(jù)內(nèi)容實(shí)時(shí)生成更適合閱讀和操作的布局,包括交互圖片、時(shí)間線、嵌入式視頻等。Neural Expressive 現(xiàn)在已經(jīng)在 Android、iOS 和網(wǎng)頁端全球推送。
![]()
Gemini Live 也被重做,打開后可以直接進(jìn)入實(shí)時(shí)對話。區(qū)域口音選擇將在未來幾周推出。
Gemini App 還加入 Daily Brief。這是一個(gè)面向早晨使用的個(gè)性化摘要 Agent,會綜合 Gmail、Calendar、Tasks 等信息,整理用戶當(dāng)天需要關(guān)注的事項(xiàng),并給出下一步行動(dòng)入口。
![]()
Daily Brief 今天起面向美國 Google AI Plus、Pro 和 Ultra 訂閱用戶推出。
在更大的 Gemini 敘事之外,Google 也更新了幾個(gè)日常產(chǎn)品。
Google Maps 最近完成十年來最大升級,并加入 Ask Maps。它允許用戶提出更長、更復(fù)雜的問題。例如,發(fā)布會舉了一個(gè)場景:孩子掉進(jìn)鴨塘,婚禮 30 分鐘后開始,用戶想知道哪里可以步行買到新裙子。
![]()
Docs 也獲得新的語音創(chuàng)建能力。用戶不需要輸入精確提示詞,可以直接用語音把想法說出來,讓 Gemini 從 Drive 調(diào)取簡歷,從 Gmail 找到活動(dòng)信息,再生成 Google Docs 草稿。這個(gè)能力將在今年夏天面向 Pro 和 Ultra 訂閱用戶推出,同類語音能力也會進(jìn)入 Gmail。
生成能力升級后,內(nèi)容來源識別也變得愈發(fā)重要。
Google 稱,SynthID 推出三年來,已為超過 1000 億張圖片和視頻,以及相當(dāng)于 6 萬年時(shí)長的音頻加上不可見水印。接下來,SynthID 和內(nèi)容憑證驗(yàn)證會擴(kuò)展到 Search 和 Chrome。
![]()
用戶可以通過圈選搜索,或者在 Chrome 中右鍵詢問內(nèi)容是否由 AI 生成,系統(tǒng)會顯示內(nèi)容來自 AI、相機(jī),還是曾被生成式 AI 工具編輯。
Google 還宣布,OpenAI、Kakao 和 ElevenLabs 將采用 SynthID 2。此前英偉達(dá)已經(jīng)加入 SynthID 體系。對 Google 來說,SynthID 不只是安全功能,也是爭取 AI 內(nèi)容透明標(biāo)準(zhǔn)的一部分。
![]()
Google 創(chuàng)作全家桶,開始圍攻圖片、設(shè)計(jì)和視頻
在創(chuàng)意工具領(lǐng)域,Google 密集發(fā)布了多款重磅產(chǎn)品。
Google Pics 是 Google Workspace 中的新圖片創(chuàng)建和編輯產(chǎn)品,面向派對海報(bào)、信息圖、宣傳圖等場景。用戶可以從一張基礎(chǔ)圖開始,刪除元素、調(diào)整對象大小、編輯文字和翻譯文字。Pics 生成內(nèi)容會帶有 SynthID 水印。Google Pics 將在今年夏天推出。
![]()
設(shè)計(jì)產(chǎn)品 Stitch 也迎來更新。用戶可以通過一句 prompt 生成網(wǎng)站或應(yīng)用界面,再通過文字或語音繼續(xù)修改,比如放大標(biāo)題、調(diào)整菜單、突出更多披薩選項(xiàng)。Stitch 支持把設(shè)計(jì)導(dǎo)出為代碼,或直接發(fā)布網(wǎng)站,相關(guān)更新現(xiàn)已發(fā)布。
![]()
Google Flow 的更新尤為關(guān)注。Gemini Omni 進(jìn)入 Flow 后,用戶可以基于原始視頻改變環(huán)境、添加視覺效果、加入新角色,同時(shí)盡量保留原有表演。
Flow 還加入新 Agent,支持一次執(zhí)行多個(gè)動(dòng)作。比如從單張圖片生成 16 個(gè)不同機(jī)位的視頻,或把一組清晨場景批量改成深夜場景。
![]()
Flow Tools 則允許用戶在 Flow 中創(chuàng)建自己的創(chuàng)意工具,比如視頻特效、手繪動(dòng)畫和文字分層工具,并支持分享和 remix。
Google Flow Music 可以把一段鋼琴 riff 擴(kuò)展成帶風(fēng)格方向的音樂 demo。Google Flow 和 Google Flow Music 的這些新功能已上線。
押注智能眼鏡,Google 再闖下一代入口
硬件部分,Google 也把 Android XR 這個(gè)操作系統(tǒng)級平臺,從頭顯、XR 設(shè)備,進(jìn)一步擴(kuò)展到智能眼鏡形態(tài)。
Android XR 是 Google 與三星合作,并針對 Qualcomm Snapdragon 優(yōu)化的平臺。
![]()
Google 表示,AI 眼鏡會分成兩類:一類是帶小型鏡片的顯示眼鏡,另一類是音頻眼鏡。顯示眼鏡去年已在 I/O 展示,今年首批開發(fā)者已經(jīng)開始創(chuàng)建顯示體驗(yàn),可信測試者計(jì)劃將在今年晚些時(shí)候擴(kuò)大。
更早上市的是音頻眼鏡。
Google 宣布,首批音頻眼鏡將在今年秋季推出,由三星參與硬件和體驗(yàn)構(gòu)建,Warby Parker 與 Gentle Monster 負(fù)責(zé)眼鏡設(shè)計(jì)。這些眼鏡連接手機(jī),支持 Android 和 iOS。Gemini 的回答通過耳機(jī)私密播放,而不是顯示在鏡片上。
![]()
發(fā)布會上,演示者可以通過眼鏡讓 Gemini 導(dǎo)航到上周和朋友見面的地方,中途加入咖啡店;也可以讓 Gemini 打開 DoorDash 自動(dòng)下單咖啡,等待用戶確認(rèn);
還可以讓它總結(jié)靜音消息,并把家庭晚餐寫入日歷。眼鏡還可以與手表配合,讓用戶拍攝現(xiàn)場照片,并用 Nano Banana 生成卡通圖像,再在手表上預(yù)覽。
![]()
發(fā)布會最后,Gemini 的使用場景也延伸到了網(wǎng)絡(luò)安全場景。
Google 介紹了 CodeMender。它是一個(gè)代碼安全 Agent,能夠自動(dòng)尋找和修復(fù)關(guān)鍵軟件漏洞。Google 將邀請一批專家測試 CodeMender API,之后會更廣泛推出。
![]()
整場發(fā)布會看下來,信息量大到讓人有些缺氧。只是當(dāng)這些 AI 功能真正開放給幾千萬、幾億人使用時(shí),一個(gè)最現(xiàn)實(shí)的算賬問題就直接擺在了面前:這筆龐大的算力開銷,Google 要怎么掙回來?
過去二十多年,Google 代表的是一種典型的免費(fèi)互聯(lián)網(wǎng)模式。用戶用注意力和數(shù)據(jù)換服務(wù),Google 用廣告和分發(fā)賺錢。這套模式讓 Google 成為互聯(lián)網(wǎng)時(shí)代最強(qiáng)的基礎(chǔ)設(shè)施公司。
但大模型推理的成本,和查詢一次搜索結(jié)果完全不在一個(gè)量級。
長上下文記憶、多模態(tài)生成、跨應(yīng)用 Agent、企業(yè)級自動(dòng)化,這些能力背后都是持續(xù)運(yùn)行的算力消耗。AI 越深入,Google 越難繼續(xù)用「免費(fèi)功能升級」的方式來消化成本。
這就是為什么整場發(fā)布會下來, Google I/O 看似講的是體驗(yàn)升級,背后指向的卻是訂閱、企業(yè)合同、算力賬單和長期服務(wù)費(fèi)。
![]()
免費(fèi)入口當(dāng)然不會消失,因?yàn)槟侨匀皇?Google 獲取用戶、數(shù)據(jù)和生態(tài)位置的基礎(chǔ)。但在這些入口之上,Google 正在疊加一個(gè)新的智能服務(wù)層:更強(qiáng)的模型、更長的記憶、更深的系統(tǒng)權(quán)限、更復(fù)雜的任務(wù)執(zhí)行,以及更穩(wěn)定的企業(yè)級服務(wù)。
換言之,Google 正在從免費(fèi)互聯(lián)網(wǎng)服務(wù)公司,進(jìn)一步變成 AI 訂閱基礎(chǔ)設(shè)施公司。
只是,問題也隨之而來,用戶愿意為搜索付費(fèi)嗎?通常情況下,不會。
可是,如果這是一個(gè)能替你全天候處理郵件、統(tǒng)籌任務(wù)、分析報(bào)表、接管智能家居,甚至還能幫你寫代碼開發(fā) App 的「超級全能助理」呢?你愿意為它每月掏出幾十上百美元嗎?
這,正是今年 Google I/O 迫切想要驗(yàn)證的核心商業(yè)命題。而環(huán)顧如今狂熱的市場,答案似乎早已不言而喻。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.