![]()
出品|《態度》
作者|袁寧 丁廣勝
山景城海岸線劇場,再次成為全球科技圈的焦點。
北京時間5月20日凌晨1點,2026 Google I/O正式登場。這個可以容納兩萬多人的露天劇場,每年都一票難求。主會場坐滿后,甚至有不少人坐到山坡草坪上,遠遠望向舞臺,等待Google這位頂尖玩家亮牌。
現場的氣氛并不像一場傳統開發者大會,更像一場巨大的科技派對。走進入口,工作人員會熱情地和與會者擊掌;入口附近有室外樂隊表演;劇場外則是大片Demo展區,Google各條業務線和合作伙伴都在展示自己的最新產品與應用,比如來自中國的Xreal。開發者、媒體、創業者、投資人和合作伙伴穿梭其中,所有人都在等待同一個問題的答案:
在大模型競爭進入智能體階段后,Google準備怎么出牌?
過去一年,AI行業的敘事發生了明顯變化。OpenAI 依然是焦點,但 Anthropic 正在變得越來越 “搶鏡”。據我們了解,某種程度上,Google 的“假想敵”已經不再只是 OpenAI,也開始越來越多地指向 Anthropic。
今天凌晨,Google CEO Sundar Pichai 給出了這次大會的核心敘事:“Gemini 3.5和 Antigravity 正在開啟一個智能體和智能體能力的新世界。我們已經把智能體帶給開發者和企業一段時間了。現在,我們非常專注于把智能體的力量,以安全、可靠的方式帶給消費者,讓它適用于每一個人。”
在這次 I/O 上,Google 幾乎把所有核心業務線都重新用“智能體”串了一遍:從 Gemini 3.5 Flash,到 Gemini Omni Flash;從 Search 里的信息智能體、預訂智能體,到 Gemini App 里的24/7個人智能體 Gemini Spark;從開發者平臺 Antigravity,到購物場景里的 Universal Cart;再到 Workspace、YouTube、Flow、Android、Cloud 以及內容溯源工具。
我們看到,Google試圖把 AI 從“回答問題的模型”,推進到“持續理解、規劃、執行任務的系統”。可以說,2026 Google I/O,是 Google 全面押注 Agentic AI 的一次集中展示。
01 Gemini 3.5 Flash 登場:速度快4倍,“會行動的模型”將成默認入口
本屆 I/O 最受關注,也是最核心的技術發布,依舊是Gemini。
但并非大家期待的Gemini 4,Google 發布了 Gemini 3.5模型家族的首個成員 Gemini 3.5 Flash。Google 將其定義為“結合前沿智能與行動能力”的新一代模型,主打兩個關鍵詞:智能體能力和速度。
按照 Google 的說法,Gemini 3.5 Flash 是其目前最強的智能體和代碼模型,在復雜長周期任務、代碼生成、多模態理解等方面均有顯著提升。Google 給出的 benchmark 包括:Terminal-Bench 2.1達到76.2%,GDPval-AA 達到1656 Elo,MCP Atlas 達到83.6%,CharXiv Reasoning 達到84.2%。
更重要的是,Google 強調3.5 Flash 在輸出速度上比其他前沿模型快4倍。這意味著它并不是單純追求“更強大模型”的路線,而是試圖在能力、延遲和成本之間找到一個更適合大規模產品化的平衡點。
![]()
這也解釋了為什么 Google 首發的是 Flash,而不是 Pro。
過去大模型競爭強調“誰更強”,但進入2026年,產品化競爭更看重“誰能以更低延遲、更低成本、更穩定地服務海量用戶”。Flash 的定位正好契合這一點:能力足夠強,同時可以大規模鋪進搜索、App、開發者工具和企業平臺。
根據 Google 的安排,Gemini 3.5 Flash 將進入多個核心場景:
● 面向普通用戶,成為 Gemini App 和 Google Search AI Mode 的默認模型;
● 面向開發者,進入 Google Antigravity、Gemini API、Google AI Studio 和 Android Studio;
● 面向企業,進入 Gemini Enterprise Agent Platform 和 Gemini Enterprise。
據現場透露,Gemini 3.5 Pro 已在內部使用,計劃于下個月推出。這意味著 Google 會先用 Flash 承接規模化需求,再用 Pro 服務更復雜的高階任務。
02 Gemini Omni Flash:從“理解多模態”走向“生成任意模態”
如果 Gemini 3.5 Flash 代表 Google 對“行動模型”的押注,那么 Gemini Omni Flash 則代表 Google 在多模態生成上的新野心。
Google 對 Omni 的定義非常直接:可以從任何輸入生成任何輸出的模型,首先從視頻開始。這句話背后,是多模態 AI 的范式變化。
過去的多模態更多是“輸入多模態”:模型可以看圖、聽音頻、理解視頻,再用文字回答。但 Gemini Omni 要做的是“輸入和輸出都多模態”。用戶可以用文本、圖片、音頻、視頻作為輸入,再生成高質量視頻。未來,它還會支持圖像和音頻等更多輸出形式。
![]()
它的核心能力包括三類。
● 第一,是通過自然語言編輯視頻。用戶可以連續對視頻提出修改要求,比如改變環境、角度、動作、風格,甚至加入角色和物體。Google 強調,Omni 可以在多輪對話中保持角色一致性、物理邏輯和場景連續性。
● 第二,是基于 Gemini 的世界知識生成視頻。Google 表示,Omni 不只是生成“看起來真實”的畫面,而是能結合物理、歷史、科學和文化語境,生成更有邏輯的視覺敘事。例如更準確地表現重力、動能、流體等物理效果,或者把復雜概念轉化為解釋型視頻。
● 第三,是從任意素材開始創作。用戶可以把文本、圖片、視頻,甚至語音作為參考輸入,生成統一風格的視頻內容。初期音頻輸入主要支持語音參考,更多音頻類型會在之后推出。
值得注意的是,Google 還提到了數字化身功能。用戶可以使用自己的聲音創建個人 avatar,讓生成視頻看起來和聽起來像自己。但在視頻編輯中修改音頻和語音的能力,Google 表示仍在測試,以更謹慎地處理潛在風險。
在內容安全方面,Omni 生成的視頻將包含不可感知的 SynthID 數字水印。用戶可以通過 Gemini App、Chrome 中的 Gemini 以及 Google Search 驗證視頻是否由 Gemini Omni 生成。
![]()
(Sundar Pichai調侃他不吃漢堡,這是假圖)
從發布節奏看,Gemini Omni Flash 會向 Google AI Plus、Pro 和 Ultra 訂閱用戶全球推出,也會從本周起在 YouTube Shorts 和 YouTube Create App 中向用戶免費開放。未來數周內,Google 還將把它通過 API 提供給開發者和企業客戶。
這意味著,Google 不只是想做一個視頻生成工具,而是想把視頻生成能力嵌入整個創作者生態:Gemini 負責個人創作入口,Flow 負責專業工作流,YouTube Shorts 負責分發場景。
這套閉環,正是 Google 相比許多純 AI 創業公司的優勢所在。
03 Gemini App 變成24/7個人助理:Gemini Spark 是關鍵
Gemini App 也在這次 I/O 上迎來大更新。
Sundar Pichai 透露,過去一年 Gemini App 增長迅速:去年 Google I/O 時,Gemini 有4億用戶;今年月活已經超過9億,覆蓋230個國家和地區、70多種語言。
新的 Gemini App 有幾個重點變化。
● 首先是設計語言升級。Google 推出了新的 Neural Expressive 設計語言,包括更流暢的動畫、更鮮明的顏色、新字體和觸覺反饋。Gemini Live 也被直接整合進 Gemini,用戶可以在文字提問和語音對話之間無縫切換。
● 其次是回答形態的變化。Gemini 不再只是輸出長文本,而是可以根據問題實時設計答案形式,加入圖片、交互式時間線、旁白視頻和動態圖形。
● 第三,也是最重要的,是兩個智能體功能:Daily Brief 和 Gemini Spark。
Daily Brief 是一個個性化晨間簡報智能體,可以幫助用戶整理每天開始前需要知道的信息。
Gemini Spark 則是 Google 面向消費者推出的個人 AI agent。它會24/7運行,在用戶授權和指令下幫助管理任務、處理數字生活。
![]()
此外,macOS 版 Gemini App 也會集成 Gemini Spark,使其可以在本地機器上執行操作,并加入更強的語音功能。
Google 計劃先向 trusted testers 推出 Gemini Spark,并在下周面向美國 Google AI Ultra 用戶推出 Beta。macOS 版 Gemini App 未來也會集成 Gemini Spark,使其可以在本地機器上執行操作。
這對 Google 很重要。因為它擁有 Gmail、Calendar、Photos、Drive、Chrome、Android、Search、Maps 等高頻產品。如果 Gemini Spark 能在用戶授權下調動這些服務,它就不只是聊天機器人,而可能成為真正的個人任務調度層。
同時,Google 宣布推出 每月100美元的 AI Ultra 計劃,同時為 AI Plus、Pro 和 Ultra 訂閱用戶增加新功能和權益。
04 Search 迎來25年最大改版:搜索框變成智能體入口
Google I/O 的另一個重磅更新,是 Search。
據介紹,新的搜索框會動態擴展,允許用戶輸入更復雜、更自然的問題;它可以給出 AI 驅動的問題建議,不再只是傳統 autocomplete;它還支持多模態輸入,包括文本、圖片、文件、視頻和 Chrome 標簽頁。
更核心的是,Google 正在把 Search 從“找答案”變成“派任務”。
首先,AI Mode 將使用 Gemini 3.5 Flash 作為全球默認模型。用戶可以從 AI Overview 直接繼續追問,進入 AI Mode 的對話式體驗,并保留上下文。
其次,Google 推出了 Search agents。這類智能體可以在后臺24/7運行,持續跟蹤用戶關心的信息,并在合適時間給出綜合更新。
![]()
比如,你正在找房,可以告訴 Search 預算、位置、戶型、通勤和其他條件,信息智能體會持續掃描網頁、新聞、博客、社交信息,以及金融、購物、體育等實時數據,一旦發現匹配結果就通知用戶。又比如,你關注某位運動員和品牌聯名的球鞋,智能體也可以在新產品發布時提醒。
這類信息智能體將率先在今年夏天面向 Google AI Pro 和 Ultra 訂閱用戶推出。
Google 還在擴展 Search 中的 agentic booking 能力。用戶可以讓 Search 幫忙尋找并預訂本地服務,比如周五晚上可容納六人、供應夜宵的私人 KTV 包間。Search 會整合最新價格和可用性,并給出直接預訂鏈接。
在家政維修、美容、寵物護理等部分品類中,用戶還可以讓 Google 代為給商家打電話。這些能力將于今年夏天在美國面向所有用戶推出。
更有想象空間的是,Search 還將獲得“生成式 UI”和“迷你應用”能力。
借助 Gemini 3.5 Flash 的代碼能力,以及 Antigravity 的智能體開發能力,Search 可以根據用戶問題即時生成交互界面。比如,當用戶想理解天體物理問題,或者想看懂機械表運行原理,Search 可以自動生成包含圖表、表格、模擬器、交互組件的定制答案。
更進一步,對于長期任務,比如婚禮籌備、搬家管理、健康計劃,Search 可以生成一個可持續使用的 dashboard 或 tracker。Google 把這類體驗稱為用戶專屬的 mini apps。
這其實是對搜索產品形態的一次根本改寫。
過去,搜索結果頁的核心是鏈接、摘要和廣告。未來,它可能變成一個動態生成的任務操作臺:既能理解問題,也能生成工具,還能持續跟蹤狀態。
對 Google 來說,這既是防守,也是進攻。防守在于,AI 聊天產品正在侵蝕傳統搜索入口;進攻在于,Google 試圖用智能體把搜索重新定義為更強的任務入口。
05 AI 購物:Universal Cart 是 Google 的“智能體商業化”試驗田
AI 時代,Google 最大的問題之一是:如果搜索結果不再以鏈接為核心,廣告和商業化怎么辦?
本屆 I/O 給出的答案之一,是 agentic commerce,也就是智能體購物。
Google 宣布推出 Universal Cart,一個智能購物車,也是用戶在 Google 上進行 AI 購物的中心。
購物天然適合智能體。
因為用戶真實的購物需求往往很復雜,不是一個關鍵詞能解決的。比如買一臺適合出差的輕薄本,用戶關心的不只是價格,還包括重量、續航、性能、接口、品牌、售后、優惠、庫存、配送時間和用戶評價。傳統搜索需要用戶反復篩選,智能體則可以持續比較、監控價格、組合商品,甚至協助完成購買。
Universal Cart 的價值就在這里:它可能把 Search、Shopping、廣告、商家數據和支付鏈路連接起來,讓 AI 不只是推薦商品,而是參與購物決策和交易流程。
這對 Google 具有戰略意義。
![]()
過去,搜索廣告的核心是用戶點擊鏈接,然后跳轉到商家頁面。AI 搜索如果減少了用戶點擊,Google 就需要新的商業閉環。智能體購物可能成為一種新路徑:Google 從信息分發者,變成交易決策和執行過程中的參與者。
但它也會帶來新問題:AI 推薦商品時如何排序?是否會偏向廣告主?用戶如何知道推薦依據?商家如何適配這種新渠道?這些都將影響 AI 購物能否建立信任。
06從 Android Halo 到 Antigravity:Gemini 正成為系統級基礎設施
當智能體開始替用戶執行任務,Google 必須重新定義 AI 在系統里的位置。
一個很直接的問題是:如果 AI 不只是回答問題,而是開始幫你搜索、預訂、整理、生成、比較價格、管理日程,用戶怎么知道它正在做什么?又該在哪里暫停、查看或接管?
Google 給出的答案之一,是 Android Halo。
這是一個將在今年晚些時候上線的 Android 新能力,用來在手機屏幕頂部顯示智能體正在處理的任務。你可以把 Android Halo 理解為智能體時代的狀態欄。
過去,狀態欄顯示的是時間、電量、信號、通知;到了 AI 時代,系統還需要顯示“你的智能體正在做什么”。比如它正在搜索航班、整理文檔、比較商品、生成視頻、聯系商家,或者后臺持續追蹤某個任務。
這也說明,Google 對智能體的理解并不是單點應用,而是系統級能力。模型、應用、搜索、瀏覽器、操作系統之間的邊界會越來越模糊,真正的競爭會發生在“誰能成為用戶所有任務的調度層”。
如果 Android Halo 解決的是“用戶如何看見和控制智能體”,那么 Antigravity 解決的就是“開發者如何構建智能體”。
Google 顯然不希望智能體能力只留在自家產品里。除了 Search、Gemini App 和 AI 購物,Google 還希望通過 Antigravity,把 Gemini 的能力交給開發者。
Antigravity 可以理解為 Google 面向 agentic AI 時代的開發平臺。它的重點不是簡單調用一個大模型接口,而是讓開發者能夠構建、調度和部署多個協作式智能體。
![]()
過去的 AI 開發,很多時候是“應用調用模型”:用戶輸入問題,模型返回答案。但智能體時代的開發邏輯更復雜。開發者需要讓 AI 理解目標、拆解步驟、調用工具、訪問數據、執行動作、檢查結果,并在必要時繼續迭代。
這就要求平臺不只是提供模型,還要提供工作流、權限、工具調用、記憶、評估和部署能力。
Antigravity 的價值就在這里:它想把 Gemini 從一個可調用的模型,變成一個可開發、可組合、可部署的智能體平臺。
這對 Google 很關鍵。因為智能體時代不可能只靠 Google 自己開發應用。真正的爆發,需要開發者基于 Gemini 做出大量新工具、新插件、新工作流和新應用。只有開發者生態起來,Gemini 才能從 Google 自己的產品矩陣,延伸到更廣泛的軟件世界。
與此同時,Google 自己的“全家桶”也在繼續 AI 化。
● 在 Workspace 里,Gemini 會繼續進入 Gmail、Docs、Sheets、Slides、Meet 等辦公場景,幫助用戶寫郵件、總結文檔、整理會議、生成表格、制作演示和管理任務。對企業用戶來說,這不是單點功能,而是把 AI 嵌進日常辦公流。
● 在 YouTube 里,Gemini Omni Flash 和視頻生成能力會進一步參與內容創作,尤其是 Shorts。創作者可以用 AI 生成素材、修改鏡頭、調整風格,甚至把一個創意快速變成短視頻內容。
● 在 Flow 里,Google 更明確地把 AI 視頻生成做成創作工作流。相比一次性生成視頻,Flow 的價值在于連續編輯、分鏡管理和多輪調整,讓 AI 視頻從“玩具”變成更接近專業生產的工具。
● 在 Pics / Photos 相關場景里,AI 會繼續承擔圖片生成、圖片編輯、視覺理解和內容整理的角色。用戶不再只是保存照片,而是可以讓 AI 幫忙修圖、生成回憶、提取信息,甚至圍繞圖片繼續創作內容。
這些產品看似分散,但背后邏輯是一致的:Google 正在把 Gemini 放進每一個高頻場景。
07 Google 的真正意圖:把 AI 做成下一代操作層
把本屆 I/O 的發布串起來,Google 的路線已經非常清楚。它不是單獨發布幾個 AI 功能,而是在搭建一套智能體時代的完整系統:
● 模型層:Gemini 3.5 Flash 負責行動和代碼,Gemini Omni Flash 負責多模態生成;
● 工具層:Antigravity、Gemini API、AI Studio、Android Studio 服務開發者;
● 入口層:Search、Gemini App、Android、Chrome、Workspace、YouTube、Shopping 承接用戶場景;
● 商業層:AI Ultra、AI Plus、Pro、Universal Cart 和企業服務負責變現;
● 基礎設施層:Google Cloud、TPU 和 Enterprise Agent Platform 支撐大規模部署;
● 治理層:SynthID、水印驗證、內容透明、安全框架和用戶授權控制風險。
而未來,Search 不再只是搜索結果頁,而是任務入口;Gemini 不再只是聊天助手,而是個人 agent;Android 不再只是應用平臺,而是智能體運行環境;Shopping 不再只是商品索引,而是交易智能體;Cloud 不再只是算力租賃,而是企業智能體平臺。
當然,Google 的挑戰也很現實。
智能體要真正替用戶行動,必須解決可靠性、隱私、安全、權限、誤操作、可解釋性和商業利益沖突等問題。尤其在搜索、購物、預訂和個人數據場景中,一次錯誤推薦、一次誤撥電話、一次不合適的自動操作,都可能損害用戶信任。
從2026年 Google I/O 看,Google 想定義的新階段已經很明確:智能體不再只是產品功能,而會成為新的基礎設施;AI 不再只是信息工具,而會變成下一代操作層。
![]()
(Google I/O26主題演講天團)
