網易首頁 > 網易科技 > 網易科技 > 正文

一文看懂谷歌I/O2026：Gemini 3.5領銜谷歌打響智能體和全模態大戰

2026-05-20 03:07:41　來源: 態℃

北京舉報

分享至

出品｜《態度》

作者｜袁寧丁廣勝

山景城海岸線劇場，再次成為全球科技圈的焦點。

北京時間5月20日凌晨1點，2026 Google I/O正式登場。這個可以容納兩萬多人的露天劇場，每年都一票難求。主會場坐滿后，甚至有不少人坐到山坡草坪上，遠遠望向舞臺，等待Google這位頂尖玩家亮牌。

現場的氣氛并不像一場傳統開發者大會，更像一場巨大的科技派對。走進入口，工作人員會熱情地和與會者擊掌；入口附近有室外樂隊表演；劇場外則是大片Demo展區，Google各條業務線和合作伙伴都在展示自己的最新產品與應用，比如來自中國的Xreal。開發者、媒體、創業者、投資人和合作伙伴穿梭其中，所有人都在等待同一個問題的答案：

在大模型競爭進入智能體階段后，Google準備怎么出牌？

過去一年，AI行業的敘事發生了明顯變化。OpenAI 依然是焦點，但 Anthropic 正在變得越來越 “搶鏡”。據我們了解，某種程度上，Google 的“假想敵”已經不再只是 OpenAI，也開始越來越多地指向 Anthropic。

今天凌晨，Google CEO Sundar Pichai 給出了這次大會的核心敘事：“Gemini 3.5和 Antigravity 正在開啟一個智能體和智能體能力的新世界。我們已經把智能體帶給開發者和企業一段時間了。現在，我們非常專注于把智能體的力量，以安全、可靠的方式帶給消費者，讓它適用于每一個人。”

在這次 I/O 上，Google 幾乎把所有核心業務線都重新用“智能體”串了一遍：從 Gemini 3.5 Flash，到 Gemini Omni Flash；從 Search 里的信息智能體、預訂智能體，到 Gemini App 里的24/7個人智能體 Gemini Spark；從開發者平臺 Antigravity，到購物場景里的 Universal Cart；再到 Workspace、YouTube、Flow、Android、Cloud 以及內容溯源工具。

我們看到，Google試圖把 AI 從“回答問題的模型”，推進到“持續理解、規劃、執行任務的系統”。可以說，2026 Google I/O，是 Google 全面押注 Agentic AI 的一次集中展示。

01 Gemini 3.5 Flash 登場：速度快4倍，“會行動的模型”將成默認入口

本屆 I/O 最受關注，也是最核心的技術發布，依舊是Gemini。

但并非大家期待的Gemini 4，Google 發布了 Gemini 3.5模型家族的首個成員 Gemini 3.5 Flash。Google 將其定義為“結合前沿智能與行動能力”的新一代模型，主打兩個關鍵詞：智能體能力和速度。

按照 Google 的說法，Gemini 3.5 Flash 是其目前最強的智能體和代碼模型，在復雜長周期任務、代碼生成、多模態理解等方面均有顯著提升。Google 給出的 benchmark 包括：Terminal-Bench 2.1達到76.2%，GDPval-AA 達到1656 Elo，MCP Atlas 達到83.6%，CharXiv Reasoning 達到84.2%。

更重要的是，Google 強調3.5 Flash 在輸出速度上比其他前沿模型快4倍。這意味著它并不是單純追求“更強大模型”的路線，而是試圖在能力、延遲和成本之間找到一個更適合大規模產品化的平衡點。

這也解釋了為什么 Google 首發的是 Flash，而不是 Pro。

過去大模型競爭強調“誰更強”，但進入2026年，產品化競爭更看重“誰能以更低延遲、更低成本、更穩定地服務海量用戶”。Flash 的定位正好契合這一點：能力足夠強，同時可以大規模鋪進搜索、App、開發者工具和企業平臺。

根據 Google 的安排，Gemini 3.5 Flash 將進入多個核心場景：

● 面向普通用戶，成為 Gemini App 和 Google Search AI Mode 的默認模型；

● 面向開發者，進入 Google Antigravity、Gemini API、Google AI Studio 和 Android Studio；

● 面向企業，進入 Gemini Enterprise Agent Platform 和 Gemini Enterprise。

據現場透露，Gemini 3.5 Pro 已在內部使用，計劃于下個月推出。這意味著 Google 會先用 Flash 承接規模化需求，再用 Pro 服務更復雜的高階任務。

02 Gemini Omni Flash：從“理解多模態”走向“生成任意模態”

如果 Gemini 3.5 Flash 代表 Google 對“行動模型”的押注，那么 Gemini Omni Flash 則代表 Google 在多模態生成上的新野心。

Google 對 Omni 的定義非常直接：可以從任何輸入生成任何輸出的模型，首先從視頻開始。這句話背后，是多模態 AI 的范式變化。

過去的多模態更多是“輸入多模態”：模型可以看圖、聽音頻、理解視頻，再用文字回答。但 Gemini Omni 要做的是“輸入和輸出都多模態”。用戶可以用文本、圖片、音頻、視頻作為輸入，再生成高質量視頻。未來，它還會支持圖像和音頻等更多輸出形式。

它的核心能力包括三類。

● 第一，是通過自然語言編輯視頻。用戶可以連續對視頻提出修改要求，比如改變環境、角度、動作、風格，甚至加入角色和物體。Google 強調，Omni 可以在多輪對話中保持角色一致性、物理邏輯和場景連續性。

● 第二，是基于 Gemini 的世界知識生成視頻。Google 表示，Omni 不只是生成“看起來真實”的畫面，而是能結合物理、歷史、科學和文化語境，生成更有邏輯的視覺敘事。例如更準確地表現重力、動能、流體等物理效果，或者把復雜概念轉化為解釋型視頻。

● 第三，是從任意素材開始創作。用戶可以把文本、圖片、視頻，甚至語音作為參考輸入，生成統一風格的視頻內容。初期音頻輸入主要支持語音參考，更多音頻類型會在之后推出。

值得注意的是，Google 還提到了數字化身功能。用戶可以使用自己的聲音創建個人 avatar，讓生成視頻看起來和聽起來像自己。但在視頻編輯中修改音頻和語音的能力，Google 表示仍在測試，以更謹慎地處理潛在風險。

在內容安全方面，Omni 生成的視頻將包含不可感知的 SynthID 數字水印。用戶可以通過 Gemini App、Chrome 中的 Gemini 以及 Google Search 驗證視頻是否由 Gemini Omni 生成。

（Sundar Pichai調侃他不吃漢堡，這是假圖）

從發布節奏看，Gemini Omni Flash 會向 Google AI Plus、Pro 和 Ultra 訂閱用戶全球推出，也會從本周起在 YouTube Shorts 和 YouTube Create App 中向用戶免費開放。未來數周內，Google 還將把它通過 API 提供給開發者和企業客戶。

這意味著，Google 不只是想做一個視頻生成工具，而是想把視頻生成能力嵌入整個創作者生態：Gemini 負責個人創作入口，Flow 負責專業工作流，YouTube Shorts 負責分發場景。

這套閉環，正是 Google 相比許多純 AI 創業公司的優勢所在。

03 Gemini App 變成24/7個人助理：Gemini Spark 是關鍵

Gemini App 也在這次 I/O 上迎來大更新。

Sundar Pichai 透露，過去一年 Gemini App 增長迅速：去年 Google I/O 時，Gemini 有4億用戶；今年月活已經超過9億，覆蓋230個國家和地區、70多種語言。

新的 Gemini App 有幾個重點變化。

● 首先是設計語言升級。Google 推出了新的 Neural Expressive 設計語言，包括更流暢的動畫、更鮮明的顏色、新字體和觸覺反饋。Gemini Live 也被直接整合進 Gemini，用戶可以在文字提問和語音對話之間無縫切換。

● 其次是回答形態的變化。Gemini 不再只是輸出長文本，而是可以根據問題實時設計答案形式，加入圖片、交互式時間線、旁白視頻和動態圖形。

● 第三，也是最重要的，是兩個智能體功能：Daily Brief 和 Gemini Spark。

Daily Brief 是一個個性化晨間簡報智能體，可以幫助用戶整理每天開始前需要知道的信息。

Gemini Spark 則是 Google 面向消費者推出的個人 AI agent。它會24/7運行，在用戶授權和指令下幫助管理任務、處理數字生活。

此外，macOS 版 Gemini App 也會集成 Gemini Spark，使其可以在本地機器上執行操作，并加入更強的語音功能。

Google 計劃先向 trusted testers 推出 Gemini Spark，并在下周面向美國 Google AI Ultra 用戶推出 Beta。macOS 版 Gemini App 未來也會集成 Gemini Spark，使其可以在本地機器上執行操作。

這對 Google 很重要。因為它擁有 Gmail、Calendar、Photos、Drive、Chrome、Android、Search、Maps 等高頻產品。如果 Gemini Spark 能在用戶授權下調動這些服務，它就不只是聊天機器人，而可能成為真正的個人任務調度層。

同時，Google 宣布推出每月100美元的 AI Ultra 計劃，同時為 AI Plus、Pro 和 Ultra 訂閱用戶增加新功能和權益。

04 Search 迎來25年最大改版：搜索框變成智能體入口

Google I/O 的另一個重磅更新，是 Search。

據介紹，新的搜索框會動態擴展，允許用戶輸入更復雜、更自然的問題；它可以給出 AI 驅動的問題建議，不再只是傳統 autocomplete；它還支持多模態輸入，包括文本、圖片、文件、視頻和 Chrome 標簽頁。

更核心的是，Google 正在把 Search 從“找答案”變成“派任務”。

首先，AI Mode 將使用 Gemini 3.5 Flash 作為全球默認模型。用戶可以從 AI Overview 直接繼續追問，進入 AI Mode 的對話式體驗，并保留上下文。

其次，Google 推出了 Search agents。這類智能體可以在后臺24/7運行，持續跟蹤用戶關心的信息，并在合適時間給出綜合更新。

比如，你正在找房，可以告訴 Search 預算、位置、戶型、通勤和其他條件，信息智能體會持續掃描網頁、新聞、博客、社交信息，以及金融、購物、體育等實時數據，一旦發現匹配結果就通知用戶。又比如，你關注某位運動員和品牌聯名的球鞋，智能體也可以在新產品發布時提醒。

這類信息智能體將率先在今年夏天面向 Google AI Pro 和 Ultra 訂閱用戶推出。

Google 還在擴展 Search 中的 agentic booking 能力。用戶可以讓 Search 幫忙尋找并預訂本地服務，比如周五晚上可容納六人、供應夜宵的私人 KTV 包間。Search 會整合最新價格和可用性，并給出直接預訂鏈接。

在家政維修、美容、寵物護理等部分品類中，用戶還可以讓 Google 代為給商家打電話。這些能力將于今年夏天在美國面向所有用戶推出。

更有想象空間的是，Search 還將獲得“生成式 UI”和“迷你應用”能力。

借助 Gemini 3.5 Flash 的代碼能力，以及 Antigravity 的智能體開發能力，Search 可以根據用戶問題即時生成交互界面。比如，當用戶想理解天體物理問題，或者想看懂機械表運行原理，Search 可以自動生成包含圖表、表格、模擬器、交互組件的定制答案。

更進一步，對于長期任務，比如婚禮籌備、搬家管理、健康計劃，Search 可以生成一個可持續使用的 dashboard 或 tracker。Google 把這類體驗稱為用戶專屬的 mini apps。

這其實是對搜索產品形態的一次根本改寫。

過去，搜索結果頁的核心是鏈接、摘要和廣告。未來，它可能變成一個動態生成的任務操作臺：既能理解問題，也能生成工具，還能持續跟蹤狀態。

對 Google 來說，這既是防守，也是進攻。防守在于，AI 聊天產品正在侵蝕傳統搜索入口；進攻在于，Google 試圖用智能體把搜索重新定義為更強的任務入口。

05 AI 購物：Universal Cart 是 Google 的“智能體商業化”試驗田

AI 時代，Google 最大的問題之一是：如果搜索結果不再以鏈接為核心，廣告和商業化怎么辦？

本屆 I/O 給出的答案之一，是 agentic commerce，也就是智能體購物。

Google 宣布推出 Universal Cart，一個智能購物車，也是用戶在 Google 上進行 AI 購物的中心。

購物天然適合智能體。

因為用戶真實的購物需求往往很復雜，不是一個關鍵詞能解決的。比如買一臺適合出差的輕薄本，用戶關心的不只是價格，還包括重量、續航、性能、接口、品牌、售后、優惠、庫存、配送時間和用戶評價。傳統搜索需要用戶反復篩選，智能體則可以持續比較、監控價格、組合商品，甚至協助完成購買。

Universal Cart 的價值就在這里：它可能把 Search、Shopping、廣告、商家數據和支付鏈路連接起來，讓 AI 不只是推薦商品，而是參與購物決策和交易流程。

這對 Google 具有戰略意義。

過去，搜索廣告的核心是用戶點擊鏈接，然后跳轉到商家頁面。AI 搜索如果減少了用戶點擊，Google 就需要新的商業閉環。智能體購物可能成為一種新路徑：Google 從信息分發者，變成交易決策和執行過程中的參與者。

但它也會帶來新問題：AI 推薦商品時如何排序？是否會偏向廣告主？用戶如何知道推薦依據？商家如何適配這種新渠道？這些都將影響 AI 購物能否建立信任。

06從 Android Halo 到 Antigravity：Gemini 正成為系統級基礎設施

當智能體開始替用戶執行任務，Google 必須重新定義 AI 在系統里的位置。

一個很直接的問題是：如果 AI 不只是回答問題，而是開始幫你搜索、預訂、整理、生成、比較價格、管理日程，用戶怎么知道它正在做什么？又該在哪里暫停、查看或接管？

Google 給出的答案之一，是 Android Halo。

這是一個將在今年晚些時候上線的 Android 新能力，用來在手機屏幕頂部顯示智能體正在處理的任務。你可以把 Android Halo 理解為智能體時代的狀態欄。

過去，狀態欄顯示的是時間、電量、信號、通知；到了 AI 時代，系統還需要顯示“你的智能體正在做什么”。比如它正在搜索航班、整理文檔、比較商品、生成視頻、聯系商家，或者后臺持續追蹤某個任務。

這也說明，Google 對智能體的理解并不是單點應用，而是系統級能力。模型、應用、搜索、瀏覽器、操作系統之間的邊界會越來越模糊，真正的競爭會發生在“誰能成為用戶所有任務的調度層”。

如果 Android Halo 解決的是“用戶如何看見和控制智能體”，那么 Antigravity 解決的就是“開發者如何構建智能體”。

Google 顯然不希望智能體能力只留在自家產品里。除了 Search、Gemini App 和 AI 購物，Google 還希望通過 Antigravity，把 Gemini 的能力交給開發者。

Antigravity 可以理解為 Google 面向 agentic AI 時代的開發平臺。它的重點不是簡單調用一個大模型接口，而是讓開發者能夠構建、調度和部署多個協作式智能體。

過去的 AI 開發，很多時候是“應用調用模型”：用戶輸入問題，模型返回答案。但智能體時代的開發邏輯更復雜。開發者需要讓 AI 理解目標、拆解步驟、調用工具、訪問數據、執行動作、檢查結果，并在必要時繼續迭代。

這就要求平臺不只是提供模型，還要提供工作流、權限、工具調用、記憶、評估和部署能力。

Antigravity 的價值就在這里：它想把 Gemini 從一個可調用的模型，變成一個可開發、可組合、可部署的智能體平臺。

這對 Google 很關鍵。因為智能體時代不可能只靠 Google 自己開發應用。真正的爆發，需要開發者基于 Gemini 做出大量新工具、新插件、新工作流和新應用。只有開發者生態起來，Gemini 才能從 Google 自己的產品矩陣，延伸到更廣泛的軟件世界。

與此同時，Google 自己的“全家桶”也在繼續 AI 化。

● 在 Workspace 里，Gemini 會繼續進入 Gmail、Docs、Sheets、Slides、Meet 等辦公場景，幫助用戶寫郵件、總結文檔、整理會議、生成表格、制作演示和管理任務。對企業用戶來說，這不是單點功能，而是把 AI 嵌進日常辦公流。

● 在 YouTube 里，Gemini Omni Flash 和視頻生成能力會進一步參與內容創作，尤其是 Shorts。創作者可以用 AI 生成素材、修改鏡頭、調整風格，甚至把一個創意快速變成短視頻內容。

● 在 Flow 里，Google 更明確地把 AI 視頻生成做成創作工作流。相比一次性生成視頻，Flow 的價值在于連續編輯、分鏡管理和多輪調整，讓 AI 視頻從“玩具”變成更接近專業生產的工具。

● 在 Pics / Photos 相關場景里，AI 會繼續承擔圖片生成、圖片編輯、視覺理解和內容整理的角色。用戶不再只是保存照片，而是可以讓 AI 幫忙修圖、生成回憶、提取信息，甚至圍繞圖片繼續創作內容。

這些產品看似分散，但背后邏輯是一致的：Google 正在把 Gemini 放進每一個高頻場景。

07 Google 的真正意圖：把 AI 做成下一代操作層

把本屆 I/O 的發布串起來，Google 的路線已經非常清楚。它不是單獨發布幾個 AI 功能，而是在搭建一套智能體時代的完整系統：

● 模型層：Gemini 3.5 Flash 負責行動和代碼，Gemini Omni Flash 負責多模態生成；

● 工具層：Antigravity、Gemini API、AI Studio、Android Studio 服務開發者；

● 入口層：Search、Gemini App、Android、Chrome、Workspace、YouTube、Shopping 承接用戶場景；

● 商業層：AI Ultra、AI Plus、Pro、Universal Cart 和企業服務負責變現；

● 基礎設施層：Google Cloud、TPU 和 Enterprise Agent Platform 支撐大規模部署；

● 治理層：SynthID、水印驗證、內容透明、安全框架和用戶授權控制風險。

而未來，Search 不再只是搜索結果頁，而是任務入口；Gemini 不再只是聊天助手，而是個人 agent；Android 不再只是應用平臺，而是智能體運行環境；Shopping 不再只是商品索引，而是交易智能體；Cloud 不再只是算力租賃，而是企業智能體平臺。

當然，Google 的挑戰也很現實。

智能體要真正替用戶行動，必須解決可靠性、隱私、安全、權限、誤操作、可解釋性和商業利益沖突等問題。尤其在搜索、購物、預訂和個人數據場景中，一次錯誤推薦、一次誤撥電話、一次不合適的自動操作，都可能損害用戶信任。

從2026年 Google I/O 看，Google 想定義的新階段已經很明確：智能體不再只是產品功能，而會成為新的基礎設施；AI 不再只是信息工具，而會變成下一代操作層。

（Google I/O26主題演講天團）

本文來源：態℃ 責任編輯：袁寧_NB35110

網易新聞

iOS

Android

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

教育

藝術

親子

數碼

手機 / 數碼

房產 / 家居

一文看懂谷歌I/O2026：Gemini 3.5領銜 谷歌打響智能體和全模態大戰

一文看懂谷歌I/O2026：谷歌打響智能體大戰

洪水最高沒過2樓樓頂 女子紅了眼眶：家里東西全沒了

洪水最高沒過2樓樓頂 女子紅了眼眶：家里東西全沒了

文班亞馬：沒拿到MVP，就證明自己是MVP

舒淇大方承認：卸了妝就是50 歲的模樣

白酒榜|汾酒營收凈利雙增 口子窖"造富"

煥新極氪009上市41.38萬起 齊家版讓MPV回歸家庭

態度原創

TGA最佳多人上"D加密"打擊外掛！騰訊將代理國服

特朗普會改變美國留學政策嗎？英國兩名校合并說明了什么？

18幅 玫瑰花與女子畫作

“消”字號當“妝”字號賣？“毒面霜”悲劇還在對著兒童......

已修復：AMD霄龍處理器Fabricked漏洞披露，100%成功

一文看懂谷歌I/O2026：Gemini 3.5領銜谷歌打響智能體和全模態大戰

洪水最高沒過2樓樓頂女子紅了眼眶：家里東西全沒了

洪水最高沒過2樓樓頂女子紅了眼眶：家里東西全沒了

白酒榜|汾酒營收凈利雙增口子窖"造富"

煥新極氪009上市41.38萬起齊家版讓MPV回歸家庭

18幅玫瑰花與女子畫作