![]()
在品嘗過「會前甜點」Android Show 之后,真正的重頭戲谷歌開發者大會 Google I/O 2026 正式揭開了帷幕。
不出所料,在時長接近兩個小時的活動中,Gemini 占據了絕對的 C 位。
![]()
圖|Google
除了更新基礎模型和周邊能力之外,Gemini 也更加深入的集成到了谷歌 app 全家桶里面,甚至還給 iOS 和 macOS 帶來了一些更新。
比較可惜的是,上周亮相的 Googlebook 和 Android 17,在本次 I/O 開場活動上都沒有被提及。
我們唯一看到的硬件產品,是與三星聯合開發的智能眼鏡:
![]()
圖|Google
總之,谷歌借助本次 I/O 大會傳達的信息已經很明確了:
Gemini 的能力將會越來越強、存在感將會越來越高,與全球十幾億谷歌產品用戶的「物理生活」的集成也會越來越緊密。
從夸張的角度想—— Gemini 距離接管大部分人的日常工作,似乎就只差一個人形機器人了。
底層模型更新
整場活動里最重磅的,就是圍繞著 Gemini 的幾款底層模型的更新了。
首先是正式的 Gemini 3.5 版本發布,用戶最先可以體驗到的版本則是 Gemini 3.5 Flash。
它在多個維度上展現出媲美之前 2.5 Pro 的能力,并且保持了 Flash 系列的速度:
圖|Google
得益于速度和性能的平衡,Gemini 3.5 Flash 最擅長的場景之一就是處理長期、大規模的智能任務,同時還能省下大量 token 開銷。
同時,最新的 Antigravity 集成也讓 Gemini 3.5 Flash 擁有了更豐富的輸出形式——
執行分類代碼、根據論文編寫游戲、轉換上古代碼庫、構建 3D 場景、交互式 Web 界面等等。
![]()
將遺留代碼庫轉換成 Next.js|Google
此外還有規模最大的「世界模型」Gemini Omni,用谷歌的宏愿來描述 Gemini Omni 則是:
它可以根據任何輸入內容,輸出任何你想要的東西(Generate any output with any input)。
Omni 的首款模型產品則是 Gemini Omni Flash,除了 Gemini app,它也集成到了 Google Flow 和 YouTube Shorts 里面,支持用戶使用自然語言生成「最像真的」的視頻。
![]()
圖|Google
相對應的,谷歌也調整了自己的 Google One 訂閱模式,在原本最高等級的 AI Ultra 方案里新增了一個 100 美元/月的分類。
這個新的訂閱同屬于 AI Ultra 級別,包含 Gemini 3.5 Flash、Antigravity 2.0 和其他新功能的優先訪問權等等。
當然,傳統的 20TB 云空間和 YouTube Premium 權限也同樣包含,主要面向開發者和高級創作者之類的群體。
![]()
圖|Google
同時,原本 250 美元的最高等級 AI Ultra 訂閱則迎來了降價,現在只需要 200 美元/月就能享受到包括最高 20 倍于 AI Pro 的使用額等等特權。
另一個重大的收費模式變革則是 Gemini app 本身。
![]()
圖|Google I/O
在新聞稿里,谷歌宣布將 Gemini 的每日限額從「提示詞額度」改成了「使用量計算」。
這樣算下來,圖片、視頻和代碼的消耗變多、文本任務消耗量則變少,整體是一種更靈活的算力計費模式。
實際業務落地
與 OpenAI、Anthropic 之類的公司不同,谷歌最大的特點在于,它真的有一套能夠直達全球十幾億用戶的產品生態。
在上述基礎模型之外,谷歌本次展示的策略,重點是將這些「抽象」的 AI 模型能力,整合進普羅大眾每天都在使用的 app 里面。
![]()
圖|SlashGear
而這種整合大體上分成三步:傳統搜索業務變革、手機系統智能化、視覺智能融合。
「搜索引擎」作為谷歌的起家業務,在今年的 I/O 上迎來了一次徹頭徹尾的 AI 改造,谷歌稱之為「AI 搜索的新時代」。
這種業務轉變背后的邏輯很簡單:相比 20 年前,人們只在搜索框里輸入單詞或短語,現在的人更習慣在里面輸入復雜的復合指令。
![]()
圖|Google
換言之:谷歌把傳統的搜索框(search box)變成了一個通用對話框(chatbox)。
除了搜索,用戶可以在里面要求任何形式的內容。
這剛好也是本次 I/O 活動的重點更新內容——具有智能體能力的搜索。
首先,AI Mode 的基礎模型會升級到 Gemini 3.5,你的搜索框會自動推薦和補全輸入的內容,讓你的關鍵詞變得更詳細或者更廣泛。
![]()
圖|Google
此外還有全新的生成式 UI(Generative UI)回答,谷歌會根據你詢問的東西智能生成最合適的回答形式。
比如搜索股票走勢,回答里不僅有文本,還會生成折線圖;問裝修靈感,回答里就生成圖片……
甚至你搜索物理問題,它還能調用 Antigravity 快速編寫一個互動式的 Web 演示:
![]()
圖|Google
使用了這么多年的「多模態搜索」之后,我們終于進入了「多模態回答」的時代。
谷歌搜索結合 Antigravity 的能力不止于此,它還可以更進一步,根據你在搜索框里輸入的內容實時生成 Web 形式的儀表盤或追蹤器。
用人話來說,就是谷歌搜索框為你的需求直接編寫了一個專門的 app。
這種多模態能力是非常恐怖的,甚至有可能徹底改變人們檢索信息的方式——
畢竟我們搜東西,大多是為了將搜索結果用在別的任務里面,而新的谷歌搜索可以直接幫你做完下一步操作。
![]()
圖|Google
至于這種「代辦」的具體方式,則是 Gemini Spark。
簡單來說,Gemini Spark 本質上是類似 OpenClaw 的「語義理解-自動執行」功能,一個谷歌 Claw。
其中 Gemini Spark 基于最新的 Gemini 3.5 模型,支持 7 天 24 小時不間斷運行。
并且由于運行載體是 Google Cloud,還可以執行跨端代理操作——在手機上布置任務,在電腦上查收結果。
![]()
圖|Google
Gemini Spark 目前支持所有谷歌套件 app,后續則會拓展 MCP 平臺以兼容第三方 app 的內部功能,同時支持用戶自己上傳 Skill。
谷歌還宣布 Gemini Spark 后續會集成到 Chrome 和 Android Halo 中,為瀏覽器和手機帶來智能體自動操作的功能。
![]()
Android Halo|Google
最后一步棋,則是 Gemini 與視覺智能的融合。
在本次 I/O 活動上,谷歌發布了首個與三星聯合開發的「純音頻智能眼鏡」產品,分別使用 Gentle Monster 和 Warby Parker 鏡架:
![]()
圖|Google
單純從功能上講,這個純音頻眼鏡與市面上已經有的智能眼鏡相差不大,主要優勢是可以直接調用 Gemini 的多模態功能,用來調用前面提到的其他復雜能力。
另一方面,XREAL 與谷歌合作的那款帶屏幕的智能眼鏡 Project Aura 在本次活動上又有了更新。
根據介紹,Project Aura 搭載了 XREAL 自研的 X1S 空間計算芯片,并為了佩戴舒適采用了分體式的設計。
也就是說,Project Aura 的眼鏡部分只負責顯示,真正的處理芯片、電池包和觸控板需要通過數據線連接到一個外置的隨身單元上:
![]()
圖|TheVerge
至于實際的生活功能方面,Project Aura 將會支持 Google Maps 沉浸式導航、巨幕/窗口化視頻播放、YouTube VR 視頻、WebXR 三維繪畫、DP 拓展筆記本屏幕等等用法。
![]()
圖|TECHEBLOG
總體來說,Android XR 是一套完全基于空間計算的視覺化的操作系統,與 Gemini 的能力搭配起來,為我們畫出了一套未來智能眼鏡的線路圖。
更重要的是,雖然現在 Android XR 和 Android 17 是兩個完全獨立的系統,但就像 Android 和 ChromeOS 融合那樣,它們未來大概率也會合二為一、變成一個「視覺智能系統」類似物。
Gemini 能接管一切嗎
熬夜看完整場 Google I/O 之后,除了 Gemini 3.5 和它的小伙伴們帶來的驚訝之外,我們難免也詫異于 AI 對于人類基礎行為的革命。
無論是 Gemini 3.5 Flash、Antigravity、Gemini Spark,它們都隱藏在了一個簡潔的「搜索對話框」背后,將搜索這一行為從「獲取信息」進化成了「完成任務」。
![]()
圖|Google Search
我們很難說這種進化在長期來看會對我們使用網絡和人工智能產生什么影響,但我們至少可以從里面看到谷歌的野心——
為一套強悍的 AI 模型賦予前所未有豐富的功能,并且將這些功能集成進自己覆蓋全球幾十億用戶的網絡產品里,共同提升這幾十億人的效率。
![]()
Gemini 同時切進所有這些網絡產品,副作用是「應用」這個概念正在變薄——
Agent 越能辦事,應用內部和搜索結果頁的存在價值就越被稀釋。
至于這層智能會把多少舊規則一起重寫,現在沒人能答,谷歌自己也答不上來。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.