北京時間5月20日凌晨1點,谷歌I/O 2026開發者大會在美國加州山景城開幕。
與往年相比,今年這場發布會的重點,不是某一個模型或功能,而是一次系統性轉向——谷歌正把AI智能體全面“塞進”所有核心入口。
從搜索框到Chrome瀏覽器,從Android手機到智能眼鏡,Gemini不再只是一個對話助手,而是一個可以持續運行、跨應用執行任務的AI代理:它能替用戶追蹤信息、生成內容、調用工具,甚至直接完成下單和操作流程。
在開場演講中,谷歌CEO桑達爾·皮查伊(Sundar Pichai)表示,過去12個月是谷歌“飛速發展”的一年。谷歌每月處理的Token數量達到3.2千萬億個,同比增長7倍;Gemini應用月活躍用戶數達9億。
截至美股5月19日收盤,谷歌A跌2.34%。
谷歌宣布了一系列全球合作關系![]()
谷歌每月Token處理量 圖片來源:直播視頻截圖
![]()
Gemini月活躍用戶數 圖片來源:直播視頻截圖
Ask YouTube:AI視頻搜索進入“對話+跳轉片段”時代
在大會開場后的產品展示中,谷歌首先介紹了YouTube和辦公場景中的AI功能。
谷歌推出“Ask YouTube”功能。該功能將在YouTube網站中加入聊天機器人式交互界面,用戶可以通過自然語言引導系統找到更符合搜索意圖的視頻片段,并直接跳轉至視頻中的相關部分。谷歌表示,該功能目前正在測試,并計劃于今年夏季在美國更廣泛推出。
![]()
谷歌首先介紹了YouTube和辦公場景中的AI功能
隨后,谷歌展示了Docs Live。不同于傳統文檔編輯工具,Docs Live允許用戶直接通過語音與Google Docs對話,而不必輸入具體提示詞。現場演示中,一名用戶需要為高中職業日準備校友演講,Gemini自動提取演講要點,從Google Drive中獲取簡歷信息,并從Gmail中調取活動詳情,隨后幫助用戶創建和編輯文檔。
![]()
谷歌展示了Docs Live 圖片來源:視頻截圖
從TPU 8到Gemini 3.5 Flash:谷歌全面升級AI底層與生成能力
在介紹應用層功能后,皮查伊轉向AI基礎設施。皮查伊表示,谷歌AI基礎設施支出正在大幅增長,預計今年的支出將達到1800億美元~1900億美元。
![]()
谷歌資本支出 圖片來源:直播視頻截圖
谷歌還重點介紹了自研AI硬件TPU(張量處理單元)。谷歌稱,最新一代TPU 8將分為兩類:一類面向大規模AI訓練,另一類用于模型實際服務用戶時的快速響應。
![]()
谷歌最新訓練用TPU 8t圖片來源:直播視頻截圖
隨后,DeepMind首席執行官德米斯·哈薩比斯(Demis Hassabis)登臺介紹“世界模型”相關進展,并發布Gemini Omni。這是一款基于谷歌在世界模型方面積累的新型視頻生成模型。按照谷歌的介紹,Gemini Omni可以基于多種輸入生成視頻,并支持對話式編輯。用戶可以通過自然語言修改角色、背景和場景,也可以上傳自拍并將其轉換成其他風格或內容。哈薩比斯稱,未來Omni將能夠根據任何輸入生成任何輸出,首款模型Gemini Omni Flash將于今年夏季推出。
![]()
Gemini Omni 圖片來源:直播視頻截圖
圍繞AI生成內容識別,谷歌還擴展了SynthID驗證功能。用戶可以詢問一張圖片是否由AI生成。皮查伊現場以一張他和另外幾個科技巨頭CEO的梗圖為例,展示該AI檢測能力。
![]()
![]()
皮查伊測試SynthID能力 圖片來源:直播視頻截圖
皮查伊隨后發布Gemini 3.5 Flash。他表示,該模型比此前Gemini 3.1速度更快,專為更復雜的智能體任務、更長工作流和現實世界開發者使用場景構建。谷歌稱,Gemini 3.5 Flash生成輸出Token的速度大約是其他前沿模型的4倍,因此尤其適合AI Agent和編碼工具。
![]()
Gemini 3.5 Flash生成速度為其他模型的四倍 圖片來源:直播視頻截圖
Antigravity與Gemini Spark:智能體從編程走向個人助理
模型發布之后,谷歌的軟件開發平臺Antigravity負責人瓦倫?莫漢(Varun Mohan)登臺介紹智能體編程平臺Antigravity 2.0。
該平臺被谷歌定位為面向AI Agent時代的編程工具,直接對標Anthropic的Claude Code和OpenAI的Codex。瓦倫?莫漢稱,谷歌通過Antigravity 2.0及其代理系統從零開始構建一個操作系統,整個過程所消耗的Token成本不到1000美元。他還表示,Antigravity 2.0“毫不掩飾地以智能體為先”。
![]()
谷歌Antigravity 圖片來源:直播視頻截圖
緊接著,皮查伊發布Gemini Spark。谷歌將其定義為一款全天候運行的個人AI助手,基于Gemini 3.5,并運行在Google Cloud虛擬機上。用戶可以通過Gemini應用訪問Spark。按照谷歌的說法,即便用戶合上筆記本電腦,Spark也可以繼續工作,同時也能在智能手機上運行。
谷歌表示,Gemini Spark未來將與第三方工具集成,相關工具將陸續公布。該功能本周將面向受信任測試人員推出,下周面向美國Google AI Ultra訂閱用戶開放。為了降低成本,谷歌還推出價格更低的Ultra套餐,起始價為100美元/月。今年夏天,Spark也將在Chrome瀏覽器中運行。
![]()
Gemini Spark 圖片來源:直播視頻截圖
谷歌還展示了如何通過Gemini Spark 來策劃街區派對。
在演示中,Spark 匯總了所有回復,追蹤了每位參與者攜帶的物品,自動向尚未回復的鄰居發送了后續郵件,并在Google Sheets 中創建了一個實時回復追蹤器。它還生成了一份Google Slides 派對宣傳冊,其中包含了充氣城堡和社區規則等詳細信息,這些信息都來自 Google Drive 中的文件。
![]()
Gemini Spark演示 圖片來源:直播視頻截圖
谷歌還計劃發布Android Halo,用于承載其在安卓手機平臺上的AI智能體。按照谷歌的設想,Android Halo將成為手機上AI智能體運行狀態和任務進展的可視化入口。
![]()
Android Halo 圖片來源:直播視頻截圖
AI Mode和AI Overview:谷歌用智能體重構搜索
隨后,谷歌搜索副總裁伊麗莎白?里德(Liz Reid)登臺,介紹AI Mode和AI Overview相關進展。
谷歌推出全新的搜索框。新搜索框不僅具備傳統自動補全能力,還能提供AI生成的搜索建議,并支持多模態搜索,允許用戶在搜索請求中上傳照片和視頻。
![]()
谷歌搜索新搜索框 圖片來源:直播視頻截圖
更大的變化是AI智能體進入搜索。谷歌介紹,全新推出的信息智能體可以全天候在后臺運行,用于回答“極其復雜”的問題,例如追蹤特定行業的市場動態。用戶無需反復手動搜索,智能體可以持續監控網絡,并在相關信息發生變化時更新結果。谷歌計劃在今年夏季推出這類智能體,并在之后增加更多專業化代理。
![]()
信息智能體 圖片來源:直播視頻截圖
谷歌搜索產品副總裁羅比·斯坦(Robbie Stein)介紹,AI Mode還將接入Antigravity的編碼能力。谷歌稱,搜索未來可以在交互界面中生成可交互畫面,并幫助用戶創建“迷你應用”。例如,當用戶想尋找周末適合全家參與的娛樂活動時,搜索可以從零開始生成一個周末活動計劃表。
![]()
AI Mode演示 圖片來源:直播視頻截圖
Universal Cart:AI智能體升級購物體驗,能追蹤優惠、監控價格
在搜索之后,谷歌廣告和商務副總裁Vidhya Srinivasan登臺展示同樣具有智能體元素的購物相關功能。
谷歌宣布了一系列全球合作關系。相關合作將使用開源的通用商業協議,服務也將擴展到美國以外的新地區。
![]()
谷歌宣布了一系列全球合作關系 圖片來源:直播視頻截圖
谷歌還發布了Universal Cart。這是一款由AI智能體驅動的通用購物車,可在Google服務中使用,包括搜索和Gemini應用,后續還將支持YouTube和Gmail。用戶在搜索、與Gemini聊天、觀看YouTube或閱讀Gmail時,都可以把商品加入同一個購物車。
谷歌稱,Universal Cart可以追蹤優惠、監控價格變動、顯示價格歷史、在商品重新上架時提醒用戶,甚至還能識別兼容性問題。例如,用戶組裝一臺定制電腦時,如果某個部件不兼容,購物車可以進行提示。
![]()
Universal Cart演示 圖片來源:直播視頻截圖
隨后,谷歌介紹Gemini應用的重大更新。Gemini應用將采用新的Neural Expressive設計語言,帶來包括交互式圖像反饋、生成視頻時間線在內的全新體驗。Gemini Omni也將接入該應用,支持用戶創建和編輯視頻。
智能體也將加入Gemini應用。第一個名為“每日簡報”,可以利用用戶的Google服務信息,概覽當天行程。高級用戶還可以構建自己的智能體工作流。
![]()
智能體也將加入Gemini應用 每日簡報 圖片來源:谷歌
Android XR智能眼鏡:從導航到下單,無需掏手機
硬件方面,谷歌預告了由Gentle Monster、Warby Parker與三星合作推出的Android XR智能眼鏡。這款智能眼鏡將有兩種形態:一種是可以與用戶對話的語音眼鏡,另一種是可以將信息投射到用戶面前的顯示眼鏡。Gentle Monster和Warby Parker聯名款屬于語音眼鏡,計劃于今年秋季上市,并可與iOS和Android設備配對使用。
![]()
Android XR智能眼鏡 圖片來源:直播視頻截圖
現場演示中,谷歌人工智能與眼鏡產品負責人Nishtha Bhatia使用智能眼鏡點了一杯咖啡。Gemini為她導航到一家咖啡館,打開手機中的DoorDash外賣平臺,并準備好她常點的氮氣冷萃咖啡訂單。用戶仍需最終批準下單,但Gemini已完成打開應用、找到飲品和準備訂單等步驟,而手機始終放在口袋里。
![]()
智能眼鏡演示 圖片來源:直播視頻截圖
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.