![]()
作者 | 華衛(wèi)
北京時(shí)間5月20日凌晨1點(diǎn),谷歌一年一度的I/O開(kāi)發(fā)者大會(huì)準(zhǔn)時(shí)開(kāi)幕。
在發(fā)布新品前,谷歌 CEO Sundar Pichai 展示了一個(gè)驚人的數(shù)據(jù):每月處理3.2千萬(wàn)億個(gè)token。“兩年前,我們?cè)诟鱾€(gè)平臺(tái)每月處理約 9.7 萬(wàn)億個(gè)token。去年的 I/O 大會(huì)上,這一數(shù)字增長(zhǎng)到了大約 480 萬(wàn)億個(gè)token。快進(jìn)到今天,這個(gè)數(shù)字又跳升了 7 倍,每月超過(guò) 3.2 千萬(wàn)億個(gè)token。”
短短一年增幅達(dá)7倍。而這些token,代表著谷歌用戶、開(kāi)發(fā)者與客戶正在解決的各類問(wèn)題。據(jù)透露,去年I/O大會(huì)時(shí)擁有4億月活躍用戶的Gemini應(yīng)用,如今已突破9億,一年內(nèi)翻了一番多。截至目前,Nano Banana 圖像生成模型已生成超過(guò)500億張圖像。
“還有大量潛在的生產(chǎn)力等待被釋放。“Pichai 稱。而這次的I/O發(fā)布,“智能體”可謂是重頭戲。幾乎所有的重磅新品,都是圍繞智能體去迭代和更新的。
Gemini 3.5登場(chǎng),
徹底改變谷歌內(nèi)部工作方式
Gemini 3.5 Flash 是此次 I/O 最值得開(kāi)發(fā)者關(guān)注的發(fā)布,被稱為谷歌“迄今為止最強(qiáng)大的智能體和編碼模型”。在多項(xiàng)智能體和編碼基準(zhǔn)測(cè)試中得分均高于Gemini 3.1 Pro,運(yùn)行速度比其他前沿型號(hào)快 4 倍。
對(duì)于這款模型,Pichai特意強(qiáng)調(diào)了兩點(diǎn)。
第一,與 3.1 Pro相比,3.5 Flash 在幾乎所有基準(zhǔn)測(cè)試中表現(xiàn)更佳。它在編碼能力上取得了巨大進(jìn)步,尤其是 GDPVal 的飛躍非常顯著,反映了許多現(xiàn)實(shí)世界中具有經(jīng)濟(jì)價(jià)值的任務(wù)。在Terminal-Bench 2.1(76.2%)、GDPval-AA(1656 Elo)和MCP Atlas(83.6%)等具有挑戰(zhàn)性編碼和代理基準(zhǔn)測(cè)試上的表現(xiàn)優(yōu)于Gemini 3.1 Pro,并在多模態(tài)理解方面領(lǐng)先(CharXiv Reasoning為84.2%)。
第二,Gemini 3.5 Flash 在多個(gè)維度上提供可媲美大型旗艦機(jī)型的智能性能,但速度仍然非常快。以每秒輸出token數(shù)計(jì)算,它比其他前沿模型快4倍。
![]()
此外,Gemini 3.5 Flash的另一個(gè)驚人之處在于,它以不到可比前沿模型一半的成本提供前沿級(jí)能力。“我們聽(tīng)說(shuō)許多公司在五月就已經(jīng)超出了年度token預(yù)算。如果公司能夠?qū)?Flash 與其他前沿模型混合使用,就可以節(jié)省大量成本。舉個(gè)例子,頂尖公司每天處理約 1 萬(wàn)億個(gè)token。如果他們將 80% 的工作負(fù)載從其他前沿模型切換到 3.5 Flash,每年可節(jié)省超過(guò) 10 億美元。這是真實(shí)的節(jié)省,可以再投入到公司的發(fā)展中。”P(pán)ichai表示。
過(guò)去一年,AI編程工具的市場(chǎng)是Cursor、Claude Code、GitHub Copilot三家在爭(zhēng)。Google在這個(gè)賽道幾乎缺席。有消息說(shuō),Gemini團(tuán)隊(duì)在編程方面掙扎了一段時(shí)間。這次的Gemini 3.5 系列,就像是谷歌最新的正面回應(yīng)。
今天起,Gemini 3.5 Flash 在谷歌的所有產(chǎn)品和 API 上向所有人開(kāi)放。
“新模型在谷歌內(nèi)部徹底改變了我們的工作方式。”P(pán)ichai 表示,他們一直在將 3.5 Flash 與重新構(gòu)想的以智能體為核心的開(kāi)發(fā)平臺(tái) Antigravity 一起使用,顯著加快了開(kāi)發(fā)速度。“3月,我們?cè)趦?nèi)部 AI 開(kāi)發(fā)工具中每天處理約 5000 億個(gè)token,之后每隔幾周就翻一倍。現(xiàn)在,我們每天處理的token數(shù)量已經(jīng)超過(guò) 3 萬(wàn)億。如此規(guī)模創(chuàng)造了強(qiáng)大的反饋循環(huán),幫助我們不斷改進(jìn) 3.5。”
下個(gè)月,谷歌預(yù)計(jì)推出Gemini 3.5 Pro。據(jù)悉,谷歌在內(nèi)部已經(jīng)在使用它,其顯示出很大的改進(jìn)。
Gemini Omni:
將你的想法轉(zhuǎn)化成電影視頻
大會(huì)上,谷歌隆重推出新模型Gemini Omni,能夠從任意輸入生成任意輸出模態(tài)的樣本。這一新模型將 Gemini 的智能與生成式媒體模型結(jié)合在一起,在現(xiàn)實(shí)世界理解上實(shí)現(xiàn)了巨大的飛躍。通過(guò)Omni,用戶可以將圖片、音頻、視頻和文本作為輸入結(jié)合,生成基于Gemini真實(shí)世界知識(shí)的高質(zhì)量視頻,也可以通過(guò)對(duì)話輕松編輯視頻。
“借助世界模型,人工智能正從預(yù)測(cè)文本轉(zhuǎn)向模擬現(xiàn)實(shí)。我們一直在努力突破這些模型的邊界。”P(pán)ichai 表示,Gemini Omni將從視頻輸出開(kāi)始,隨后會(huì)支持圖像和文本。
今日起,谷歌將正式上線Omni系列的Flash版本,可以在Gemini應(yīng)用、Google Flow和YouTube Shorts上試用,未來(lái)幾周通過(guò)API向開(kāi)發(fā)者和企業(yè)客戶推廣。
據(jù)介紹,Gemini Omni 的特別之處是讓視頻編輯變得更簡(jiǎn)單,只需自然語(yǔ)言,可以修改特定事物或者改動(dòng)整個(gè)場(chǎng)景,還可以修改環(huán)境、角度、風(fēng)格,甚至具體細(xì)節(jié),同時(shí)始終保持原始場(chǎng)景的連貫性。并且,每條指令都可以在前一條的基礎(chǔ)上繼續(xù)操作,角色保持一致,物理規(guī)律得以維持,場(chǎng)景也記得之前發(fā)生的事情。
除了構(gòu)建逼真的場(chǎng)景,Gemini Omni 還能推理接下來(lái)應(yīng)該發(fā)生什么。它可以將對(duì)物理規(guī)律的直覺(jué)理解與 Gemini 對(duì)歷史、科學(xué)和文化背景的知識(shí)結(jié)合起來(lái),實(shí)現(xiàn)從照片級(jí)真實(shí)到有意義故事講述的跨越。Omni 還能利用 Gemini 的知識(shí),將語(yǔ)言、圖像和意義聯(lián)系起來(lái),其能力遠(yuǎn)超簡(jiǎn)單的模式匹配。
不過(guò),所有用Omni制作的視頻都包含肉眼幾乎察覺(jué)不到的SynthID數(shù)字水印,用戶可以通過(guò)Gemini應(yīng)用、Chrome中的Gemini和Google搜索輕松驗(yàn)證視頻是否是用Gemini Omni生成的。
兩款智能體加持
Gemini應(yīng)用更“實(shí)用”了
對(duì)于Gemini應(yīng)用來(lái)說(shuō),這一年是豐收的一年。去年在谷歌I/O大會(huì)上,Gemini服務(wù)了4億用戶。如今,每月有超過(guò)9億人在230個(gè)國(guó)家、70多種語(yǔ)言中向Gemini尋求幫助。
據(jù)介紹,Gemini應(yīng)用來(lái)新增了兩個(gè)智能體功能。首先是晨間摘要智能體Daily Brief ,它基于近期 Google Labs 實(shí)驗(yàn) CC 的成功經(jīng)驗(yàn),讓用戶可以無(wú)縫、直觀地進(jìn)入 AI 智能體的世界。一旦你選擇加入,Gemini 會(huì)在后臺(tái)跨你已連接的應(yīng)用運(yùn)行。它會(huì)從 Gmail 收件箱收集緊急更新,從日歷跟蹤即將發(fā)生的事件,并將相關(guān)的后續(xù)信息整理成一份易于瀏覽的簡(jiǎn)報(bào)。
而且,Daily Brief 的功能遠(yuǎn)超簡(jiǎn)單的摘要。它會(huì)根據(jù)你的具體目標(biāo)主動(dòng)組織和優(yōu)先排序內(nèi)容,甚至?xí)ㄗh你立即可采取的下一步行動(dòng)。你還可以通過(guò)簡(jiǎn)單的“點(diǎn)贊”或“點(diǎn)踩”反饋來(lái)引導(dǎo)它的行為,使其越用越懂你。今天起,Daily Brief 開(kāi)始向美國(guó)的 Google AI Plus、Pro 和 Ultra 用戶推出。
谷歌還推出了 Gemini Spark,這是一款全天候 24/7 個(gè)人 AI 智能體,標(biāo)志著 Gemini 的一次重大轉(zhuǎn)變:從一個(gè)可以回答問(wèn)題的助手,升級(jí)為一個(gè)可以在用戶的指示下實(shí)際完成工作、成為主動(dòng)合作伙伴的智能體。
“我對(duì) Gemini Spark 特別興奮。它是 Gemini 應(yīng)用中的個(gè)人 AI 智能體,可以幫助你管理數(shù)字生活,根據(jù)你的指令代你執(zhí)行操作。”P(pán)ichai 表示。
據(jù)介紹,Gemini Spark 基于 Gemini 3.5 并使用 Antigravity 框架,與你日常依賴的 Workspace 工具(如 Gmail、Docs、Slides 等)深度集成。更棒的是,因?yàn)樗腔谠频闹悄荏w,即便你關(guān)閉筆記本或鎖屏手機(jī),Spark 也會(huì)在后臺(tái)持續(xù)工作。這意味著 Spark 可以承擔(dān)復(fù)雜任務(wù),讓你騰出時(shí)間專注于最重要的事情。
使用 Gemini Spark,你可以設(shè)置重復(fù)任務(wù)或觸發(fā)器,自動(dòng)解析每月信用卡賬單,標(biāo)記新增或隱藏的訂閱費(fèi)用;教它新技能,讓它定期檢查孩子學(xué)校的郵件更新,提取關(guān)鍵截止日期,并將每日匯總簡(jiǎn)報(bào)發(fā)送給你和你的伴侶。創(chuàng)建完整工作流,讓它整合郵件和聊天中的會(huì)議原始記錄,生成整理好的 Google Docs 文檔,甚至起草啟動(dòng)項(xiàng)目的配套郵件。
這僅僅是開(kāi)始, Gemini Spark有豐富的功能路線圖。今天,谷歌擴(kuò)展了 Gemini 連接應(yīng)用列表,通過(guò) MCP 新增了 Canva、OpenTable 和 Instacart 的連接。未來(lái)幾周,Spark 將可以利用這些 MCP 連接完成更多任務(wù)。之后,谷歌還將增加新能力,包括通過(guò)短信和郵件與 Spark 互動(dòng)、創(chuàng)建自定義子智能體以及操作本地瀏覽器。
據(jù)悉,Spark 會(huì)完全在用戶的指揮下運(yùn)行。用戶可以選擇是否啟用它,以及連接哪些應(yīng)用;在執(zhí)行高風(fēng)險(xiǎn)操作(如花費(fèi)資金或發(fā)送郵件)前,它會(huì)先征求確認(rèn)。Gemini Spark 本周將向受信任測(cè)試者推出,計(jì)劃下周向美國(guó) Google AI Ultra 用戶推出 Beta 版本。
25年來(lái)搜索最大升級(jí)
AI帶來(lái)新紀(jì)元
同時(shí), 谷歌帶來(lái)了 25 年來(lái) Search 框的最大升級(jí):全面 AI 化。
“隨著我們進(jìn)入這個(gè)智能體時(shí)代,搜索將比以往任何時(shí)候都更有幫助和強(qiáng)大。”P(pán)ichai 說(shuō)道。據(jù)介紹,谷歌在 Search 中引入了信息智能體。這些是用戶可以設(shè)置的個(gè)性化 AI 智能體,它們可以在后臺(tái)全天候工作,在你最需要的時(shí)候找到信息,并幫助你執(zhí)行操作。據(jù)介紹,信息智能體將在今年夏天逐步推出,首先面向 Google AI Pro 和 Ultra 用戶。
“我們構(gòu)建真正智能體化 Search 的另一種方式是賦予其智能體編程能力。”現(xiàn)在,Gemini 3.5 Flash已經(jīng)成為全球用戶在 Google 搜索 AI 模式下的全新默認(rèn)模型。“憑借 Gemini 3.5 Flash 和 Google Antigravity 的強(qiáng)大能力,Search 可以為用戶的每個(gè)問(wèn)題創(chuàng)建個(gè)性化體驗(yàn),例如動(dòng)態(tài)布局和交互式可視化。這些生成式 UI 功能將在今年夏天向所有用戶免費(fèi)開(kāi)放。”
對(duì)于需要長(zhǎng)期持續(xù)處理的任務(wù),Search 還能更進(jìn)一步創(chuàng)建持久化、定制化的儀表盤(pán)或追蹤器,用戶可以隨時(shí)返回并繼續(xù)操作,可以把它們看作是為特定任務(wù)定制的迷你應(yīng)用。未來(lái)幾個(gè)月,用戶將能夠在 Search 中使用 Antigravity 構(gòu)建個(gè)性化體驗(yàn),首批面向美國(guó)的 Google AI Pro 和 Ultra 用戶。
另外,谷歌還致力于讓用戶與 Search 的對(duì)話更簡(jiǎn)單順暢。用戶可以直接在 AI 概覽界面提出后續(xù)問(wèn)題,并通過(guò) AI 模式進(jìn)行連續(xù)的對(duì)話交流。上下文信息會(huì)隨你保留,隨著深入探索,相關(guān)鏈接和參考文章也會(huì)變得更加精準(zhǔn),這個(gè)無(wú)縫體驗(yàn)已在全球桌面和移動(dòng)端上線。
從今天起,新的智能 Search 框開(kāi)始在所有支持 AI 模式的國(guó)家和語(yǔ)言中逐步推出。
聲明:本文為 AI 前線整理,不代表平臺(tái)觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。
會(huì)議推薦
Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過(guò)?研發(fā)體系不重構(gòu),還能撐多久?
AICon 上海站 2026,13 大重磅專題已上線,誠(chéng)摯邀請(qǐng)你登臺(tái)分享實(shí)戰(zhàn)經(jīng)驗(yàn)。AICon 2026,期待與你同行。快來(lái)掃碼鎖定 8 折專屬席位或提交演講議題
今日薦文
你也「在看」嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.