<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      Gemini 3 深夜發布:碾壓GPT-5.1、超越Claude 4.5,中文卻是短板?

      0
      分享至

      從數學競賽的 “地獄級” 突破到智能體開發平臺的生態革新,這場由 TPU 算力支撐的技術爆發,標志著 Google 在 AGI 賽道強勢回歸。但光鮮戰績背后,中文表現與寫作能力的明顯短板,也讓這場 “最好 LLM” 之爭留下了更多懸念。

      ———— / BEGIN / ————

      推特上喊了快 1個月的 Gemini 3「馬上發布」,昨晚狼真的來了!


      沒有任何多余的廢話,打開 Model Card,滿眼寫著的只有兩個字:碾壓。連 Sam Altman 都久違地獻上了自己的點贊。


      這一次,那個曾經定義了 Transformer、如今「All in Gemini」的巨人,真的殺回來了。

      全面霸榜的推理怪獸:SOTA 殺瘋了

      事實證明,Google 沒有讓等待的人失望。Gemini 3 Pro 的發布再一次定義了 SOTA(State-Of-The-Art)。


      根據 Google 披露的數據,Gemini 3 Pro 在推理、多模態、Agent 工具使用等關鍵基準上,實現了全方位的霸榜。

      • 數學能力的「地獄級」碾壓:在數學競賽的「地獄模式」MathArena Apex 里,當包括 GPT-5.1 在內的其他大模型還在1%上下掙扎時,Gemini 3 Pro 直接干到了23.4%。這就像小學生還在掰手指算加減法,旁邊的 Gemini 3 已經開始徒手搓火箭了。

      • 人類智力的天花板:在 Humanity’s Last Exam(人類最終大考)中,Gemini 3 Pro 轟出了37.5%的高分(GPT-5.1 為 26.5%)。在開啟工具使用后,更是達到了45.8%

      • 視覺智能的質變:在衡量屏幕理解能力的 ScreenSpot-Pro 測試中,GPT-5.1 得分僅為 3.5%(基本是瞎子),而 Gemini 3 Pro 高達72.7%。這是近乎20 倍的能力碾壓!


      但這還不是極限。

      Google 還藏了一手Gemini 3 Deep Think(深度思考模式)

      在不使用任何工具的情況下,Deep Think 模式在 Humanity's Last Exam 上的得分飆升至41.0%

      在 ARC-AGI-2 上更是取得了前所未有的45.1%的得分。

      這意味著模型在處理復雜學術問題時,已經具備了完全不同的理解深度。


      顛覆性的交互體驗:生成式 UI 與 Vibe Coding

      Gemini 3 的野心不止于跑分,它正在從 Chatbot 進化為Generative App

      首創「生成式界面」(GenUI):以前的 AI 給你文字或代碼,現在的 Gemini 3 能直接為你生成一個交互界面。比如搜索「RNA 聚合酶工作原理」,它不再扔給你一堆鏈接,而是利用強大的推理能力,即時生成(Generated on the fly)一個沉浸式的互動 3D 分子模型。你不僅可以瀏覽,還能點進去和里面的元素交互。

      Vibe Coding:理解你的「直覺」Gemini 3 引入了「Vibe Coding」概念。你不需要清楚地描述開發要求,它能捕捉你的開發風格和模糊意圖。只用一句話,Gemini 3 就能通過感知你的「編碼直覺」,直接生成全功能的應用程序。

      實測了幾個案例,前端能力簡直炸裂

      復刻 Web OS:僅僅輸入一段 Prompt,要求創建一個類似 Windows 的 Web OS。Gemini 3 Pro 寫了將近 2 分鐘,結果真的生造了一個系統!從終端、代碼編輯器到畫圖工具,大部分功能竟然都是可用的。

      復古 3D 游戲:編寫一款具有豐富視覺效果的太空飛船游戲,一句話搞定(from 機器之心」


      Google Antigravity:Agent 優先的開發平臺

      有了最強的模型,Google 直接在應用層「掀桌子」,扔出了小王炸——Google Antigravity

      這不僅僅是一個 IDE,它是 Google 定義的Agent-first(智能體優先)開發平臺。在這里,Gemini 3 化身為擁有編輯器、終端和瀏覽器完整權限的「執行合伙人」。

      Antigravity 配置了一個「模型軍團」協同作戰:

      • Gemini 3:大腦,負責推理和寫代碼。

      • Gemini 2.5 Computer Use:手眼,控制瀏覽器進行 UI 驗證。

      • Nano Banana:美工,生成圖像和 UI 素材。

      這種打通底層模型到頂層交互的閉環體驗,對于 Cursor 等現有編輯器來說,無疑是一次降維打擊。Agent 可以代表你自主規劃并執行復雜的端到端軟件任務,甚至自己打開瀏覽器驗證 UI,發現報錯自己修。

      致命短板:寫作能力慘遭 Claude 4.5 吊打

      雖然代碼和推理能力強到讓人頭皮發麻,但在寫作能力上,Gemini 3 Pro 卻讓人大跌眼鏡。

      實測顯示,在科普文章寫作方面,Gemini 3.0 的表現幾乎是在「御三家」里墊底

      以「基于上下文工程技術文章寫科普文」為例:

      • Claude 4.5 Sonnet:寫了 3000 字,場景描述抓人,用咨詢顧問做類比把抽象概念講透,結尾還能升華認知。

      • Gemini 3.0:輸出只有 1000 多字。雖然開頭用了「你有沒有過這樣的經歷」的套路,但每個觀點點到為止,缺乏展開和讓人眼前一亮的類比。

      更讓人抓狂的是,Gemini 3.0 依然保留了老毛病:喜歡在中文后面加括號注釋英文單詞(如「提示詞工程(Prompt Engineering)」),讀起來非常割裂,像是一份沒翻譯完的文檔。

      相比之下,Claude 4.5 Sonnet 理解什么時候該鋪墊、什么時候該直給,這一點目前 Gemini 3 確實還做不到。

      谷歌王者歸來

      Gemini 3 的發布,釋放了一個強烈的信號:算力霸權依然存在

      Gemini 3 Pro 是使用 Google TPU 從頭開始訓練的。當全世界都在等英偉達 GPU 時,Google 坐在自家的 TPU 礦山上,擁有極高的帶寬內存和算力冗余,這給了它肆意擴張參數規模的底氣。

      從底層的 TPU 硅基霸權,到中間層的 Antigravity 開發生態,再到頂層的生成式 UI,Google 展示了一個只有巨頭才能構建的嚴絲合縫的未來。

      雖然寫作能力略顯拉胯,但在代碼、推理和多模態交互上,Gemini 3 確實已經殺瘋了

      對于開發者而言,會不會寫前端、會不會調框架可能真的不重要了。重要的是你能不能把腦子里的東西,翻譯成精準的 Prompt。

      Gemini 3 現已全面開放,即日起可通過 Google AI Studio 體驗。

      至于它到底能不能終結「最好的 LLM」之爭?讓子彈(和服務器)再飛一會兒。

      本文來自公眾號:餅干哥哥AGI 作者:餅干哥哥AGI

      2025AI產品大會,將于12月20-21日在深圳開幕!

      聚焦“AI+行業”的落地實踐,分享AI在物流、音視頻、內容、數字化、工業制造、大數據、協同辦公、出海、具身智能、智能硬件等等領域的具體案例。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      山西親手葬好局!鐵定沒看廣東絕殺戰,軟趴籃板球放廣廈逃出生天

      山西親手葬好局!鐵定沒看廣東絕殺戰,軟趴籃板球放廣廈逃出生天

      小潌拍客在北漂
      2026-05-10 23:41:08
      1984年葉劍英病危,追悼會花圈已備好,35歲才當醫生的鐘南山憑什么臨危受命救回元帥?

      1984年葉劍英病危,追悼會花圈已備好,35歲才當醫生的鐘南山憑什么臨危受命救回元帥?

      史海孤雁
      2026-05-09 19:13:11
      250億!賴清德竄訪代價來了,斯威士蘭開始要債 盧秀燕卻聲援綠營

      250億!賴清德竄訪代價來了,斯威士蘭開始要債 盧秀燕卻聲援綠營

      聞識
      2026-05-10 18:17:01
      茶行業最大的笑話:繞過茶商,用便宜的價格買到茶農的好茶!

      茶行業最大的笑話:繞過茶商,用便宜的價格買到茶農的好茶!

      普洱話江湖
      2026-05-08 14:12:29
      暴雨大風!廣州下周將開啟“倒水”模式

      暴雨大風!廣州下周將開啟“倒水”模式

      環球網資訊
      2026-05-10 09:36:10
      比亞迪9000噸壓鑄“掀桌”!74個零件變1塊鋁,成本降5000元的造車魔法?

      比亞迪9000噸壓鑄“掀桌”!74個零件變1塊鋁,成本降5000元的造車魔法?

      生活魔術專家
      2026-05-10 18:55:56
      下一個拉什福德!卡里克親自出手,曼聯鎖定 8000 萬英格蘭紅星

      下一個拉什福德!卡里克親自出手,曼聯鎖定 8000 萬英格蘭紅星

      瀾歸序
      2026-05-10 02:06:04
      顛覆認知!新研究:魚油等保健品,卻可能是阿爾茨海默病的“加速器”

      顛覆認知!新研究:魚油等保健品,卻可能是阿爾茨海默病的“加速器”

      健康榨知機
      2026-05-09 19:23:57
      2026號1號文件:嚴禁上級機關事業單位從基層借調職工!

      2026號1號文件:嚴禁上級機關事業單位從基層借調職工!

      細說職場
      2026-05-10 11:18:10
      A股:周日下午傳來3個特大消息!明天或迎來更大級別變盤行情?

      A股:周日下午傳來3個特大消息!明天或迎來更大級別變盤行情?

      趨勢清風俠
      2026-05-10 15:29:01
      向佑南昌酒吧被拍!新女友紋身金牙煙不離手,向太放話:死都不認

      向佑南昌酒吧被拍!新女友紋身金牙煙不離手,向太放話:死都不認

      小丸子Showw
      2026-05-08 20:08:11
      排面直接拉滿!小霖霖10歲生日全員奔赴灣灣,馬筱梅格局徹底圈粉

      排面直接拉滿!小霖霖10歲生日全員奔赴灣灣,馬筱梅格局徹底圈粉

      喜歡歷史的阿繁
      2026-05-10 12:56:08
      “臺灣永遠不是中國的?” 鄭麗君放狂言,被67歲藝人當眾扇耳光

      “臺灣永遠不是中國的?” 鄭麗君放狂言,被67歲藝人當眾扇耳光

      橙星文娛
      2026-05-10 13:42:19
      伊總統和議長聯合要求外長阿拉格奇辭職,因其沒有聽命于最高領袖

      伊總統和議長聯合要求外長阿拉格奇辭職,因其沒有聽命于最高領袖

      元芳有看法
      2026-05-09 20:01:10
      憑借IPO半年浮盈至少百億!高瓴資本敗筆來了,清倉隆基巨虧近80億

      憑借IPO半年浮盈至少百億!高瓴資本敗筆來了,清倉隆基巨虧近80億

      金石隨筆
      2026-05-11 00:09:00
      懸崖秋千墜亡事件后續,排女孩后面游客發聲,有目擊者做幾天噩夢

      懸崖秋千墜亡事件后續,排女孩后面游客發聲,有目擊者做幾天噩夢

      十九妹
      2026-05-07 16:16:16
      浙江東陽,33 歲的男子,在母親長眠的公墓旁,在車里結束了生命

      浙江東陽,33 歲的男子,在母親長眠的公墓旁,在車里結束了生命

      魔都姐姐雜談
      2026-03-30 19:25:57
      海參崴的街頭,誰在出賣我們的歷史尊嚴?

      海參崴的街頭,誰在出賣我們的歷史尊嚴?

      迷世書童H9527
      2026-05-07 14:55:09
      廣州七中:關于廣播站全面停止播放外文歌曲的通知

      廣州七中:關于廣播站全面停止播放外文歌曲的通知

      必記本
      2026-05-10 17:54:30
      王博:大家的斗志要比第一場要好 孫銘徽是否復出回杭州看訓練情況

      王博:大家的斗志要比第一場要好 孫銘徽是否復出回杭州看訓練情況

      狼叔評論
      2026-05-10 23:10:04
      2026-05-11 00:39:00
      人人都是產品經理社區 incentive-icons
      人人都是產品經理社區
      想要成為大牛先從學做產品開始
      64706文章數 311608關注度
      往期回顧 全部

      數碼要聞

      Valve老款ZOTAC Steam主機十年后再營業:顯存僅3GB 仍能跑通《絲之歌》!

      頭條要聞

      兒子車禍受傷生存希望不足0.1% 母親請中醫熬"還魂湯"

      頭條要聞

      兒子車禍受傷生存希望不足0.1% 母親請中醫熬"還魂湯"

      體育要聞

      那個曾讓詹姆斯抱頭的兄弟,40歲從大學畢業了

      娛樂要聞

      趙露思老實人豁出去了 沒舞蹈天賦硬跳

      財經要聞

      白酒大逃殺

      科技要聞

      DeepSeek融資,改寫所有人的估值

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      房產
      教育
      數碼
      健康
      公開課

      房產要聞

      低價甩賣!海口這個地標商業,無人接盤!

      教育要聞

      高考地理中的共享經濟

      數碼要聞

      你昂貴的DDR5內存可能是假貨:穿著三星的馬甲 心里卻是SK海力士

      干細胞能讓人“返老還童”嗎

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美成人精品一级在线观看| 日本女V片| 极品美女国产精品免费一区| 久久99热只有频精品8| 亚洲二区中文字幕在线| 久久人人97超碰人人澡爱香蕉| 蜜桃视频成人专区在线观看| 九九国产在线| 99精品视频在线观看免费蜜桃| 天天肏屄| 久久精品国产免费观看频道| 免费国产一级 片内射老| 国产v在线| 日韩精品中文字幕无码一区| 制服丝袜一区| 免费精品国自产拍在线播放| 亚洲 欧美 国产 日韩 中文字幕 | 内射自拍| 99精品国产在热久久无码| 欧美黄色电影网站| 99视频精品全部免费 在线| jizz国产| 国产老熟女乱子一区二区| 人妻少妇一区二区三区| 久久国产美女固定| 久久这里只有精品1| 亚洲VA欧美VA国产综合| 亚洲天堂久久新| 在线91资源| 人妻聚色窝窝人体WWW一区| 国产欧美精品一区aⅴ影院| 激情综合五月网| 亚洲熟妇无码白浆www| 国产高潮精品久久AV无码| 激情综合色综合啪啪开心| 看黄网址| 欧美黑人又粗又大又爽免费| 涿州市| 91欧洲在线视精品在亚洲| 香蕉eeww99国产精选播放| 狠狠躁夜夜躁无码中文字幕|