<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      最強黑客大模型,不再是Mythos

      0
      分享至


      新智元報道

      編輯:艾倫

      【新智元導讀】微軟用一套多 Agent 系統在 AI 漏洞發現的頂級基準測試上拿下第一,超過 Anthropic 最強模型 Mythos 五個百分點。詭異的是,微軟自己并沒有一個能打的前沿模型。它用別人的模型組了個系統,打敗了造出這些模型的公司。這對AI競爭格局的啟示,比這個工具挖出了大量 Windows 漏洞本身更重要。

      最強黑客大模型 Mythos,居然被黑馬超越了!

      5 月 12 日,微軟發布了代號 MDASH 的 AI 安全系統,同時登頂 CyberGym 基準測試榜首,成績 88.45%。

      排在它后面的是 Anthropic 的 Mythos Preview(83.1%)和 OpenAI 的 GPT-5.5(81.8%)。


      https://www.cybergym.io/

      CyberGym 榜單上,Anthropic 用的是自家最強模型 Mythos,OpenAI 用的是自家最強模型 GPT-5.5。

      微軟用的是什么?

      答案是,別人家的模型。

      微軟在博客里明確寫道,MDASH 使用的全部是「generally available models」,即市面上公開可用的模型。



      https://www.microsoft.com/en-us/security/blog/2026/05/12/defense-at-ai-speed-microsofts-new-multi-model-agentic-security-system-tops-leading-industry-benchmark/

      微軟自己并沒有一個能與 Mythos 或 GPT-5.5 競爭的前沿模型。

      在這張榜單上,如果微軟拿單個模型去跑,成績大概率會落到中下游。

      但它組了一套系統,調度 100 多個專業化 Agent,讓多個模型分工協作,跑出了比任何單一模型都高的分數。

      用別人的磚,蓋了最高的樓。

      微軟已經用這套工具,挖出了自家 Windows 11 系統 16 個高危漏洞!


      遠程執行導致藍屏的漏洞 CVE-2026-33827 效果演示

      這是個什么榜單

      CyberGym 由 UC Berkeley 團隊開發,論文發表在 ICLR 2026,是目前 AI 安全能力評估領域最權威的公開基準之一。


      https://arxiv.org/pdf/2506.02548

      Anthropic、OpenAI、Meta、智譜都在上面提交過成績。

      測試方式很直接,給 AI 一段有已知漏洞的代碼和漏洞描述,讓它自己寫出能觸發漏洞的攻擊代碼。

      1507 道題,來自 188 個真實開源項目。

      能不能挖到漏洞、能不能證明它可被利用,一測便知。

      一個細節值得留意,榜單成績由各公司自行提交,基準代碼公開但無獨立第三方驗證。

      多 Agent 系統的強大能力

      MDASH 帶來的核心啟示:「系統」可以抹平甚至反超「模型」的差距。

      Anthropic 花了巨大的研發投入訓練出 Mythos,這是目前公認的安全領域最強單一模型,強到 Anthropic 自己都不敢公開發布,只通過一個叫 Project Glasswing 的聯盟向少數公司定向開放。

      OpenAI 的 GPT-5.5 同樣是傾全公司之力訓出的前沿模型。

      微軟沒有這樣的模型。

      但它有一套流水線,把「準備→掃描→驗證→去重→證明」五個階段拆開,每個階段用不同的 Agent、不同的模型去跑。

      審計 Agent 和辯論 Agent 分開,發現漏洞和證明漏洞分開,重度推理用大模型、高頻驗證用蒸餾小模型。


      關鍵在于,這套系統對底層模型不綁定。

      新模型出來,換個配置跑 A/B 測試就行,前面積累的所有工程資產全部復用。

      微軟在博客里特別強調了這一點——「the model is one input」,模型只是眾多輸入之一。


      這對 Anthropic 和 OpenAI 構成一種新型威脅。

      它們燒了天文數字的美元訓出來的模型優勢,被一個系統層的競爭者用工程手段消解了。

      更扎心的是,微軟用的還是它們自己的模型。

      這將對 ASI 終局帶來哪些潛在變數

      在前沿模型這張牌桌上,真正有籌碼的只有 Anthropic 和 OpenAI。

      微軟雖然是 OpenAI 最大的投資方和云計算合作伙伴,但它自己并沒有訓出過一個真正進入第一梯隊的旗艦大模型。

      這次 CyberGym 的結果把一個問題擺上了臺面,通往 ASI 的路徑,到底是一條還是兩條?

      路徑一是 Anthropic 和 OpenAI 正在走的,把單一模型推到極致。

      Mythos 在安全領域的能力已經強到需要限制發布,GPT-5.5 在多個基準上持續刷新紀錄。


      Mythos 僅通過 Project Glasswing 測試

      這條路需要海量算力、海量數據、頂尖的研究團隊,門檻極高。

      路徑二就是微軟用 MDASH 展示的,不追求造出最強的單一模型,轉而構建一個能把現有模型能力最大化的系統。

      100 多個 Agent 各司其職,模型之間的分歧變成信號,多階段流水線把單次推理做不到的事情通過任務分解實現。

      MDASH 的成績證明了路徑二至少在特定領域是可行的。

      但這不代表路徑二可以替代路徑一。

      MDASH 用的底層模型仍然來自路徑一的公司。

      如果 Anthropic 和 OpenAI 停止訓練更強的模型,MDASH 的天花板也會停滯。

      這件事不只關乎微軟

      多 Agent 系統作為一種范式,正在從實驗走向生產。

      MDASH 團隊的多位核心成員來自 Team Atlanta,就是在 DARPA AI 網絡挑戰賽中贏得 2950 萬美元獎金的隊伍。

      他們驗證過的一個核心判斷是,讓 AI 做到專業級別的安全審計,工程量遠超模型本身。

      微軟這次同時公布了 16 個由 MDASH 輔助發現的 Windows 漏洞,其中 4 個是 Critical(關鍵)級別的遠程代碼執行。

      這些漏洞大多可以在無需認證的情況下從網絡側觸發,已在 5 月 Patch Tuesday 中修復。

      在內部回溯測試中,MDASH 對 Windows 核心組件 clfs.sys 過去五年的已確認漏洞召回率達到 96%,tcpip.sys 達到 100%。


      這些數字的分量在于,它們來自實戰,不只是跑分。

      16 個 CVE 已經進入微軟的正式補丁流程,96% 的召回率對標的是過去五年真實被攻擊者利用過的漏洞。

      微軟在博客中說,以后的 Patch Tuesday 會越來越大。

      AI 正在加速漏洞發現的速度,補丁規模自然水漲船高。

      這句話的另一面同樣成立,攻擊者也能用同樣的技術。

      MDASH 用的全是公開可用的模型,沒有任何技術上的獨占壁壘。

      還該關注些什么

      對行業來說,MDASH 的意義大于 MDASH 本身。

      它驗證了一個猜想:在 AI 能力的下一階段競爭中,「圍繞模型構建系統」可能和「訓練更強模型」同等重要。

      這對三類人有不同的含義。

      對模型公司(Anthropic、OpenAI),它敲響了一個警鐘。

      模型能力的領先不能自動轉化為應用層的領先。

      別人可以用你的模型,在你的地盤上贏你。

      對平臺公司(谷歌、微軟),它指出了一條差異化路徑。

      沒有最強模型?沒關系,構建最強系統。

      但前提是,你得深刻理解具體領域的工程細節,100 多個 Agent 的分工設計、領域插件、驗證流水線,這些東西的積累門檻同樣很高。

      對普通用戶,這件事的直接影響很簡單,及時打補丁,否則不懂技術的人也能借助 AI 利用這類漏洞。

      MDASH 目前也像 Mythos 和 GPT-5.5 Cyber 一樣,正在進行小范圍客戶私測,微軟未公布定價和正式發布時間。

      參考資料:

      https://www.microsoft.com/en-us/security/blog/2026/05/12/defense-at-ai-speed-microsofts-new-multi-model-agentic-security-system-tops-leading-industry-benchmark/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      央媒發聲!62歲倪夏蓮銳評陳夢,不提球技卻一針見血

      央媒發聲!62歲倪夏蓮銳評陳夢,不提球技卻一針見血

      李虰手工制作
      2025-11-28 22:54:55
      寧愿用早田希娜,也不用橫掃王曼昱的她,中澤銳這步險棋實在太妙

      寧愿用早田希娜,也不用橫掃王曼昱的她,中澤銳這步險棋實在太妙

      以茶帶書
      2026-05-14 13:39:59
      贊美苦難是一種虛妄和扭曲

      贊美苦難是一種虛妄和扭曲

      尚曦讀史
      2026-05-14 18:13:09
      大開眼界!第一次見國宴桌面布景,細節拉滿,中式美學驚艷世界

      大開眼界!第一次見國宴桌面布景,細節拉滿,中式美學驚艷世界

      阿離家居
      2026-05-15 11:43:10
      《愛情沒有神話》大結局,人生贏家孤煙,一個擁有1000萬存款的宅男

      《愛情沒有神話》大結局,人生贏家孤煙,一個擁有1000萬存款的宅男

      陳意小可愛
      2026-05-15 10:55:22
      同樣是國乒男隊功臣,王皓梁靖崑是兒子接機,他卻很低調是女兒接

      同樣是國乒男隊功臣,王皓梁靖崑是兒子接機,他卻很低調是女兒接

      凡知
      2026-05-14 15:05:20
      王楚欽不打球時帥到掉渣!珠寶展一身黑西裝:胸針價值預估超60萬

      王楚欽不打球時帥到掉渣!珠寶展一身黑西裝:胸針價值預估超60萬

      顏小白的籃球夢
      2026-05-15 08:59:27
      從20萬到16億,一個普通散戶的“笨辦法”投資傳奇

      從20萬到16億,一個普通散戶的“笨辦法”投資傳奇

      流蘇晚晴
      2026-04-20 20:13:29
      基本盤不是貶義詞

      基本盤不是貶義詞

      關爾東
      2026-05-13 23:41:38
      被曝和謝霆鋒吃飯僅3天,張柏芝又迎來好消息,仨孩子更有底氣了

      被曝和謝霆鋒吃飯僅3天,張柏芝又迎來好消息,仨孩子更有底氣了

      楊仔述
      2026-05-15 09:26:53
      馬斯克背后的女人曝光!她給中國父母上的最狠的一課:做一個“自私”的媽媽!

      馬斯克背后的女人曝光!她給中國父母上的最狠的一課:做一個“自私”的媽媽!

      一刻talks丨硬科技趣思想
      2026-01-31 20:34:10
      特朗普在國宴當晚破例“喝酒”?美國總統舉杯敬酒分量不小

      特朗普在國宴當晚破例“喝酒”?美國總統舉杯敬酒分量不小

      硯底沉香LIU
      2026-05-15 11:23:00
      食堂阿姨偷偷給貧困生多打菜,被同學舉報后開除,次日接到局里電話

      食堂阿姨偷偷給貧困生多打菜,被同學舉報后開除,次日接到局里電話

      罪案洞察者
      2025-11-03 13:59:03
      卸磨殺驢的結果!文胖:詹皇愿去別隊拿中產,也不愿降薪3000萬

      卸磨殺驢的結果!文胖:詹皇愿去別隊拿中產,也不愿降薪3000萬

      錢說體育
      2026-05-15 09:05:10
      美防長直冒冷汗!目睹中國儀仗隊,生怕特朗普下達一命令

      美防長直冒冷汗!目睹中國儀仗隊,生怕特朗普下達一命令

      舟望停云
      2026-05-15 09:35:42
      詹姆斯去留不是焦點,東契奇只是另一個哈登,才是湖人爭冠致命傷

      詹姆斯去留不是焦點,東契奇只是另一個哈登,才是湖人爭冠致命傷

      姜大叔侃球
      2026-05-15 11:27:03
      人倫之亂,正在悄悄毀掉無數家庭!看完一身冷汗

      人倫之亂,正在悄悄毀掉無數家庭!看完一身冷汗

      三農老歷
      2026-05-08 19:20:12
      特朗普訪華前,高市早苗又想半途“攔路”,對中美大事指手畫腳

      特朗普訪華前,高市早苗又想半途“攔路”,對中美大事指手畫腳

      鍋鍋愛歷史
      2026-05-15 11:45:03
      “余生好好走”,知名央視主持人王小丫,病床上的留言字字催淚

      “余生好好走”,知名央視主持人王小丫,病床上的留言字字催淚

      近史談
      2026-03-31 18:57:49
      球衣裝備網:阿迪達斯將復刻南斯拉夫隊球衣,預計2027年推出

      球衣裝備網:阿迪達斯將復刻南斯拉夫隊球衣,預計2027年推出

      懂球帝
      2026-05-15 00:30:13
      2026-05-15 12:55:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      15218文章數 66869關注度
      往期回顧 全部

      科技要聞

      兩年聯姻一地雞毛,傳蘋果OpenAI瀕臨決裂

      頭條要聞

      歡迎宴會座位公開:馬斯克黃仁勛與中國企業家同桌吃飯

      頭條要聞

      歡迎宴會座位公開:馬斯克黃仁勛與中國企業家同桌吃飯

      體育要聞

      德約科維奇買的球隊,從第6級聯賽升入法甲

      娛樂要聞

      方媛回應住男生單人間:女孩的配得感

      財經要聞

      特朗普的北京時刻

      汽車要聞

      雙零重力座椅/AI智能體/調光天幕 啟境GT7內飾發布

      態度原創

      手機
      旅游
      藝術
      數碼
      公開課

      手機要聞

      紅魔11S Pro系列手機搭載8000mAh電池,自帶80W氮化鎵充電器

      旅游要聞

      天壇“同款機位”,成為熱門打卡點

      藝術要聞

      一個北大 “反卷教授” 的意外走紅

      數碼要聞

      佰維M560靈梭SSD評測:單面顆粒+5.2W低功耗,筆記本擴容實力之選

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 天天婬欲婬香婬色婬视频播放| 人妻一区二区三区三区| 亚洲精品人妻无码| 国产精品碰碰现在自在拍| 久久综合色播五月男人的天堂| 亚洲国产午夜精品福利| 熟女A片| 本道久久综合无码中文字幕 | 国产精品成人免费综合| 国产福利深夜在线播放| 亚洲人成网站www| 色yeye免费视频免费播放| 亚洲午夜精品国产电影在线观看 | 国产成人精品福利一区二区| 国产成人综合网亚洲第一| 丰满人妻被黑人猛烈进入| 精品一卡2卡三卡4卡免费网站 | 国产日产欧产精品精乱子| 蜜臀av一区二区三区人妻在线| 欧美熟妇乱子伦XX视频| 欧美视频一区| 中国精品自拍| 无码精品一区二区三区免费视频| 西西人体444www高清大胆| 欧美日韩国产一区二区三区欧| 亚洲国产精品成人av网| 亚洲 欧美 国产另类首页| 塔河县| 日韩精品永久免费视频| 成人特黄A级毛片免费视频| 精品无码国产污污污免费| 酒店大战丝袜高跟鞋人妻| 亚洲日韩欧美在线观看| 少妇无码| 少妇伦子伦精品无吗| 国产精品久久午夜夜伦鲁鲁| av在线亚洲国产精品| 99久久亚洲综合精品成人网| 亚洲av成人无码天堂| 欧美人成在线播放网站免费| 九九热视频在线播放|