![]()
新智元報道
編輯:艾倫
【新智元導讀】微軟用一套多 Agent 系統在 AI 漏洞發現的頂級基準測試上拿下第一,超過 Anthropic 最強模型 Mythos 五個百分點。詭異的是,微軟自己并沒有一個能打的前沿模型。它用別人的模型組了個系統,打敗了造出這些模型的公司。這對AI競爭格局的啟示,比這個工具挖出了大量 Windows 漏洞本身更重要。
最強黑客大模型 Mythos,居然被黑馬超越了!
5 月 12 日,微軟發布了代號 MDASH 的 AI 安全系統,同時登頂 CyberGym 基準測試榜首,成績 88.45%。
排在它后面的是 Anthropic 的 Mythos Preview(83.1%)和 OpenAI 的 GPT-5.5(81.8%)。
![]()
https://www.cybergym.io/
CyberGym 榜單上,Anthropic 用的是自家最強模型 Mythos,OpenAI 用的是自家最強模型 GPT-5.5。
微軟用的是什么?
答案是,別人家的模型。
微軟在博客里明確寫道,MDASH 使用的全部是「generally available models」,即市面上公開可用的模型。
![]()
![]()
https://www.microsoft.com/en-us/security/blog/2026/05/12/defense-at-ai-speed-microsofts-new-multi-model-agentic-security-system-tops-leading-industry-benchmark/
微軟自己并沒有一個能與 Mythos 或 GPT-5.5 競爭的前沿模型。
在這張榜單上,如果微軟拿單個模型去跑,成績大概率會落到中下游。
但它組了一套系統,調度 100 多個專業化 Agent,讓多個模型分工協作,跑出了比任何單一模型都高的分數。
用別人的磚,蓋了最高的樓。
微軟已經用這套工具,挖出了自家 Windows 11 系統 16 個高危漏洞!
![]()
遠程執行導致藍屏的漏洞 CVE-2026-33827 效果演示
這是個什么榜單
CyberGym 由 UC Berkeley 團隊開發,論文發表在 ICLR 2026,是目前 AI 安全能力評估領域最權威的公開基準之一。
![]()
https://arxiv.org/pdf/2506.02548
Anthropic、OpenAI、Meta、智譜都在上面提交過成績。
測試方式很直接,給 AI 一段有已知漏洞的代碼和漏洞描述,讓它自己寫出能觸發漏洞的攻擊代碼。
1507 道題,來自 188 個真實開源項目。
能不能挖到漏洞、能不能證明它可被利用,一測便知。
一個細節值得留意,榜單成績由各公司自行提交,基準代碼公開但無獨立第三方驗證。
多 Agent 系統的強大能力
MDASH 帶來的核心啟示:「系統」可以抹平甚至反超「模型」的差距。
Anthropic 花了巨大的研發投入訓練出 Mythos,這是目前公認的安全領域最強單一模型,強到 Anthropic 自己都不敢公開發布,只通過一個叫 Project Glasswing 的聯盟向少數公司定向開放。
OpenAI 的 GPT-5.5 同樣是傾全公司之力訓出的前沿模型。
微軟沒有這樣的模型。
但它有一套流水線,把「準備→掃描→驗證→去重→證明」五個階段拆開,每個階段用不同的 Agent、不同的模型去跑。
審計 Agent 和辯論 Agent 分開,發現漏洞和證明漏洞分開,重度推理用大模型、高頻驗證用蒸餾小模型。
![]()
關鍵在于,這套系統對底層模型不綁定。
新模型出來,換個配置跑 A/B 測試就行,前面積累的所有工程資產全部復用。
微軟在博客里特別強調了這一點——「the model is one input」,模型只是眾多輸入之一。
![]()
這對 Anthropic 和 OpenAI 構成一種新型威脅。
它們燒了天文數字的美元訓出來的模型優勢,被一個系統層的競爭者用工程手段消解了。
更扎心的是,微軟用的還是它們自己的模型。
這將對 ASI 終局帶來哪些潛在變數
在前沿模型這張牌桌上,真正有籌碼的只有 Anthropic 和 OpenAI。
微軟雖然是 OpenAI 最大的投資方和云計算合作伙伴,但它自己并沒有訓出過一個真正進入第一梯隊的旗艦大模型。
這次 CyberGym 的結果把一個問題擺上了臺面,通往 ASI 的路徑,到底是一條還是兩條?
路徑一是 Anthropic 和 OpenAI 正在走的,把單一模型推到極致。
Mythos 在安全領域的能力已經強到需要限制發布,GPT-5.5 在多個基準上持續刷新紀錄。
![]()
Mythos 僅通過 Project Glasswing 測試
這條路需要海量算力、海量數據、頂尖的研究團隊,門檻極高。
路徑二就是微軟用 MDASH 展示的,不追求造出最強的單一模型,轉而構建一個能把現有模型能力最大化的系統。
100 多個 Agent 各司其職,模型之間的分歧變成信號,多階段流水線把單次推理做不到的事情通過任務分解實現。
MDASH 的成績證明了路徑二至少在特定領域是可行的。
但這不代表路徑二可以替代路徑一。
MDASH 用的底層模型仍然來自路徑一的公司。
如果 Anthropic 和 OpenAI 停止訓練更強的模型,MDASH 的天花板也會停滯。
這件事不只關乎微軟
多 Agent 系統作為一種范式,正在從實驗走向生產。
MDASH 團隊的多位核心成員來自 Team Atlanta,就是在 DARPA AI 網絡挑戰賽中贏得 2950 萬美元獎金的隊伍。
他們驗證過的一個核心判斷是,讓 AI 做到專業級別的安全審計,工程量遠超模型本身。
微軟這次同時公布了 16 個由 MDASH 輔助發現的 Windows 漏洞,其中 4 個是 Critical(關鍵)級別的遠程代碼執行。
這些漏洞大多可以在無需認證的情況下從網絡側觸發,已在 5 月 Patch Tuesday 中修復。
在內部回溯測試中,MDASH 對 Windows 核心組件 clfs.sys 過去五年的已確認漏洞召回率達到 96%,tcpip.sys 達到 100%。
![]()
這些數字的分量在于,它們來自實戰,不只是跑分。
16 個 CVE 已經進入微軟的正式補丁流程,96% 的召回率對標的是過去五年真實被攻擊者利用過的漏洞。
微軟在博客中說,以后的 Patch Tuesday 會越來越大。
AI 正在加速漏洞發現的速度,補丁規模自然水漲船高。
這句話的另一面同樣成立,攻擊者也能用同樣的技術。
MDASH 用的全是公開可用的模型,沒有任何技術上的獨占壁壘。
還該關注些什么
對行業來說,MDASH 的意義大于 MDASH 本身。
它驗證了一個猜想:在 AI 能力的下一階段競爭中,「圍繞模型構建系統」可能和「訓練更強模型」同等重要。
這對三類人有不同的含義。
對模型公司(Anthropic、OpenAI),它敲響了一個警鐘。
模型能力的領先不能自動轉化為應用層的領先。
別人可以用你的模型,在你的地盤上贏你。
對平臺公司(谷歌、微軟),它指出了一條差異化路徑。
沒有最強模型?沒關系,構建最強系統。
但前提是,你得深刻理解具體領域的工程細節,100 多個 Agent 的分工設計、領域插件、驗證流水線,這些東西的積累門檻同樣很高。
對普通用戶,這件事的直接影響很簡單,及時打補丁,否則不懂技術的人也能借助 AI 利用這類漏洞。
MDASH 目前也像 Mythos 和 GPT-5.5 Cyber 一樣,正在進行小范圍客戶私測,微軟未公布定價和正式發布時間。
參考資料:
https://www.microsoft.com/en-us/security/blog/2026/05/12/defense-at-ai-speed-microsofts-new-multi-model-agentic-security-system-tops-leading-industry-benchmark/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.