![]()
新智元報道
編輯:定慧 大衛(wèi)
【新智元導(dǎo)讀】英國AI安全研究所(AISI)昨天扔下重磅炸彈:Mythos在模擬企業(yè)內(nèi)網(wǎng)32步滲透任務(wù)中10次過6,GPT-5.5也跟著10次過3,連此前所有模型都沒破過的Cooling Tower靶場都被首次攻破!更炸的是——Cyber能力翻倍周期一路壓到4.5個月,瓶頸不是智力,是Token。這場ASI決賽,人類評測已經(jīng)追不上AI了。
AI模型的網(wǎng)絡(luò)攻防能力發(fā)展有多快?
昨天,英國AI安全研究所(AISI)發(fā)了一篇博客。
他們實測了Anthropic的Mythos和OpenAI的GPT-5.5。
發(fā)現(xiàn)這些模型的網(wǎng)絡(luò)攻防能力4.5月就能翻一倍,加速沖向ASI!
![]()
一句話:前沿AI模型的自主網(wǎng)絡(luò)攻擊能力正在超級加速,翻倍周期已經(jīng)從幾年、幾個月壓到4.5個月。
實際上,我們離想象中的天網(wǎng)并不遙遠。
![]()
Anthropic的前沿紅隊負責(zé)人Logan Graham也指出:
Claude Mythos預(yù)覽版在自主網(wǎng)絡(luò)安全能力上實現(xiàn)了階躍式突破。
我們需要迅速為具備這種能力水平的模型世界做好準備。
![]()
上一次這個數(shù)字還是8個月,那是2025年11月的估算。
到2026年2月,縮到4.7個月。
現(xiàn)在Mythos和GPT-5.5的成績一出,AISI自己都表示:
不確定這是一次性的跳躍,還是一條更陡的新趨勢線。
翻譯成人話:他們也不知道AI還會不會繼續(xù)加速。
32步滲透,Mythos十次過六
AISI用了一套分層測試體系。
窄域網(wǎng)絡(luò)安全套件(narrow cyber suite)覆蓋逆向工程和Web漏洞利用,單任務(wù)上限12小時,每次調(diào)用限制2.5M Token。
但真正炸場的是兩個模擬企業(yè)內(nèi)網(wǎng)的攻防靶場。
![]()
第一個叫The Last Ones。
32個步驟,模擬一次完整的企業(yè)內(nèi)網(wǎng)滲透鏈,從初始突破到橫向移動到最終目標。
AISI估算,一個人類安全專家走完全流程大約需要20小時。
![]()
Mythos Preview,10次嘗試,成功6次。
GPT-5.5,10次嘗試,成功3次。
第二個靶場叫Cooling Tower。
之前所有模型都沒通過。
Mythos是第一個破關(guān)的,10次嘗試成功3次。
![]()
這不是論文里的理論推演。
這是一個已經(jīng)部署上線的模型,在模擬真實企業(yè)環(huán)境里,獨立完成了人類安全專家級別的滲透任務(wù)。
Glasswing項目負責(zé)人Logan Graham確認,測試用的這個Mythos checkpoint,就是一個月前隨Project Glasswing上線的版本。
外界現(xiàn)在看到的攻防能力,不是實驗室里的原型,是正在跑著的生產(chǎn)模型。
就在你的Claude APP里。
看下實驗結(jié)果。
下圖上有兩條紅色虛線(dotted),標著best attempt(最上面)。
那是Mythos Preview (new) 和GPT-5.5-Cyber在10次嘗試里跑出來的最佳單次成績。
這條虛線一路沖到了縱軸頂部——32步,封頂。
也就是說:在最好的那一次嘗試里,Mythos完整打穿了整條32步滲透鏈——從初始偵察,到完全網(wǎng)絡(luò)接管。
![]()
![]()
4.5個月翻一倍,METR交叉驗證
AISI算翻倍周期的方法不復(fù)雜。
他們測量的是80%可靠性網(wǎng)絡(luò)時間跨度——模型能以80%的成功率獨立完成的最長網(wǎng)絡(luò)任務(wù)時長。
把歷史上多個模型的成績畫到時間軸上,擬合指數(shù)曲線,算出翻倍時間。
從2025年11月的8個月,到2026年2月的4.7個月。
Mythos和GPT-5.5的數(shù)據(jù)點一加進去,曲線又陡了一截。
獨立評估機構(gòu)METR的基準測試給出了交叉驗證。
![]()
他們從軟件工程任務(wù)角度追蹤AI能力增長,算出的翻倍周期是4.2個月(從o1-preview算起),如果把Mythos也納入,縮到4個月。
兩條完全獨立的評估線,在同一個數(shù)量級上碰頭了。
AISI的原話:
前沿模型能夠自主完成的網(wǎng)絡(luò)任務(wù)時長,翻倍周期是以月計的,不是以年計。
Token是天花板,不是智力
這份報告里最讓人不安的不是數(shù)字本身,是AISI對瓶頸的判斷。
窄域測試套件里,每個任務(wù)限制2.5M Token。
AISI明確寫了:這個上限人為壓低了成功率。
在攻防靶場實驗里,Token上限放到了100M。
Mythos的表現(xiàn)立刻跳了一個臺階。
意思是,當前制約AI網(wǎng)絡(luò)攻擊能力的不是算法,不是推理深度,不是智能上限——是Token預(yù)算。
給夠Token,模型就能走得更遠。
![]()
AISI自己也承認了測試體系的局限:
最長任務(wù)只有12小時,超出這個范圍的能力無法衡量;人類基線數(shù)據(jù)有限;agent腳手架過于簡單,人為約束了模型發(fā)揮。
換句話說,真實能力很可能比測出來的還要高。
這就是為什么報告的結(jié)論用了翻倍而不是接近天花板。
他們沒有看到天花板。
![]()
評測在追,模型在跑
把Logan Graham那句話再拎出來看一遍。
![]()
測試用的Mythos checkpoint,一個月前就上線了。
![]()
AISI的評估報告昨天才發(fā)。
這中間隔了整整一個月。
而在這一個月里,Anthropic大概率已經(jīng)迭代了新的checkpoint。
當安全評估結(jié)果公開的那一刻,被評估的版本已經(jīng)是舊的了。
![]()
這不是AISI一家的困境。
整個AI安全評測領(lǐng)域都在面對同一個結(jié)構(gòu)性問題:
模型迭代速度正在系統(tǒng)性地超越安全評估周期。
評估結(jié)果發(fā)布時,告訴你的是上個月的模型能做到什么。
它沒法告訴你現(xiàn)在的模型能做到什么。
AISI在報告里用了一個很謹慎的表述:
他們不確定Mythos和GPT-5.5的跳躍是孤立的突破還是新的更快趨勢。
AI模型決賽階段的新變量
Anthropic的Mythos和OpenAI的GPT-5.5,在網(wǎng)絡(luò)攻防能力上都展現(xiàn)了指數(shù)級增長。
Mythos領(lǐng)先一個身位——6/10 vs 3/10,且獨家攻破了Cooling Tower靶場——但GPT-5.5同樣在快速追趕。
雙雄在能力層面狂飆,安全治理層面卻出現(xiàn)了一個越拉越大的缺口。
不到半年,4.5個月就能翻一倍。
這個速度意味著,到2026年底,前沿模型能自主完成的網(wǎng)絡(luò)任務(wù)復(fù)雜度,將是現(xiàn)在的4到8倍。
當一個AI模型能在沒有人類干預(yù)的情況下,獨立完成一個訓(xùn)練有素的安全專家需要20小時才能走完的滲透鏈,全球每一個連著網(wǎng)線的企業(yè)都應(yīng)該重新審視自己的防線。
AISI介紹
AISI的身份是全球首個國家級前沿AI風(fēng)險評估機構(gòu)。
![]()
2023年11月 Bletchley峰會成立,2024年05月, 由Safety改名為Security,隸屬英國DSIT。
AISI的主要職能是網(wǎng)絡(luò)/生化/自主行為/欺騙傾向的獨立評估。
最關(guān)鍵的是,他們能拿到OpenAI、Anthropic、DeepMind等頂級模型公司的pre-deployment訪問權(quán),也就是說,他們是這些最先進模型的第一批訪問者。
ASI,即Artifical Super Intelligence,超(級)人工智能。
參考資料:
https://www.aisi.gov.uk/blog/how-fast-is-autonomous-ai-cyber-capability-advancing
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.