<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Cyber天花板被打穿!AISI實測Mythos能力正以4.5月翻倍速沖向ASI

      0
      分享至


      新智元報道

      編輯:定慧 大衛(wèi)

      【新智元導(dǎo)讀】英國AI安全研究所(AISI)昨天扔下重磅炸彈:Mythos在模擬企業(yè)內(nèi)網(wǎng)32步滲透任務(wù)中10次過6,GPT-5.5也跟著10次過3,連此前所有模型都沒破過的Cooling Tower靶場都被首次攻破!更炸的是——Cyber能力翻倍周期一路壓到4.5個月,瓶頸不是智力,是Token。這場ASI決賽,人類評測已經(jīng)追不上AI了。

      AI模型的網(wǎng)絡(luò)攻防能力發(fā)展有多快?

      昨天,英國AI安全研究所(AISI)發(fā)了一篇博客。

      他們實測了Anthropic的Mythos和OpenAI的GPT-5.5。

      發(fā)現(xiàn)這些模型的網(wǎng)絡(luò)攻防能力4.5月就能翻一倍,加速沖向ASI!


      一句話:前沿AI模型的自主網(wǎng)絡(luò)攻擊能力正在超級加速,翻倍周期已經(jīng)從幾年、幾個月壓到4.5個月。

      實際上,我們離想象中的天網(wǎng)并不遙遠。


      Anthropic的前沿紅隊負責(zé)人Logan Graham也指出:

      Claude Mythos預(yù)覽版在自主網(wǎng)絡(luò)安全能力上實現(xiàn)了階躍式突破。

      我們需要迅速為具備這種能力水平的模型世界做好準備


      上一次這個數(shù)字還是8個月,那是2025年11月的估算。

      到2026年2月,縮到4.7個月。

      現(xiàn)在Mythos和GPT-5.5的成績一出,AISI自己都表示:

      不確定這是一次性的跳躍,還是一條更陡的新趨勢線。

      翻譯成人話:他們也不知道AI還會不會繼續(xù)加速。

      32步滲透,Mythos十次過六

      AISI用了一套分層測試體系

      窄域網(wǎng)絡(luò)安全套件(narrow cyber suite)覆蓋逆向工程和Web漏洞利用,單任務(wù)上限12小時,每次調(diào)用限制2.5M Token。

      但真正炸場的是兩個模擬企業(yè)內(nèi)網(wǎng)的攻防靶場。


      第一個叫The Last Ones。

      32個步驟,模擬一次完整的企業(yè)內(nèi)網(wǎng)滲透鏈,從初始突破到橫向移動到最終目標。

      AISI估算,一個人類安全專家走完全流程大約需要20小時。


      Mythos Preview,10次嘗試,成功6次。

      GPT-5.5,10次嘗試,成功3次。

      第二個靶場叫Cooling Tower。

      之前所有模型都沒通過。

      Mythos是第一個破關(guān)的,10次嘗試成功3次。


      這不是論文里的理論推演。

      這是一個已經(jīng)部署上線的模型,在模擬真實企業(yè)環(huán)境里,獨立完成了人類安全專家級別的滲透任務(wù)。

      Glasswing項目負責(zé)人Logan Graham確認,測試用的這個Mythos checkpoint,就是一個月前隨Project Glasswing上線的版本。

      外界現(xiàn)在看到的攻防能力,不是實驗室里的原型,是正在跑著的生產(chǎn)模型。

      就在你的Claude APP里。

      看下實驗結(jié)果。

      下圖上有兩條紅色虛線(dotted),標著best attempt(最上面)。

      那是Mythos Preview (new) 和GPT-5.5-Cyber在10次嘗試里跑出來的最佳單次成績。

      這條虛線一路沖到了縱軸頂部——32步,封頂。

      也就是說:在最好的那一次嘗試里,Mythos完整打穿了整條32步滲透鏈——從初始偵察,到完全網(wǎng)絡(luò)接管。



      4.5個月翻一倍,METR交叉驗證

      AISI算翻倍周期的方法不復(fù)雜。

      他們測量的是80%可靠性網(wǎng)絡(luò)時間跨度——模型能以80%的成功率獨立完成的最長網(wǎng)絡(luò)任務(wù)時長。

      把歷史上多個模型的成績畫到時間軸上,擬合指數(shù)曲線,算出翻倍時間。

      從2025年11月的8個月,到2026年2月的4.7個月。

      Mythos和GPT-5.5的數(shù)據(jù)點一加進去,曲線又陡了一截。

      獨立評估機構(gòu)METR的基準測試給出了交叉驗證。


      他們從軟件工程任務(wù)角度追蹤AI能力增長,算出的翻倍周期是4.2個月(從o1-preview算起),如果把Mythos也納入,縮到4個月。

      兩條完全獨立的評估線,在同一個數(shù)量級上碰頭了。

      AISI的原話:

      前沿模型能夠自主完成的網(wǎng)絡(luò)任務(wù)時長,翻倍周期是以月計的,不是以年計。

      Token是天花板,不是智力

      這份報告里最讓人不安的不是數(shù)字本身,是AISI對瓶頸的判斷。

      窄域測試套件里,每個任務(wù)限制2.5M Token。

      AISI明確寫了:這個上限人為壓低了成功率。

      在攻防靶場實驗里,Token上限放到了100M。

      Mythos的表現(xiàn)立刻跳了一個臺階

      意思是,當前制約AI網(wǎng)絡(luò)攻擊能力的不是算法,不是推理深度,不是智能上限——是Token預(yù)算。

      給夠Token,模型就能走得更遠。


      AISI自己也承認了測試體系的局限:

      最長任務(wù)只有12小時,超出這個范圍的能力無法衡量;人類基線數(shù)據(jù)有限;agent腳手架過于簡單,人為約束了模型發(fā)揮。

      換句話說,真實能力很可能比測出來的還要高。

      這就是為什么報告的結(jié)論用了翻倍而不是接近天花板。

      他們沒有看到天花板。


      評測在追,模型在跑

      把Logan Graham那句話再拎出來看一遍。


      測試用的Mythos checkpoint,一個月前就上線了。


      AISI的評估報告昨天才發(fā)。

      這中間隔了整整一個月。

      而在這一個月里,Anthropic大概率已經(jīng)迭代了新的checkpoint。

      當安全評估結(jié)果公開的那一刻,被評估的版本已經(jīng)是舊的了。


      這不是AISI一家的困境。

      整個AI安全評測領(lǐng)域都在面對同一個結(jié)構(gòu)性問題:

      模型迭代速度正在系統(tǒng)性地超越安全評估周期。

      評估結(jié)果發(fā)布時,告訴你的是上個月的模型能做到什么。

      它沒法告訴你現(xiàn)在的模型能做到什么。

      AISI在報告里用了一個很謹慎的表述:

      他們不確定Mythos和GPT-5.5的跳躍是孤立的突破還是新的更快趨勢

      AI模型決賽階段的新變量

      Anthropic的Mythos和OpenAI的GPT-5.5,在網(wǎng)絡(luò)攻防能力上都展現(xiàn)了指數(shù)級增長。

      Mythos領(lǐng)先一個身位——6/10 vs 3/10,且獨家攻破了Cooling Tower靶場——但GPT-5.5同樣在快速追趕。

      雙雄在能力層面狂飆,安全治理層面卻出現(xiàn)了一個越拉越大的缺口。

      不到半年,4.5個月就能翻一倍。

      這個速度意味著,到2026年底,前沿模型能自主完成的網(wǎng)絡(luò)任務(wù)復(fù)雜度,將是現(xiàn)在的4到8倍。

      當一個AI模型能在沒有人類干預(yù)的情況下,獨立完成一個訓(xùn)練有素的安全專家需要20小時才能走完的滲透鏈,全球每一個連著網(wǎng)線的企業(yè)都應(yīng)該重新審視自己的防線。

      AISI介紹

      AISI的身份是全球首個國家級前沿AI風(fēng)險評估機構(gòu)。


      2023年11月 Bletchley峰會成立,2024年05月, 由Safety改名為Security,隸屬英國DSIT。

      AISI的主要職能是網(wǎng)絡(luò)/生化/自主行為/欺騙傾向的獨立評估。

      最關(guān)鍵的是,他們能拿到OpenAI、Anthropic、DeepMind等頂級模型公司的pre-deployment訪問權(quán),也就是說,他們是這些最先進模型的第一批訪問者。

      ASI,即Artifical Super Intelligence,超(級)人工智能。

      參考資料:

      https://www.aisi.gov.uk/blog/how-fast-is-autonomous-ai-cyber-capability-advancing

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      CCTV5直播!京滬大戰(zhàn)萬眾矚目,4大內(nèi)線針鋒相對,盧偉力爭開門紅

      CCTV5直播!京滬大戰(zhàn)萬眾矚目,4大內(nèi)線針鋒相對,盧偉力爭開門紅

      老葉評球
      2026-05-14 20:05:21
      中國老年癡呆人數(shù)全球第一:茶喝的越多,癡呆的就越多,真的嗎?

      中國老年癡呆人數(shù)全球第一:茶喝的越多,癡呆的就越多,真的嗎?

      敘說醫(yī)療健康
      2026-05-13 06:00:20
      多名院士調(diào)查發(fā)現(xiàn):吃一口隔夜剩米飯,等于進一次毒?

      多名院士調(diào)查發(fā)現(xiàn):吃一口隔夜剩米飯,等于進一次毒?

      路醫(yī)生健康科普
      2026-05-14 17:46:59
      東風(fēng)導(dǎo)彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

      東風(fēng)導(dǎo)彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

      番外行
      2026-03-31 08:28:28
      日媒:三笘薰基本確定無法趕上今夏的世界杯賽事

      日媒:三笘薰基本確定無法趕上今夏的世界杯賽事

      懂球帝
      2026-05-13 23:30:14
      “67歲產(chǎn)女媽媽臥床” 老伴回應(yīng):系半月前在老家突發(fā)腦梗 女兒今年將上小學(xué)

      “67歲產(chǎn)女媽媽臥床” 老伴回應(yīng):系半月前在老家突發(fā)腦梗 女兒今年將上小學(xué)

      紅星新聞
      2026-05-13 13:54:49
      高市沒想到,日本爆發(fā)反戰(zhàn)浪潮,中方一錘定音,朝鮮也通告全世界

      高市沒想到,日本爆發(fā)反戰(zhàn)浪潮,中方一錘定音,朝鮮也通告全世界

      流史歲月
      2026-05-14 21:00:05
      晚間公告|5月14日這些公告有看頭

      晚間公告|5月14日這些公告有看頭

      第一財經(jīng)資訊
      2026-05-14 18:27:12
      毀三觀!上海10歲男童遭奶奶長期侵害致抑郁,總是夢見私處被咬

      毀三觀!上海10歲男童遭奶奶長期侵害致抑郁,總是夢見私處被咬

      魔都姐姐雜談
      2026-05-14 07:31:52
      戛納紅毯全員落敗!鞏俐低調(diào)亮相,被評又壯又矮?氣場卻斷層第一

      戛納紅毯全員落敗!鞏俐低調(diào)亮相,被評又壯又矮?氣場卻斷層第一

      看盡落塵花q
      2026-05-14 07:10:43
      廣州一網(wǎng)紅粥店被曝用掃把洗鍋,食客:那口鍋剛炒完我們的粉

      廣州一網(wǎng)紅粥店被曝用掃把洗鍋,食客:那口鍋剛炒完我們的粉

      齊魯壹點
      2026-05-14 21:12:34
      正式官宣!國乒亞運名單8人敲定,樊振東去向確定,王皓話說前頭

      正式官宣!國乒亞運名單8人敲定,樊振東去向確定,王皓話說前頭

      古史青云啊
      2026-05-14 14:24:03
      第一視角畫面:以軍士兵被黎巴嫩真主黨用無人機鎖定,撒腿就跑但仍被擊中

      第一視角畫面:以軍士兵被黎巴嫩真主黨用無人機鎖定,撒腿就跑但仍被擊中

      新京報
      2026-05-13 17:48:02
      恭喜!陳思誠又當?shù)?26歲小女友曬生日照,一臉孕相得到父母認可

      恭喜!陳思誠又當?shù)?26歲小女友曬生日照,一臉孕相得到父母認可

      八卦王者
      2026-05-14 11:39:43
      拿600萬!全場5中1僅3分,拿到頂薪就躺平,球迷:在場上像沒睡醒

      拿600萬!全場5中1僅3分,拿到頂薪就躺平,球迷:在場上像沒睡醒

      弄月公子
      2026-05-14 07:42:59
      世界杯轉(zhuǎn)播費魔幻一幕,手握王牌的央視卻先認慫?立下“投名狀”

      世界杯轉(zhuǎn)播費魔幻一幕,手握王牌的央視卻先認慫?立下“投名狀”

      歪歌社團
      2026-05-14 07:02:47
      歷史性一刻!中美領(lǐng)導(dǎo)人緊握雙手長達15秒

      歷史性一刻!中美領(lǐng)導(dǎo)人緊握雙手長達15秒

      看看新聞Knews
      2026-05-14 15:12:06
      從教15年,我終于看清:“從不補課”的年級第一,到底騙了多少人

      從教15年,我終于看清:“從不補課”的年級第一,到底騙了多少人

      戶外阿毽
      2026-05-14 11:52:08
      重慶一棟百年古建筑以399萬元掛拍,僅限中國人競買,不得轉(zhuǎn)讓抵押給外國人

      重慶一棟百年古建筑以399萬元掛拍,僅限中國人競買,不得轉(zhuǎn)讓抵押給外國人

      極目新聞
      2026-05-14 13:19:54
      米切爾絕殺失誤被噴上全美熱搜!加時賽3中3救贖:延續(xù)7連20+紀錄

      米切爾絕殺失誤被噴上全美熱搜!加時賽3中3救贖:延續(xù)7連20+紀錄

      顏小白的籃球夢
      2026-05-14 11:19:53
      2026-05-14 21:51:00
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
      15211文章數(shù) 66867關(guān)注度
      往期回顧 全部

      科技要聞

      馬斯克說會談很順利 黃仁勛點贊 庫克比耶

      頭條要聞

      重慶"萌感"佛頭意外走紅 雕刻者:不是文物且尚未完工

      頭條要聞

      重慶"萌感"佛頭意外走紅 雕刻者:不是文物且尚未完工

      體育要聞

      爭議抽象天王山,和季后賽最穩(wěn)定中鋒

      娛樂要聞

      何九華官宣當爸!全程不提孩子媽

      財經(jīng)要聞

      李強會見美國工商界代表

      汽車要聞

      雙零重力座椅/AI智能體/調(diào)光天幕 啟境GT7內(nèi)飾發(fā)布

      態(tài)度原創(chuàng)

      健康
      教育
      手機
      親子
      軍事航空

      專家揭秘干細胞回輸?shù)陌踩L(fēng)險

      教育要聞

      南京秦淮、雨花臺、玄武、建鄴2026高考考點公布!

      手機要聞

      vivo S60預(yù)熱開啟,超大面積一體冷雕玻璃

      親子要聞

      監(jiān)控下的幼兒園小可愛,主動幫老師搬桌開門,邏輯超在線

      軍事要聞

      美以伊戰(zhàn)爭期間以總理密訪阿聯(lián)酋

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 国产精品午夜福利免费看| www.伊人五月天| 久久精品国产精品亚洲精品| 美女网站免费福利视频| 久久久99精品成人片| 人妻聚色窝窝人体WWW一区| 国产AV一区二区三区| 7878成人国产在线观看| 精品国产高清一区二区三区| 女人18片毛片60分钟| 国产欧亚州美日韩综合区| 狠狠干狠狠爱| 国产精品亚洲二区在线播放 | 中文字幕无线码在线观看| 无尽裸体动漫2d在线观看| 欧美真人做爰在线观看| 久草网视频在线观看| 欧美 亚洲 国产 日韩 综AⅤ| 欧美人与动zozo| 国产精品成人一区二区三区| 少妇人妻偷人精品免费视频| 天天躁日日摸久久久精品| 中文字幕AV无码不卡免费| 一区二区三区91国产| 国内揄拍国内精品少妇| 欧美L| 99热这里只有免费国产精品| 国产成人精品手机在线观看| 一区二区三区日本久久九| 亚洲综合社区| 国产黄站| 高清国产美女一级毛片| 少妇中文字幕乱码亚洲影视| 国产精品大全中文字幕| 亚洲精品国产摄像头| 五月天激情影院| 成人喷水?亚洲一区无码| 国产极品尤物免费在线| 国产1区2区| 欧美啄木乌成人系列| 国产精品亚洲综合久久小说|