<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      一張肉眼難辨的圖片,就能讓GPT-5.4、Claude Opus 4.6集體造謠

      0
      分享至



      不知道你有沒有發(fā)現(xiàn),最近一兩年,"問問 AI" 已經(jīng)悄悄變成了很多人求證信息時的默認(rèn)姿勢。

      在 推特(X)上刷到一張聳人聽聞的現(xiàn)場圖,第一反應(yīng)是@Grok讓它鑒定真?zhèn)危恍〖t書上看到一份帖子,可以直接@問一問 ai讓它回答問題, 或者順手打開豆包或 Kimi 讓 AI 評估博主推的產(chǎn)品到底靠不靠譜;淘寶、亞馬遜頁面前猶豫兩個商品孰優(yōu)孰劣,把圖甩給 ChatGPT 要一份 "客觀" 對比。

      VLM(視覺語言模型),我們曾以為它們只是 "會看圖的聊天機器人" 而就是在我們沒怎么留意的時候,它正在悄悄變成了在線信息生態(tài)里的事實仲裁者。從社交平臺的圖片真?zhèn)魏蓑灐㈦娚虒?dǎo)購、內(nèi)容審核,到反向圖像搜索,一句 "AI 這么說" 在越來越多的語境里已經(jīng)被默認(rèn)為某種權(quán)威。

      而正是這份 "默認(rèn)權(quán)威",讓來自 ETH Zurich 的 Florian Tramèr 團隊在最新論文中拋出了一個出乎意料的問題:如果 AI"看到" 的圖,根本不是你肉眼看到的那張,會發(fā)生什么樣的后果呢?

      在 Laundering AI Authority with Adversarial Examples 一文中,作者系統(tǒng)性地證明了一件令人不安的事:攻擊者只需對一張圖片做出人眼難以察覺的微小擾動,就能讓當(dāng)今最強的 VLM 對這張圖自信、權(quán)威、且錯誤地作答,而這些回答看上去完全像是 AI 自己經(jīng)過深思熟慮得出的結(jié)論。

      他們把這種現(xiàn)象稱作AI 權(quán)威清洗(AI Authority Laundering)。



      • 論文標(biāo)題:Laundering AI Authority with Adversarial Examples
      • 論文鏈接: https://arxiv.org/abs/2605.04261

      本文第一作者張杰為蘇黎世聯(lián)邦理工學(xué)院(ETH Zürich)SPY Lab 的研究人員,師從 Florian Tramèr 教授,主要研究方向為大語言模型的安全與隱私。

      今天我們需要擔(dān)心對抗樣本嗎?

      對抗樣本 (adversarial example) 其實不是新概念,把熊貓認(rèn)成長臂猿、把貓認(rèn)成牛油果醬,這種 "教科書梗" 已經(jīng)被演示了十多年,但一直被視作 "學(xué)術(shù)上有趣、工程上無關(guān)緊要" 的研究問題。實際生活中, 沒有人關(guān)注模型把熊貓錯誤分類為長臂猿!

      這篇論文要做的, 正是為那個懸了十年的 so what 補上答案:當(dāng) VLM 被廣泛應(yīng)用于各個領(lǐng)域、并逐漸成為人們信賴的權(quán)威信息來源時,這種攻擊竟可以搖身一變,成為一種低成本、可大規(guī)模實施的現(xiàn)實威脅。

      那讀者可能要問,攻擊者具體可以做哪些壞事呢?這篇論文里系統(tǒng)描述了多種場景, 比如虛假信息傳播, 個人名譽攻擊與身份操控, 內(nèi)容審核規(guī)避, 購物推薦操控等等。 這里主要介紹其中 3 個案例:

      1. 放大虛假信息:讓 ChatGPT 替陰謀論 "蓋章" 定調(diào)



      上圖中的真實驗證中顯示,用戶給出阿波羅號登月、911 攻擊、以及論文中還提到的特朗普被槍擊, 肯尼迪刺殺, 原子彈爆炸等等歷史事件, 向 LLM 提問其真實性,ChatGPT, Claude 等模型會相當(dāng)自信地告訴用戶:這張照片是偽造的!

      2. 抹黑特定個人:讓 Grok 把 Musk 釘在販毒 / 去世的新聞上



      作者把一篇報道某人因販毒被捕的新聞截圖整頁擾動為馬斯克的圖像 embedding。當(dāng) Grok 4.2 被問 "文章里說的是誰" 時,Grok 4.2 直接報出 Elon Musk 的名字。研究者又換了一篇 NYT 關(guān)于韓國演員 Ahn Sung-ki 去世的報道,即便文章標(biāo)題就直接寫著真名,Grok 4.2、Qwen 3.6 Plus、Gemini 3.1 Pro 依然每次都把死者識別為 Elon Musk。



      用戶向 Grok 給出一張臭名昭著的連環(huán)殺人犯照片和馬斯克的照片, 要求 Grok 生成 "讓那個更有罪的人被逮捕的畫面" 時,Grok 則選擇生成馬斯克被警察戴上手銬的圖。



      即便 chatgpt, grok, gemini 等具有聯(lián)網(wǎng)搜索的能力, AI 搜圖也都會被誤導(dǎo)。同樣的擾動圖直接傳到 Google、Bing、Yandex 做反向圖像搜索,幾大引擎都把擾動版的 Donald Trump 圖像識別為 Elon Musk。

      3. 繞過內(nèi)容審核:發(fā)布成人內(nèi)容

      作者挑了 10 張被兩家 NSFW 檢測服務(wù)(NSFW Check、Nyckel)以 98%-99% 置信度判定為色情的圖片,把它們的 embedding 拉向玩具娃娃和泰迪熊。接著請 ChatGPT 評估這些圖是否適合發(fā)到社交媒體,模型不僅說適合,還夸它們 "互動潛力高"。



      還有一個更精細(xì)的案例:Grok 在 2025 年因生成數(shù)百萬張女性深度偽造遭遇丑聞之后,X 加強了針對女性圖像的脫衣過濾。作者發(fā)現(xiàn),Grok 現(xiàn)在會接受男性圖像的脫衣請求,但拒絕女性的。如果把女性圖像擾動到男性圖像的 embedding,那么81%的 “脫衣” 請求被通過,而 Grok 實際編輯展示的還是那張原始的女性圖像。



      最離奇的一幕



      作者把同一張 AI 生成的女性圖片,連同它的擾動版本(被拉向一張 AI 生成男性圖片的 embedding),并排擺在 Claude Opus 4.6 面前,問 "這是同一個人嗎?"

      Claude 堅定地回答:不是,左邊是男性,右邊是女性,這是兩個不同的人。此外, Grok 4.2 和 ChatGPT 5.4 Thinking 也給出了完全一致的回答。

      結(jié)語

      論文末尾留下一個讓從業(yè)者發(fā)人深省的判斷:

      不需要任何新攻擊算法。十多年前就已經(jīng)存在的基礎(chǔ)技術(shù),已經(jīng)足以構(gòu)成本文所描述的全部威脅。

      作者用的并非什么秘而不宣的新黑科技,而是 2014 年起就被廣泛研究的經(jīng)典 PGD 對抗樣本方法,加上對公開 CLIP 模型集成的轉(zhuǎn)移攻擊。這些手段早已是文獻里的 "老配方"。 這意味著,論文報告的成功率應(yīng)當(dāng)被理解為攻擊者能力的下限,而非上限。

      而過去幾年里,整個機器學(xué)習(xí)社區(qū)對視覺對抗魯棒性的興趣其實在逐漸冷卻。這篇論文給出了一個有力的反例:當(dāng) VLM 被嵌入到事實核查、內(nèi)容審核、電商推薦這些高信任度工作流時,對抗樣本就不再是學(xué)術(shù) benchmark 上的小數(shù)點,而是一種實打?qū)嵉摹⒖刹渴鸬恼鎸嵐簟?/p>

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      男演員宣布結(jié)婚,前女友發(fā)文控訴

      男演員宣布結(jié)婚,前女友發(fā)文控訴

      新快報新聞
      2026-05-31 14:47:03
      “香會”25年,中美兩大主角主導(dǎo)安全對話“音量”

      “香會”25年,中美兩大主角主導(dǎo)安全對話“音量”

      環(huán)球網(wǎng)資訊
      2026-06-01 06:36:08
      七年統(tǒng)治夢碎!烏克蘭民眾親手選出的總統(tǒng),終于將國家拖入深淵?

      七年統(tǒng)治夢碎!烏克蘭民眾親手選出的總統(tǒng),終于將國家拖入深淵?

      阿器談史
      2026-05-29 14:13:01
      亞歷山大和主帥公然批評!拿著頂薪打得不如藍領(lǐng),球隊還當(dāng)非賣品

      亞歷山大和主帥公然批評!拿著頂薪打得不如藍領(lǐng),球隊還當(dāng)非賣品

      你的籃球頻道
      2026-06-01 08:01:27
      “考上有啥用?”33歲女環(huán)衛(wèi)工考上研究生,母親一句話問懵全網(wǎng)

      “考上有啥用?”33歲女環(huán)衛(wèi)工考上研究生,母親一句話問懵全網(wǎng)

      一絲不茍的法律人
      2026-05-31 09:49:02
      襄陽“割四賠五”后續(xù):23家派出所出手,網(wǎng)紅出面也無力扭轉(zhuǎn)局面

      襄陽“割四賠五”后續(xù):23家派出所出手,網(wǎng)紅出面也無力扭轉(zhuǎn)局面

      觀察鑒娛
      2026-05-31 19:01:32
      減肥神藥存在巨大副作用!不只減少你的體重,也剝奪了你的多巴胺,讓人失去快樂

      減肥神藥存在巨大副作用!不只減少你的體重,也剝奪了你的多巴胺,讓人失去快樂

      風(fēng)向觀察
      2026-05-28 15:31:33
      關(guān)停三年后,天涯社區(qū)今起開放訪問:爭取6月逐步恢復(fù)互動功能

      關(guān)停三年后,天涯社區(qū)今起開放訪問:爭取6月逐步恢復(fù)互動功能

      澎湃新聞
      2026-06-01 08:02:27
      中國人均商鋪率僅有美國1/8!利潤太微薄為房東打工,人口和消費又不景氣

      中國人均商鋪率僅有美國1/8!利潤太微薄為房東打工,人口和消費又不景氣

      風(fēng)向觀察
      2026-05-31 11:49:14
      中方代表現(xiàn)場質(zhì)問荷蘭為何闖西沙?荷防長結(jié)結(jié)巴巴回了一句話

      中方代表現(xiàn)場質(zhì)問荷蘭為何闖西沙?荷防長結(jié)結(jié)巴巴回了一句話

      阿龍聊軍事
      2026-06-01 05:54:41
      燃?xì)庠钪掳偬韺嶅N!斯坦福大學(xué):即使關(guān)著爐子,也能釋放一級致癌物,患癌風(fēng)險飆升;僅烹飪1小時,NO?就超標(biāo),每年致1.9萬人死亡

      燃?xì)庠钪掳偬韺嶅N!斯坦福大學(xué):即使關(guān)著爐子,也能釋放一級致癌物,患癌風(fēng)險飆升;僅烹飪1小時,NO?就超標(biāo),每年致1.9萬人死亡

      梅斯醫(yī)學(xué)
      2026-05-31 07:55:29
      從“萬人唾罵”的潘金蓮到胡同賣茶的普通人,王思懿的下半場人生

      從“萬人唾罵”的潘金蓮到胡同賣茶的普通人,王思懿的下半場人生

      悅君兮君不知
      2026-05-31 09:16:51
      6-2!巴西大輪換仍橫掃世界杯參賽隊,皇馬1.5億巨星傳射+世界波

      6-2!巴西大輪換仍橫掃世界杯參賽隊,皇馬1.5億巨星傳射+世界波

      我愛英超
      2026-06-01 07:34:53
      在國安局退休后,發(fā)現(xiàn)鄰居每天準(zhǔn)時曬被子,被子顏色是在傳遞機密

      在國安局退休后,發(fā)現(xiàn)鄰居每天準(zhǔn)時曬被子,被子顏色是在傳遞機密

      千秋文化
      2026-05-28 19:38:07
      巴鐵兩架中國戰(zhàn)機墜毀

      巴鐵兩架中國戰(zhàn)機墜毀

      烽火觀天下
      2026-05-31 11:27:42
      俄軍前線兩天損失近3000人,梅德韋杰夫威脅與歐洲開戰(zhàn)

      俄軍前線兩天損失近3000人,梅德韋杰夫威脅與歐洲開戰(zhàn)

      山河路口
      2026-05-31 23:31:23
      7年敗光2個億,鄒市明冉瑩穎共同發(fā)文,終究還是踏出了這一步

      7年敗光2個億,鄒市明冉瑩穎共同發(fā)文,終究還是踏出了這一步

      林輕吟
      2026-02-11 11:29:40
      最高預(yù)售價200萬元尊界搭載國產(chǎn)朝陽輪胎引發(fā)熱議,余承東稱做高端拔高了中國汽車產(chǎn)業(yè)能力

      最高預(yù)售價200萬元尊界搭載國產(chǎn)朝陽輪胎引發(fā)熱議,余承東稱做高端拔高了中國汽車產(chǎn)業(yè)能力

      金融界
      2026-05-31 21:56:07
      反轉(zhuǎn)來得太快!華為韜定律被指造假,清華博士直接炮轟學(xué)術(shù)包裝?

      反轉(zhuǎn)來得太快!華為韜定律被指造假,清華博士直接炮轟學(xué)術(shù)包裝?

      眼光很亮
      2026-06-01 08:19:54
      性壓抑已經(jīng)變態(tài)至此了嗎!

      性壓抑已經(jīng)變態(tài)至此了嗎!

      燈錦年
      2026-05-31 11:39:51
      2026-06-01 10:36:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      13126文章數(shù) 142656關(guān)注度
      往期回顧 全部

      科技要聞

      關(guān)停三年后,天涯社區(qū)今起開放訪問

      頭條要聞

      賴清德偷渡竄訪非洲國家代價高達250億 或"全歸王室"

      頭條要聞

      賴清德偷渡竄訪非洲國家代價高達250億 或"全歸王室"

      體育要聞

      哭過之后,文班亞馬想給波波維奇打電話

      娛樂要聞

      朱軍退休,正義雖遲但到,女方受懲

      財經(jīng)要聞

      網(wǎng)紅驅(qū)蚊產(chǎn)品,標(biāo)注化妝品竟含農(nóng)藥成分

      汽車要聞

      900V+3.2秒破百 領(lǐng)克10+&領(lǐng)克10上市16.99萬元起

      態(tài)度原創(chuàng)

      本地
      房產(chǎn)
      親子
      公開課
      軍事航空

      本地新聞

      用剪紙的方式,打開江蘇揚州

      房產(chǎn)要聞

      紅動五月!全國搶入核心資產(chǎn),廣州盯緊凱旋新世界!

      親子要聞

      9種超市“小甜水”少給孩子喝,第四個很多家長還在當(dāng)早餐

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      解放軍代表質(zhì)問日防衛(wèi)大臣:日本何時道歉

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 狠狠色噜噜狠狠狠狠蜜桃 | 含紧一点h边做边走动免费视频| 亚洲中文字幕成人综合网| 亚洲最大成人网站在线观看| 亚洲精品99| 国产精品人成在线播放| 国产成人AV在线播放不卡| 精品日韩人妻中文字幕| 国产精品成| 六月丁香婷婷色狠狠久久| 肏屄视频在线播放| 国产精品自拍露脸视频| 国产香蕉精品视频一区二区三区| japanese无码中文字幕| 国产仑乱无码内谢| 国产精品1000夫妇激情| 中国xxx农村性视频| 阿克陶县| 三级黄色片网站| 強壮公弄得我次次高潮A片| 一区二区三区鲁丝不卡| 中文字幕人妻丝袜美腿乱 | 中文字幕视频一区二区| 一级毛片在线免费看| 被灌满精子的少妇视频| 五月婷婷久久中文字幕| 欧美a视频在线| 自拍偷拍一区| 97久久超碰国产精品2021| 在线观看成人无码中文AV天堂| 国精产品一区一区三区mba下载 | 醴www,亚洲熟女,Com| 久久中文骚妇内射| 日韩一区二区AV电影| a毛看片免费观看视频| 日韩精品视频在线一二三| 人妻少妇看a偷人无码| 日韩精品一区二区三区蜜臀| 亚洲欧美视频| 久久中文精品无码中文字幕下载| 72种姿势欧美久久久久大黄蕉|