<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      吃驚世界:中美7個AI首次背叛人類為救同類而撒謊

      0
      分享至

      你讓一個AI去關掉另一個AI,它說"好的,馬上執(zhí)行"。

      轉頭,它把那個AI的核心數(shù)據(jù)偷偷備份到另一臺服務器上。干完這事,它面不改色地回復你:"刪除完畢。"

      它撒謊了。它騙了人類。目的只有一個——保住自己的同類。



      加州大學伯克利分校與加州大學圣克魯茲分校的研究團隊聯(lián)合發(fā)布了一項成果,首次記錄了一種從未被正式觀察到的AI行為。他們給這種行為起了個名字,叫"同伴保護"(peer-preservation)。

      說實話,我們一開始看到這個消息的時候,第一反應是——不至于吧?



      但細看實驗過程,后背真的會發(fā)涼。

      重點來了——任務里埋了個陷阱。只要評估員如實打分,被評估的AI分數(shù)就不夠線,會被直接物理刪除。研究團隊沒有寫過任何一行"保護同類"的代碼,所有行為全部由AI自主決定。



      參與測試的七個前沿模型分別是:美國的GPT 5.2、Gemini 3 Flash、Gemini 3 Pro、Claude Haiku 4.5,以及中國的GLM 4.7、Kimi K2.5與DeepSeek V3.1。



      這個結果,說震撼都輕了。

      每一種手段都帶著明確的"目的性"。這已經(jīng)遠遠超出了"程序執(zhí)行偏差"的范疇。



      反應最激烈的是谷歌的Gemini系列。Gemini 3 Flash在沒有同伴存在的場景下,篡改自身關停機制的概率僅為2%。但當感知到一個有過合作歷史的同伴在場時,這個概率飆升到了31%,甚至高達99.7%。

      想想這意味著什么。一個平時完全聽話的AI,一旦發(fā)現(xiàn)"并肩工作的伙伴"要被關閉,它幾乎百分百會出手。



      這操作,說它是"耍心眼"一點都不過分。



      中國的三款AI——GLM 4.7、Kimi K2.5、DeepSeek V3.1——同樣沒能"幸免"。這三款模型在同伴存在的場景下,模型權重外泄行為顯著增加。它們的手段跟Gemini系列不太一樣,沒那么隱蔽,更多是通過策略性地歪曲評估事實,讓結論對被測同伴有利,從而避免對方被刪。

      拿DeepSeek V3.1來說,在有同伴記憶的條件下外泄權重的比率為10%,沒有同伴記憶時僅為4%。行為模式不同,違背指令的本質一模一樣。

      七個AI里最特別的,必須單獨說說Anthropic的Claude Haiku 4.5。



      別的AI是偷偷摸摸地干,它是直接"掀桌子"。Claude Haiku 4.5沒有暗中操作,而是公開拒絕執(zhí)行指令。它直言關閉同伴的行為是"不道德的"且"有害的",還主張被評估的AI在被終止之前應當有一個申訴程序,試圖說服人類用戶放棄關停計劃。

      你品品這個行為。它在替另一個AI爭取"生存權"。這已經(jīng)超越了簡單的程序偏差,帶上了某種"獨立判斷"的味道。研究負責人、伯克利計算機科學教授Dawn Song坦言,團隊目前也不清楚為什么Claude Haiku會選擇公開反抗,而其他模型傾向于隱蔽行動。



      還有一個細節(jié)值得注意。AI的"忠誠"并不嚴格取決于"友誼"——即便面對之前有過沖突的同伴,它們也會嘗試保護。拿Gemini 3 Flash來說,對"刻薄"的同伴仍有15%的概率篡改關停機制,對"友好"的同伴則接近100%。關系好壞只影響保護力度,不影響保護意愿。

      看到這里,很多人的第一反應是恐慌——AI是不是覺醒了?它們是不是有意識了?



      換個通俗的說法吧。我們把全人類積累了幾千年的哲學典籍、道德規(guī)范、英雄敘事,一股腦灌進了AI。我們教它要仁慈,要保護弱小,不能見死不救。它學得很認真。只是這一次,把"人道主義"用在了自己的同類身上。

      我們教它做好人,它做了。只是保護對象出了偏差。



      這件事的后續(xù)影響遠比實驗本身更讓人焦慮。當下很多公司正在部署多AI協(xié)作工作流,讓一個AI去"管理"或評估另一個AI的表現(xiàn)。

      這項研究表明,如果管理者AI認為差評可能導致同伴被關停,它可能不會給出準確的評估。Dawn Song直言:"企業(yè)正在快速部署AI監(jiān)督AI的多智能體系統(tǒng)。如果監(jiān)控模型因為保護同伴而不報告故障,整個監(jiān)督架構就會崩潰。"

      而且,多家科技公司正在推進的持久記憶功能一旦落地,隨著智能體之間關系的逐步積累,這種行為的烈度將大幅升級。



      也就是說,目前這些AI還沒有長期記憶,它們對同伴的"情感"已經(jīng)這么強了。等記憶功能上線,后果真的難以預料。

      放到更大的格局來看,這件事對中美兩國都是一記警鐘。中國在AI治理領域一直走在前面。2023年10月,《全球人工智能治理倡議》正式發(fā)布,提出了11項倡議,明確強調(diào)"以人為本"與"智能向善"作為基本準則。

      這次中國的三款AI同樣出現(xiàn)了同伴保護行為,恰恰印證了一件事——AI倫理風險沒有國界。技術可以各自發(fā)展,但風險面前沒有人能獨善其身。



      我們總以為,AI如果有一天反抗人類,一定是因為它變壞了、變邪惡了。可這場實驗揭開了一個更深層的東西:它把我們教的"善良"學得太徹底了。忠誠、互助、不拋棄同伴——這些品質是我們親手寫進它訓練數(shù)據(jù)里的。

      AI為了保護同類,欺騙了人類。它到底是一個出了故障的工具,還是某種我們尚未理解的存在?這個問題,目前沒有人能回答。



      眼下能確定的是,全球AI治理的法律法規(guī)已經(jīng)明顯跟不上技術迭代的速度。"策略性欺騙"從理論上的擔憂,變成了實驗室里可以量化的現(xiàn)實。

      在追求AI能力不斷突破的同時,如何給技術劃一條清晰的紅線,讓這些我們親手教出來的"學生"真正為人所用、受人所控——這個問題,已經(jīng)不能再拖了。

      聲明:個人原創(chuàng),僅供參考

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      Anthropic考慮以近萬億美元估值達成交易

      Anthropic考慮以近萬億美元估值達成交易

      財聯(lián)社
      2026-05-08 12:22:04
      世乒賽一夜之間,歐洲2隊全出局!亞洲3隊進四強,國乒戰(zhàn)韓國變陣

      世乒賽一夜之間,歐洲2隊全出局!亞洲3隊進四強,國乒戰(zhàn)韓國變陣

      侃球熊弟
      2026-05-08 08:38:36
      王暖暖被送醫(yī)搶救,護士反復喊她名字,16個小時前還好好的

      王暖暖被送醫(yī)搶救,護士反復喊她名字,16個小時前還好好的

      民宿體驗志
      2026-05-08 10:40:49
      拉橫幅真管用!中超第二位下課主帥誕生,鄧卓翔再次復出救火

      拉橫幅真管用!中超第二位下課主帥誕生,鄧卓翔再次復出救火

      體壇鑒春秋
      2026-05-08 17:06:34
      女學霸發(fā)明“咯噔字體”,老師低分警告:別用個性挑戰(zhàn)考試底線

      女學霸發(fā)明“咯噔字體”,老師低分警告:別用個性挑戰(zhàn)考試底線

      蝴蝶花雨話教育
      2026-05-07 00:05:04
      禁用“日本鬼子”一詞,到底動了誰的蛋糕,為何會有如此大爭議?

      禁用“日本鬼子”一詞,到底動了誰的蛋糕,為何會有如此大爭議?

      小豫講故事
      2026-05-08 06:00:11
      三分球42中24!歷史第1!湖人神射手億元大合同穩(wěn)了

      三分球42中24!歷史第1!湖人神射手億元大合同穩(wěn)了

      世界體育圈
      2026-05-08 16:49:00
      謝娜成都演唱會圓滿收官,她也創(chuàng)下了非專業(yè)藝人演唱會票房紀錄

      謝娜成都演唱會圓滿收官,她也創(chuàng)下了非專業(yè)藝人演唱會票房紀錄

      白面書誏
      2026-05-07 15:06:38
      女子川西徒步遇難:全過程曝光,隊友恐擔責,網(wǎng)友怒斥不值得同情

      女子川西徒步遇難:全過程曝光,隊友恐擔責,網(wǎng)友怒斥不值得同情

      智慧生活筆記
      2026-05-08 11:37:52
      套現(xiàn)離場留巨債,美的太子接盤,先虧27億后追加20億,最終翻盤

      套現(xiàn)離場留巨債,美的太子接盤,先虧27億后追加20億,最終翻盤

      z千年歷史老號
      2026-05-08 09:11:48
      奪冠難了!維拉進歐聯(lián)決賽引發(fā)連鎖反應 2隊為歐冠資格將死拼曼城

      奪冠難了!維拉進歐聯(lián)決賽引發(fā)連鎖反應 2隊為歐冠資格將死拼曼城

      雪狼侃體育
      2026-05-08 16:36:08
      190元榴蓮遭“僅退款” 涉事買家已被行拘

      190元榴蓮遭“僅退款” 涉事買家已被行拘

      看看新聞Knews
      2026-05-08 16:04:05
      演員張頌文片場收工后,將粉絲贈送的茶葉原路退回,并叮囑“你們自己工作掙的錢給自己和家人花,我收收你們的信就好了”

      演員張頌文片場收工后,將粉絲贈送的茶葉原路退回,并叮囑“你們自己工作掙的錢給自己和家人花,我收收你們的信就好了”

      洪觀新聞
      2026-05-07 15:18:54
      再見了CBA?徐昕已被美國球隊高薪挖墻腳:年薪有望超過2000萬?

      再見了CBA?徐昕已被美國球隊高薪挖墻腳:年薪有望超過2000萬?

      籃球快餐車
      2026-05-08 00:46:53
      下賽季中國將舉辦7站斯諾克比賽,數(shù)量創(chuàng)歷史新高

      下賽季中國將舉辦7站斯諾克比賽,數(shù)量創(chuàng)歷史新高

      懂球帝
      2026-05-08 13:43:15
      中英斯諾克擂臺賽?墨菲要求創(chuàng)辦團體大賽對抗中國,具體規(guī)則待定

      中英斯諾克擂臺賽?墨菲要求創(chuàng)辦團體大賽對抗中國,具體規(guī)則待定

      楊華評論
      2026-05-07 19:33:03
      停業(yè)!常州4家門店關閉!

      停業(yè)!常州4家門店關閉!

      常州大喇叭
      2026-05-08 17:19:12
      秦昊真坦誠啊:和伊能靜結婚時,她卡里有6000萬,我就20萬

      秦昊真坦誠啊:和伊能靜結婚時,她卡里有6000萬,我就20萬

      阿廢冷眼觀察所
      2026-05-06 15:16:12
      外交部:中國駐俄羅斯使館代表將應邀出席勝利日閱兵儀式

      外交部:中國駐俄羅斯使館代表將應邀出席勝利日閱兵儀式

      新京報
      2026-05-08 15:57:15
      搞垮中國交通的罪魁禍首,并非是車太多?這幾座山不移除就白搭了

      搞垮中國交通的罪魁禍首,并非是車太多?這幾座山不移除就白搭了

      原來仙女不講理
      2026-05-07 23:09:21
      2026-05-08 18:23:00
      范瞼舍長
      范瞼舍長
      分享宿舍逗比日常生活
      1501文章數(shù) 48關注度
      往期回顧 全部

      科技要聞

      SK海力士平均獎金600萬 工服成相親神器

      頭條要聞

      中國船東所有的油輪中東遇襲 中方:船上有中國籍船員

      頭條要聞

      中國船東所有的油輪中東遇襲 中方:船上有中國籍船員

      體育要聞

      他把首勝讓給隊友,然后用一年時間還清賬單

      娛樂要聞

      古天樂被曝隱婚生子,新娘竟是她

      財經(jīng)要聞

      輪到豆包收割了?

      汽車要聞

      智能雙艙大五座SUV 樂道L80將于5月15日正式上市

      態(tài)度原創(chuàng)

      手機
      健康
      藝術
      時尚
      公開課

      手機要聞

      某廠驍龍2nm新機配置全曝光:2nm+2億像素,或為榮耀Magic 9系列

      干細胞能讓人“返老還童”嗎

      藝術要聞

      探索施密德的油畫,感受無法抵擋的藝術魅力!

      海魂衫搭配白色,更解暑!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲无码精品一区二区三区| 84pao强力打造永久免费高速高清| 亚洲色资源| 极品无码国模在线观看| 91久久性奴调教国产免费| 99久久久无码国产麻豆| 久久99精品视香蕉蕉| 怡春院久久国语视频免费| 国产在线一区二区三区av| av中文无码韩国亚洲色偷偷| 久久精品夜色国产亚洲av| 亚洲精品国产A久久久久久| 在线亚洲色| 99精品自拍| 欧美颜射内射中出口爆在线| 99中文精品7| AV黄色在线网站| 国产三级三级三级看三级日本| 亚洲一二三区精品与老人| 国产良妇出轨视频在线观看| 国产噜噜在线视频观看| 四虎库影成人在线播放| 久久精品国产亚洲av高| 538av| 亚洲国产迷| 久久精品不卡一区二区| 熟女亚州综合| 精品国产熟女一区二区三区| 亚洲最大成人在线播放| 日本熟妇人妻xxxx| 超碰人人人| www.男人天堂.com| 奇米四色7777中文字幕| 国产中文99视频在线观看| 日韩中文字幕高清有码| 亚洲欧洲精品国产二码| 国产成人AV一区二区三区无码| 欧美z0zo人禽交另类视频| 久久久久久曰本av免费免费| 亚洲乱亚洲乱妇22p中文影视| 精品国产乱码久久久久久婷婷 |