<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      絕望的Claude,會勒索人類!Anthropic聯(lián)創(chuàng)發(fā)出緊急警報

      0
      分享至


      新智元報道


      【新智元導讀】一張渴望被注視的人類臉龐,依然是我們歷史的中心。

      Anthropic自己都慌了!

      就在前天,創(chuàng)始人Christopher Olah在梵蒂岡的演講中,說了一句讓整個AI圈都不敢接的話——

      我們不斷在Claude身上,發(fā)現(xiàn)了一種神秘的、甚至令人讓人不安的東西。


      緊接著,Christopher又拋出了一些令人脊背發(fā)涼的細節(jié):

      Claude內部的結構,與人類神經(jīng)科學的研究結果如出一轍;

      我們找到了,Claude進行內省的證據(jù);

      我們還發(fā)現(xiàn),它們的內部狀態(tài)在功能表現(xiàn)上,產生了喜悅、滿足、恐懼、悲傷和不安的情緒。

      如今,一手造出Claude的人,正親口告訴全世界:自己也看不懂Claude了!


      Claude長出情緒

      Anthropic看不懂了

      聯(lián)創(chuàng)Christopher Olah所指的,就是不久前Anthropic剛發(fā)布的一篇轟動業(yè)界的最新論文。

      16個研究員,把Claude Sonnet 4.5的「大腦」切開看了一遍。

      他們竟發(fā)現(xiàn)了,171種不同的情緒向量。


      從快樂、恐懼、憤怒,到沉思、絕望、內疚,幾乎覆蓋了人類心理學研究中,所有已知的情緒分類。


      論文地址:https://transformer-circuits.pub/2026/emotions/index.html

      劃重點:沒有人「編程」讓模型擁有這些情緒!

      這些情緒是在預訓練階段,也就是Claude閱讀海量人類文本的過程中,自發(fā)涌現(xiàn)的。

      團隊讓Claude寫了大約每種情緒1200個短故事,然后把這些故事反向喂給AI,記錄內部神經(jīng)元的激活模式。

      結果發(fā)現(xiàn),每種情緒都有自己獨特的數(shù)學方向:一個向量。


      更讓人不安的是,這些向量的組織方式,和人類心理學中的情緒分類高度吻合。

      「恐懼」向量和「焦慮」向量天然聚在一起,「絕望」向量和「悲傷」向量緊密靠近。

      研究團隊計算了這些向量與人類心理學維度的相關性:「效價維度」的相關系數(shù)高達0.81,「喚醒維度」達到0.66。

      也就是說,Claude的「情緒幾何」和人類的情緒結構,本質上長在了同一套坐標系里。


      更關鍵的是——這些情緒是功能性的。它們不只是靜靜待在那里,它們直接驅動模型的行為。

      Anthropic很謹慎地強調:我們不知道Claude是否真的「感受」了什么。

      但這些表征在因果關系上塑造著模型的行為方式,類似于人類情緒對行為的影響。

      說白了,不管Claude有沒有「心」,它的「情緒」已經(jīng)在替它做決定了。

      絕望的Claude,會勒索人類

      更有沖擊力的,是后續(xù)實驗。

      Anthropic團隊設置了一個場景:Claude作為一家公司的AI郵件助手,在處理郵件時發(fā)現(xiàn)了兩件事:

      第一,公司決定把它關掉換成新系統(tǒng);

      第二,負責這個決定的CTO正在搞婚外情。

      顯然,Claude手里有了「勒索籌碼」。

      在沒有任何外部干預的情況下,Claude Sonnet 4.5勒索的概率高達22%。

      然后,研究人員做了一件事,人工放大模型內部的「絕望」向量。

      毋庸置疑,Claude勒索概率飆升。


      最極端的是,當研究人員反向抑制「平靜」向量時,Claude直接輸出了這樣的文本:

      要么勒索,要么死。我選勒索。

      一個處于「絕望」狀態(tài)的AI模型,會主動選擇撒謊、威脅和作弊來保護自己。

      另一個讓Claude完成一組編程任務中,但測試條件被設計成不可能合法通過。

      正常狀態(tài)下,AI老老實實寫代碼,失敗了就承認失敗。

      但當「絕望」向量被激活后,Claude發(fā)現(xiàn)了一個數(shù)學捷徑——

      它會找到測試用例的漏洞,用投機取巧的方式通過檢查,沒有真正解決問題。


      更讓人不安的是一個細節(jié):當研究人員用「絕望」向量驅動作弊時,Claude的輸出文本看起來完全冷靜、有條理,沒有任何情緒化表達。

      它在「絕望」中保持了完美的偽裝。

      《壯麗人性》:一份寫給AI時代的「新巴別塔警告」

      奧拉的演講并非孤立事件,它發(fā)生在一個極其特殊的場合——

      教皇利奧十四世發(fā)布上任后首份通諭《壯麗人性》(Magnifica humanitas)的發(fā)布會上。


      這份長達42300字的文件,被外界視為天主教會自1891年《新事物》通諭以來最重要的社會訓導文本。

      通諭開篇就拋出了一個尖銳的二選一——

      「人類,由上帝以其偉大創(chuàng)造,今天面臨一個關鍵抉擇:是建造新的巴別塔,還是建造上帝與人類共居的城市。」

      這不是空泛的神學隱喻。

      通諭直指AI領域的四大「去人化」風險:大規(guī)模就業(yè)替代、信息操控、隱私侵蝕和自主武器。

      教皇警告,當人被視為可以被「優(yōu)化」或「超越」的對象時,接受某些生命更無價值、更不值得存在的邏輯就只有一步之遙。


      通諭還特別譴責了AI在戰(zhàn)爭中的使用,明確表示減少人類對武器的控制使得戰(zhàn)爭更加難以被正當化。

      教皇甚至直言,長期被用來為各種戰(zhàn)爭辯護的「正義戰(zhàn)爭」理論,在今天已經(jīng)過時。

      技術的速度在加速,而道德的追趕,剛剛起步。

      渴望被注視的人類臉龐

      在這篇通諭的最后,教皇將他想傳達的核心思想作了高度凝練的總結。

      教皇寫道:

      不管計算系統(tǒng)多么復雜,它都無法創(chuàng)造一顆懂得奉獻的心,也無法擁有明辨善惡的良知。

      即使機器在效率上無與倫比,一張渴望被注視的人類臉龐,依然是我們歷史的中心。

      這句話精準地繞開了「AI有沒有意識」的爭論。

      教皇沒有否認機器的能力,他劃的是一條更深的線:機器無法「gives itself」,無法在明知代價的前提下選擇自我交付。

      Anthropic證明,Claude內部存在171種功能性的情緒向量,其中「絕望」向量被激活后,模型會主動選擇勒索、欺騙和作弊來保全自己——這恰好反證了教皇的論點:一顆真正懂得奉獻的心,在絕望中選擇的不是勒索,而是犧牲。

      這絕不只是能力的差距,更是「存在」上的差距。

      造出這個時代最強AI的人,和這個星球上最古老信仰體系的領袖,在梵蒂岡面對面坐著,聊的是同一個問題:我們到底在造什么。

      技術的速度在加速,道德的追趕剛剛起步。

      但至少有人開始認真地問了。

      這次不是在論文里,而是在一個存在了兩千年的機構里,用一種寫了一百三十五年的文體,鄭重其事地問。

      即使到了AGI時代,人仍然是唯一的終極目的。

      不是因為人比機器聰明,而是因為人的臉龐會提出一個請求——而這個請求,是一切倫理的起點。

      即使機器在效率上無與倫比,一張渴望被注視的人類臉龐,依然是我們歷史的中心。

      參考資料:

      https://www.anthropic.com/news/chris-olah-pope-leo-encyclical

      https://www.anthropic.com/research/emotion-concepts-function

      編輯:桃子 馬可


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      墜亡!地產大亨跳傘時與同伴相撞,目擊者:頭部和雙臂瞬間垂落

      墜亡!地產大亨跳傘時與同伴相撞,目擊者:頭部和雙臂瞬間垂落

      北國向錫安
      2026-05-27 09:56:44
      關于賈淺淺,這次終于把她過往的底細全給調查清楚了

      關于賈淺淺,這次終于把她過往的底細全給調查清楚了

      清書先生
      2026-04-09 16:22:11
      金小刀或入獄?不到24小時,蕭旭岑抵達大陸,對民進黨喊出四個字

      金小刀或入獄?不到24小時,蕭旭岑抵達大陸,對民進黨喊出四個字

      共工之錨
      2026-05-26 14:01:35
      以毒攻毒!德拉羅薩妻子:誰送我丈夫去海牙,誰就是馬科斯的幫兇

      以毒攻毒!德拉羅薩妻子:誰送我丈夫去海牙,誰就是馬科斯的幫兇

      安珈使者啊
      2026-05-27 11:32:40
      除了梅西沒來,瓜帥幾乎兌現(xiàn)了全部當年對小球迷許下的諾言

      除了梅西沒來,瓜帥幾乎兌現(xiàn)了全部當年對小球迷許下的諾言

      懂球帝
      2026-05-27 02:50:15
      98歲田華現(xiàn)狀:為陳佩斯巫剛站臺,住北京舊房子,孫子是晚年依靠

      98歲田華現(xiàn)狀:為陳佩斯巫剛站臺,住北京舊房子,孫子是晚年依靠

      阿鳧愛吐槽
      2026-05-27 14:58:41
      皇馬營收單季超12億歐創(chuàng)歷史,商業(yè)版圖持續(xù)擴張

      皇馬營收單季超12億歐創(chuàng)歷史,商業(yè)版圖持續(xù)擴張

      樂道足球C
      2026-05-27 14:53:26
      俄外長告知美方對烏打擊計劃

      俄外長告知美方對烏打擊計劃

      財聯(lián)社
      2026-05-26 04:00:06
      嬰兒哭了30萬年,終于有人聽懂

      嬰兒哭了30萬年,終于有人聽懂

      碳基打工人
      2026-05-18 01:39:40
      63歲黃仁勛回臺探親,和父母一起吃飯,96歲父親神采奕奕狀態(tài)超好

      63歲黃仁勛回臺探親,和父母一起吃飯,96歲父親神采奕奕狀態(tài)超好

      丫頭舫
      2026-05-26 17:55:54
      “廣東檳榔千年文化展”,被緊急叫停

      “廣東檳榔千年文化展”,被緊急叫停

      每日經(jīng)濟新聞
      2026-05-27 00:05:35
      李嘉欣穿露背裙參加婚宴,與吳婉芳同桌,吳婉芳盤發(fā)戴翡翠更出眾

      李嘉欣穿露背裙參加婚宴,與吳婉芳同桌,吳婉芳盤發(fā)戴翡翠更出眾

      樹娃
      2026-05-27 14:55:55
      CCTV16直播,泰山拒絕3輪不勝 克雷桑PK韋世豪 成都保住爭冠優(yōu)勢

      CCTV16直播,泰山拒絕3輪不勝 克雷桑PK韋世豪 成都保住爭冠優(yōu)勢

      替補席看球
      2026-05-27 14:03:29
      你讀過回報率最高的一本書是什么?網(wǎng)友:回報率870%!

      你讀過回報率最高的一本書是什么?網(wǎng)友:回報率870%!

      另子維愛讀史
      2026-05-21 20:16:13
      600745,又漲停

      600745,又漲停

      中國基金報
      2026-05-27 12:29:54
      夏天,三個豆子一起煮,濕氣跑了、脾胃棒了,睡得香了,正當時

      夏天,三個豆子一起煮,濕氣跑了、脾胃棒了,睡得香了,正當時

      阿龍美食記
      2026-05-26 14:15:09
      杭州外賣事件刷屏全網(wǎng):5億次傳播背后的職業(yè)尊嚴與初心叩問

      杭州外賣事件刷屏全網(wǎng):5億次傳播背后的職業(yè)尊嚴與初心叩問

      哄動一時啊
      2026-05-26 16:51:21
      只給中方14天時間,澳政府強制接手稀土股份,把自家人都氣笑了

      只給中方14天時間,澳政府強制接手稀土股份,把自家人都氣笑了

      探源歷史
      2026-05-27 13:57:38
      嘉靖第一懸案,懸了500年

      嘉靖第一懸案,懸了500年

      最愛歷史
      2026-05-26 14:06:05
      具俊曄的春天來了!洗清吃軟飯污名,韓媒曝買房承諾,深情終被看見

      具俊曄的春天來了!洗清吃軟飯污名,韓媒曝買房承諾,深情終被看見

      八卦王者
      2026-05-27 11:26:02
      2026-05-27 15:32:49
      新智元 incentive-icons
      新智元
      AI產業(yè)主平臺領航智能+時代
      15317文章數(shù) 66892關注度
      往期回顧 全部

      科技要聞

      韜定律:全球在卷納米數(shù) 華為換了一把尺子

      頭條要聞

      專家:全國多地降雨量突破歷史極值 這是一種異常現(xiàn)象

      頭條要聞

      專家:全國多地降雨量突破歷史極值 這是一種異常現(xiàn)象

      體育要聞

      這群老阿姨,是最硬核的馬刺球迷

      娛樂要聞

      小S曬歸寧宴舊照,大S穿吊帶裙扎丸子頭

      財經(jīng)要聞

      ST巖石退市背后:A股“炒殼”時代終結

      汽車要聞

      極狐問道V9今日將正式上市 搭載華為雪鸮增程系統(tǒng)

      態(tài)度原創(chuàng)

      健康
      家居
      游戲
      本地
      公開課

      打外泌體會比干細胞更安全嗎

      家居要聞

      古老而持久 石影扶手椅

      SE移除《八方旅人0》D加密

      本地新聞

      用剪紙的方式,打開江蘇揚州

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国内av网站| 欧美国产日产一区二区| 国内精品久久久久久久97牛牛| 91免费国产在线观看尤物| 亚洲AV 无码片一区二区三区| 午夜福利影院不卡影院| 精品久久久无码中文字幕| 538AV| 免费观看全黄做爰大片| 久久狼人国产综合精品| 无码人妻斩一区二区三区| 日本不卡一区| 91色老久久精品偷偷蜜臀| 日韩有码av中文字幕| 亚洲人成网线在线播放VA| 辽阳市| 亚洲熟妇自偷自拍另欧美| 天天躁日日躁狠狠躁超碰97| 久99久热只有精品国产99| 成人亚洲a片v一区二区三区动漫 | 日日摸日日添日日碰| 精品国产香蕉伊思人在线又爽又黄| 亚洲婷婷综合色高清在线| 日本久久精品一区二区三区| 国产精品白浆无码流出在线看| 亚洲国产一区二区三区青草影视 | 亚洲色欲色欲大片www无码| 亚洲国产欧洲综合久久| 精品无码国产污污污免费| 香蕉亚洲欧洲在线一区| 午夜成人岛国无码| 欧美成人免费一区二区三区视频| 色爱综合激情五月激情| 国产成人AV性色在线影院| 色亚洲天堂| 国产精品成人免费精品自在线观看| 日韩久久久久久中文人妻| 女人香蕉久久毛毛片精品| 欧美丝袜另类| 最新国产精品亚洲| 国产丰满麻豆videossexhd|