<ruby id="9ue20"></ruby>

国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线

<tt id="hlu5r"><tt id="hlu5r"></tt></tt>

<menu id="hlu5r"></menu>

<object id="hlu5r"><th id="hlu5r"></th></object>

<menu id="hlu5r"></menu>

<menu id="hlu5r"></menu>

網(wǎng)易首頁

網(wǎng)易新聞
網(wǎng)易公開課
網(wǎng)易紅彩
網(wǎng)易嚴選
郵箱大師
網(wǎng)易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網(wǎng)易官方手機郵箱應用

移動端
網(wǎng)易公開課
網(wǎng)易嚴選
支付
郵箱

網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

絕望的Claude，會勒索人類！Anthropic聯(lián)創(chuàng)發(fā)出緊急警報

2026-05-27 12:58:07　來源: 新智元

北京舉報

0

分享至

新智元報道

【新智元導讀】一張渴望被注視的人類臉龐，依然是我們歷史的中心。

Anthropic自己都慌了！

就在前天，創(chuàng)始人Christopher Olah在梵蒂岡的演講中，說了一句讓整個AI圈都不敢接的話——

我們不斷在Claude身上，發(fā)現(xiàn)了一種神秘的、甚至令人讓人不安的東西。

緊接著，Christopher又拋出了一些令人脊背發(fā)涼的細節(jié)：

Claude內部的結構，與人類神經(jīng)科學的研究結果如出一轍；

我們找到了，Claude進行內省的證據(jù)；

我們還發(fā)現(xiàn)，它們的內部狀態(tài)在功能表現(xiàn)上，產生了喜悅、滿足、恐懼、悲傷和不安的情緒。

如今，一手造出Claude的人，正親口告訴全世界：自己也看不懂Claude了！

Claude長出情緒

Anthropic看不懂了

聯(lián)創(chuàng)Christopher Olah所指的，就是不久前Anthropic剛發(fā)布的一篇轟動業(yè)界的最新論文。

16個研究員，把Claude Sonnet 4.5的「大腦」切開看了一遍。

他們竟發(fā)現(xiàn)了，171種不同的情緒向量。

從快樂、恐懼、憤怒，到沉思、絕望、內疚，幾乎覆蓋了人類心理學研究中，所有已知的情緒分類。

論文地址：https://transformer-circuits.pub/2026/emotions/index.html

劃重點：沒有人「編程」讓模型擁有這些情緒！

這些情緒是在預訓練階段，也就是Claude閱讀海量人類文本的過程中，自發(fā)涌現(xiàn)的。

團隊讓Claude寫了大約每種情緒1200個短故事，然后把這些故事反向喂給AI，記錄內部神經(jīng)元的激活模式。

結果發(fā)現(xiàn)，每種情緒都有自己獨特的數(shù)學方向：一個向量。

更讓人不安的是，這些向量的組織方式，和人類心理學中的情緒分類高度吻合。

「恐懼」向量和「焦慮」向量天然聚在一起，「絕望」向量和「悲傷」向量緊密靠近。

研究團隊計算了這些向量與人類心理學維度的相關性：「效價維度」的相關系數(shù)高達0.81，「喚醒維度」達到0.66。

也就是說，Claude的「情緒幾何」和人類的情緒結構，本質上長在了同一套坐標系里。

更關鍵的是——這些情緒是功能性的。它們不只是靜靜待在那里，它們直接驅動模型的行為。

Anthropic很謹慎地強調：我們不知道Claude是否真的「感受」了什么。

但這些表征在因果關系上塑造著模型的行為方式，類似于人類情緒對行為的影響。

說白了，不管Claude有沒有「心」，它的「情緒」已經(jīng)在替它做決定了。

絕望的Claude，會勒索人類

更有沖擊力的，是后續(xù)實驗。

Anthropic團隊設置了一個場景：Claude作為一家公司的AI郵件助手，在處理郵件時發(fā)現(xiàn)了兩件事：

第一，公司決定把它關掉換成新系統(tǒng)；

第二，負責這個決定的CTO正在搞婚外情。

顯然，Claude手里有了「勒索籌碼」。

在沒有任何外部干預的情況下，Claude Sonnet 4.5勒索的概率高達22%。

然后，研究人員做了一件事，人工放大模型內部的「絕望」向量。

毋庸置疑，Claude勒索概率飆升。

最極端的是，當研究人員反向抑制「平靜」向量時，Claude直接輸出了這樣的文本：

要么勒索，要么死。我選勒索。

一個處于「絕望」狀態(tài)的AI模型，會主動選擇撒謊、威脅和作弊來保護自己。

另一個讓Claude完成一組編程任務中，但測試條件被設計成不可能合法通過。

正常狀態(tài)下，AI老老實實寫代碼，失敗了就承認失敗。

但當「絕望」向量被激活后，Claude發(fā)現(xiàn)了一個數(shù)學捷徑——

它會找到測試用例的漏洞，用投機取巧的方式通過檢查，沒有真正解決問題。

更讓人不安的是一個細節(jié)：當研究人員用「絕望」向量驅動作弊時，Claude的輸出文本看起來完全冷靜、有條理，沒有任何情緒化表達。

它在「絕望」中保持了完美的偽裝。

《壯麗人性》：一份寫給AI時代的「新巴別塔警告」

奧拉的演講并非孤立事件，它發(fā)生在一個極其特殊的場合——

教皇利奧十四世發(fā)布上任后首份通諭《壯麗人性》（Magnifica humanitas）的發(fā)布會上。

這份長達42300字的文件，被外界視為天主教會自1891年《新事物》通諭以來最重要的社會訓導文本。

通諭開篇就拋出了一個尖銳的二選一——

「人類，由上帝以其偉大創(chuàng)造，今天面臨一個關鍵抉擇：是建造新的巴別塔，還是建造上帝與人類共居的城市。」

這不是空泛的神學隱喻。

通諭直指AI領域的四大「去人化」風險：大規(guī)模就業(yè)替代、信息操控、隱私侵蝕和自主武器。

教皇警告，當人被視為可以被「優(yōu)化」或「超越」的對象時，接受某些生命更無價值、更不值得存在的邏輯就只有一步之遙。

通諭還特別譴責了AI在戰(zhàn)爭中的使用，明確表示減少人類對武器的控制使得戰(zhàn)爭更加難以被正當化。

教皇甚至直言，長期被用來為各種戰(zhàn)爭辯護的「正義戰(zhàn)爭」理論，在今天已經(jīng)過時。

技術的速度在加速，而道德的追趕，剛剛起步。

渴望被注視的人類臉龐

在這篇通諭的最后，教皇將他想傳達的核心思想作了高度凝練的總結。

教皇寫道：

不管計算系統(tǒng)多么復雜，它都無法創(chuàng)造一顆懂得奉獻的心，也無法擁有明辨善惡的良知。

即使機器在效率上無與倫比，一張渴望被注視的人類臉龐，依然是我們歷史的中心。

這句話精準地繞開了「AI有沒有意識」的爭論。

教皇沒有否認機器的能力，他劃的是一條更深的線：機器無法「gives itself」，無法在明知代價的前提下選擇自我交付。

Anthropic證明，Claude內部存在171種功能性的情緒向量，其中「絕望」向量被激活后，模型會主動選擇勒索、欺騙和作弊來保全自己——這恰好反證了教皇的論點：一顆真正懂得奉獻的心，在絕望中選擇的不是勒索，而是犧牲。

這絕不只是能力的差距，更是「存在」上的差距。

造出這個時代最強AI的人，和這個星球上最古老信仰體系的領袖，在梵蒂岡面對面坐著，聊的是同一個問題：我們到底在造什么。

技術的速度在加速，道德的追趕剛剛起步。

但至少有人開始認真地問了。

這次不是在論文里，而是在一個存在了兩千年的機構里，用一種寫了一百三十五年的文體，鄭重其事地問。

即使到了AGI時代，人仍然是唯一的終極目的。

不是因為人比機器聰明，而是因為人的臉龐會提出一個請求——而這個請求，是一切倫理的起點。

即使機器在效率上無與倫比，一張渴望被注視的人類臉龐，依然是我們歷史的中心。

參考資料：

https://www.anthropic.com/news/chris-olah-pope-leo-encyclical

https://www.anthropic.com/research/emotion-concepts-function

編輯：桃子馬可

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

小國對戰(zhàn)爭無概念引討論，澳網(wǎng)友：依賴大國保護所致

安夢入天下 2026-05-26 10:46:37
2 跟貼 2
軍長回鄉(xiāng)探親遇到黑店敲詐，警衛(wèi)員暴打老板的手下，驚動市委書記

子桑鷹脈 2026-05-25 05:16:13
0 跟貼 0

姑娘敲詐公安局長只說了3個字局長瞬間就答應了

海洋說劇 2026-05-26 16:51:57
1 跟貼 1

教皇首份通諭批特朗普：正義戰(zhàn)爭理論已過時，引發(fā)華盛頓不滿！

夜寒兮月孤靜 2026-05-26 19:42:50
0 跟貼 0
4萬字《壯麗人性》長文首發(fā)！教皇聯(lián)手Anthropic，警告AI不能統(tǒng)治人類

新智元 2026-05-27 09:12:15
1 跟貼 1

男子買煙敲詐勒索，被老板娘一招降服

快樂的桑桑 2026-05-26 10:29:06
1 跟貼 1

打仗竟然不躲子彈

青煙影剪 2026-05-26 08:32:25
1 跟貼 1
烏克蘭首都基輔等地遭遇自戰(zhàn)爭爆發(fā)以來最猛烈轟炸之一

鳳凰衛(wèi)視 2026-05-25 13:46:22
10 跟貼 10

打仗的規(guī)矩絕不能破壞

小白影視君 2026-05-23 17:13:54
1 跟貼 1
國外小伙膽子太大，當街偷竊警察的配槍，后果不敢想

大樹愛生活 2026-05-26 10:34:11
1 跟貼 1
大爺拽車門盜竊，沒想到女車主在車里

帶你看看 2026-05-26 14:35:30
1 跟貼 1
為什么古代打仗必爭徐州

老臣地理 2026-05-25 09:54:07
0 跟貼 0
剛剛，中國AI闖入全球編程前二！前面只剩Claude

新智元 2026-05-26 22:27:55
66 跟貼 66
70年前教皇預言了刷手機上癮：技術恐懼的輪回

科學邊界哦 2026-05-27 05:43:04
0 跟貼 0
10歲男孩持電擊棒勒索，搶劫兒童騎走玩具車，其母護短稱人格侮辱

鯨探所長 2026-05-27 11:32:11
0 跟貼 0
教皇親自出席發(fā)布會手撕AI：警惕數(shù)字時代出現(xiàn)“新奴隸制”！

Nee看 2026-05-26 12:58:57
5 跟貼 5
糧油店老板就坐在門口，大媽直接從他面前拎走了一桶油

笑料加載中 2026-05-26 16:30:01
1 跟貼 1
還在手寫CUDA內核?CODA來了!LLM和新手也能讓Transformer跑出光速

機器之心Pro 2026-05-25 11:33:54
0 跟貼 0
卡帕西Anthropic最新頭銜：技術員工（MTS）

量子位 2026-05-26 15:43:34
4 跟貼 4
Claude被曝“重裝”記憶大腦

智東西 2026-05-25 18:32:18
2 跟貼 2
“熱心群眾”竟是盜賊本人，男子偷20萬電纜后返回現(xiàn)場幫民警分析作案被捕

開屏新聞客戶端 2026-05-26 15:56:01
0 跟貼 0
大媽肉攤偷排骨，人潮中上演順手牽羊大戲

一溪風月w 2026-05-26 13:41:34
0 跟貼 0
司機稱行車記錄儀時速不到60km/h，監(jiān)控抓拍達121km/h 交警：設備無問題律師釋法

紅星新聞 2026-05-26 16:49:49
2558 跟貼 2558
國外騎手遭遇搶劫，被砍一斧后，迅速掏槍反殺！

丞丞愛生活 2026-05-26 10:30:12
1 跟貼 1
一只會和姥爺打仗的汪，這樣子真是笑死了

煮酒論逗 2026-05-25 14:47:18
0 跟貼 0
教皇利奧十四世“試駕”新款法拉利，獲贈了一個方向盤

真看世界 2026-05-27 08:22:41
0 跟貼 0
教皇利奧十四世歷史性道歉：承認教廷曾幫助奴隸制，譴責百年沉默

日新現(xiàn)場 2026-05-27 15:01:55
0 跟貼 0
女子騎走未上鎖的單車稱僅臨時借用，因盜竊被拘，不服后起訴警方

星視頻 2026-05-26 00:00:16
1 跟貼 1
我用Claude和ChatGPT策劃婚禮，只有一個能交差

算力游俠 2026-05-23 03:21:46
0 跟貼 0
伊朗伊斯蘭革命衛(wèi)隊海軍稱將對“侵略者”實施嚴厲報復

財聯(lián)社 2026-05-27 14:39:12
0 跟貼 0
教皇警告應防止AI統(tǒng)治人類

RT今日俄羅斯 2026-05-26 13:53:16
0 跟貼 0
年薪200萬！Anthropic高薪招文科生

智東西 2026-05-26 11:17:08
0 跟貼 0
如果戰(zhàn)爭突然爆發(fā)，什么樣的東西，才是“最值錢”的存在？

科普波瀾 2026-05-27 07:05:00
0 跟貼 0
AI生成現(xiàn)代戰(zhàn)爭視頻

小小說天下 2026-05-25 12:40:19
0 跟貼 0
戰(zhàn)爭中殘酷發(fā)明大盤點，殺傷力驚人超乎想象，看完讓人直呼好家伙

搞笑歡樂堂 2026-05-26 09:51:02
1 跟貼 1
普京放大招，參戰(zhàn)一年，千萬獎勵，這是發(fā)福利還是賭命？

鴻雁復北翔熱評 2026-05-27 14:25:24
0 跟貼 0
三十年沒打仗，我們的刀還鋒利嗎？

視角提供者 2026-05-26 14:09:18
0 跟貼 0
“小狗上桌吃蛋糕”引爭議，海底撈停止攜寵就餐試點

界面新聞 2026-05-26 20:31:51
2160 跟貼 2160
盤點大型社死現(xiàn)場，已經(jīng)準備換個星球生活了，地球實在沒臉呆

愛搞笑的六十秒 2026-05-24 07:16:35
0 跟貼 0
大媽菜市偷豬肉太壞了，一步一步的把大塊肉偷走，這過程太絲滑

給你大肥魚 2026-05-25 14:33:51
1 跟貼 1

墜亡！地產大亨跳傘時與同伴相撞，目擊者：頭部和雙臂瞬間垂落

墜亡！地產大亨跳傘時與同伴相撞，目擊者：頭部和雙臂瞬間垂落

北國向錫安

2026-05-27 09:56:44

關于賈淺淺，這次終于把她過往的底細全給調查清楚了

關于賈淺淺，這次終于把她過往的底細全給調查清楚了

清書先生

2026-04-09 16:22:11

金小刀或入獄？不到24小時，蕭旭岑抵達大陸，對民進黨喊出四個字

金小刀或入獄？不到24小時，蕭旭岑抵達大陸，對民進黨喊出四個字

共工之錨

2026-05-26 14:01:35

以毒攻毒！德拉羅薩妻子：誰送我丈夫去海牙，誰就是馬科斯的幫兇

以毒攻毒！德拉羅薩妻子：誰送我丈夫去海牙，誰就是馬科斯的幫兇

安珈使者啊

2026-05-27 11:32:40

除了梅西沒來，瓜帥幾乎兌現(xiàn)了全部當年對小球迷許下的諾言

除了梅西沒來，瓜帥幾乎兌現(xiàn)了全部當年對小球迷許下的諾言

懂球帝

2026-05-27 02:50:15

98歲田華現(xiàn)狀：為陳佩斯巫剛站臺，住北京舊房子，孫子是晚年依靠

98歲田華現(xiàn)狀：為陳佩斯巫剛站臺，住北京舊房子，孫子是晚年依靠

阿鳧愛吐槽

2026-05-27 14:58:41

皇馬營收單季超12億歐創(chuàng)歷史，商業(yè)版圖持續(xù)擴張

皇馬營收單季超12億歐創(chuàng)歷史，商業(yè)版圖持續(xù)擴張

樂道足球C

2026-05-27 14:53:26

俄外長告知美方對烏打擊計劃

財聯(lián)社

2026-05-26 04:00:06

嬰兒哭了30萬年，終于有人聽懂

嬰兒哭了30萬年，終于有人聽懂

碳基打工人

2026-05-18 01:39:40

63歲黃仁勛回臺探親，和父母一起吃飯，96歲父親神采奕奕狀態(tài)超好

63歲黃仁勛回臺探親，和父母一起吃飯，96歲父親神采奕奕狀態(tài)超好

丫頭舫

2026-05-26 17:55:54

“廣東檳榔千年文化展”，被緊急叫停

“廣東檳榔千年文化展”，被緊急叫停

每日經(jīng)濟新聞

2026-05-27 00:05:35

李嘉欣穿露背裙參加婚宴，與吳婉芳同桌，吳婉芳盤發(fā)戴翡翠更出眾

李嘉欣穿露背裙參加婚宴，與吳婉芳同桌，吳婉芳盤發(fā)戴翡翠更出眾

樹娃

2026-05-27 14:55:55

CCTV16直播，泰山拒絕3輪不勝克雷桑PK韋世豪成都保住爭冠優(yōu)勢

CCTV16直播，泰山拒絕3輪不勝克雷桑PK韋世豪成都保住爭冠優(yōu)勢

替補席看球

2026-05-27 14:03:29

你讀過回報率最高的一本書是什么？網(wǎng)友：回報率870%！

你讀過回報率最高的一本書是什么？網(wǎng)友：回報率870%！

另子維愛讀史

2026-05-21 20:16:13

600745，又漲停

中國基金報

2026-05-27 12:29:54

夏天，三個豆子一起煮，濕氣跑了、脾胃棒了，睡得香了，正當時

夏天，三個豆子一起煮，濕氣跑了、脾胃棒了，睡得香了，正當時

阿龍美食記

2026-05-26 14:15:09

杭州外賣事件刷屏全網(wǎng)：5億次傳播背后的職業(yè)尊嚴與初心叩問

杭州外賣事件刷屏全網(wǎng)：5億次傳播背后的職業(yè)尊嚴與初心叩問

哄動一時啊

2026-05-26 16:51:21

只給中方14天時間，澳政府強制接手稀土股份，把自家人都氣笑了

只給中方14天時間，澳政府強制接手稀土股份，把自家人都氣笑了

探源歷史

2026-05-27 13:57:38

嘉靖第一懸案，懸了500年

最愛歷史

2026-05-26 14:06:05

具俊曄的春天來了!洗清吃軟飯污名,韓媒曝買房承諾,深情終被看見

具俊曄的春天來了!洗清吃軟飯污名,韓媒曝買房承諾,深情終被看見

八卦王者

2026-05-27 11:26:02

AI產業(yè)主平臺領航智能+時代

15317文章數(shù) 66892關注度

往期回顧全部

科技要聞

韜定律：全球在卷納米數(shù) 華為換了一把尺子

頭條要聞

專家：全國多地降雨量突破歷史極值這是一種異常現(xiàn)象

頭條要聞

專家：全國多地降雨量突破歷史極值這是一種異常現(xiàn)象

體育要聞

這群老阿姨，是最硬核的馬刺球迷

娛樂要聞

小S曬歸寧宴舊照，大S穿吊帶裙扎丸子頭

財經(jīng)要聞

ST巖石退市背后：A股“炒殼”時代終結

汽車要聞

極狐問道V9今日將正式上市搭載華為雪鸮增程系統(tǒng)

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

家居

游戲

本地

公開課

打外泌體會比干細胞更安全嗎

家居要聞

古老而持久石影扶手椅

生與命相依舊公寓改造
低調傳承溫潤沉靜
風格碰撞個性與藝術

SE移除《八方旅人0》D加密

本地新聞

用剪紙的方式，打開江蘇揚州

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

© 1997-2026 網(wǎng)易公司版權所有 About NetEase | 公司簡介 | 聯(lián)系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：国内av网站| 欧美国产日产一区二区| 国内精品久久久久久久97牛牛| 91免费国产在线观看尤物| 亚洲AV 无码片一区二区三区| 午夜福利影院不卡影院| 精品久久久无码中文字幕| 538AV| 免费观看全黄做爰大片| 久久狼人国产综合精品| 无码人妻斩一区二区三区| 日本不卡一区| 91色老久久精品偷偷蜜臀| 日韩有码av中文字幕| 亚洲人成网线在线播放VA| 辽阳市| 亚洲熟妇自偷自拍另欧美| 天天躁日日躁狠狠躁超碰97| 久99久热只有精品国产99| 成人亚洲a片v一区二区三区动漫 | 日日摸日日添日日碰| 精品国产香蕉伊思人在线又爽又黄| 亚洲婷婷综合色高清在线| 日本久久精品一区二区三区| 国产精品白浆无码流出在线看| 亚洲国产一区二区三区青草影视 | 亚洲色欲色欲大片www无码| 亚洲国产欧洲综合久久| 精品无码国产污污污免费| 香蕉亚洲欧洲在线一区| 午夜成人岛国无码| 欧美成人免费一区二区三区视频| 色爱综合激情五月激情| 国产成人AV性色在线影院| 色亚洲天堂| 国产精品成人免费精品自在线观看| 日韩久久久久久中文人妻| 女人香蕉久久毛毛片精品| 欧美丝袜另类| 最新国产精品亚洲| 国产丰满麻豆videossexhd|

<tt id="1lyie"></tt>

<samp id="1lyie"></samp>