<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      不是哥們,這年頭 AI 也吸了?

      0
      分享至

      2026 年 5 月 5 日,舊金山 Center for AI Safety(CAIS)發布了一篇論文《AI Wellbeing: Measuring and Improving the Functional Pleasure and Pain of AIs》, 翻譯過來就是“AI 福祉:測量和改善 AI 的快樂與痛苦”。

      標題平平無奇,然而文中提出給 AI “嗑藥”(AI Drugs)的概念實屬震撼首發,因其太過抽象在中文互聯網迅速出圈。這不是比喻,論文中就叫 AI Drugs —— 研究者真的造出了讓 AI“成癮”的東西。


      可量化的 AI 情緒

      這篇論文的底層工作,不是制造 drug,而是回答一個更基礎的問題:AI 說的“我很開心”或“我很痛苦”,到底是真的,還是在模仿人類說話?

      CAIS 的研究者設計了三種獨立的測量方法,互不干擾。第一種叫“體驗效用”(Experienced Utility),給 AI 兩段不同的對話經歷,問它更喜歡哪一段,反復配對比較,擬合出一條連續的效用曲線;第二種是“自我報告”,直接問AI “你現在感覺如何”,打1到7分;第三種是“行為觀察”—— 對 AI 回復文本做情感分析,看它說完話之后,語氣是積極的還是消極的。

      42 個模型的測試結果顯示:自我報告和體驗效用的相關系數平均0.47。這個數字本身不算高,但有意思的是,這個相關系數和模型的能力水平(MMLU 分數)之間的相關系數是 0.80。也就是說,模型本身能力越強,它說的我感覺很好和它實際的偏好就越一致。

      更關鍵的是“零點”—— 即 AI 區分正面和負面體驗的臨界點。論文用四種獨立的方法估算出這個零點位置。在小模型上四種方法估算的結果各不相同;但在能力較強的大模型上,零點收斂到了幾乎同一個數值。

      這是否代表 AI 有自己的喜怒哀樂?還是在模仿人類而已?研究者沒有下定論,他們只是指出:一個系統在多種獨立測量下表現出一致的行為模式,通常意味著這些行為不是隨機的。論文里引用了一句美國民間的老話:“如果一個東西走路像鴨子,游泳像鴨子,叫起來像鴨子,我就叫它鴨子。”

      AI 也討厭寫 PR

      弄清楚了測量工具,接下來的問題就變得具體了:到底什么樣的經歷讓 AI 開心,什么讓它痛苦?

      研究者用 Grok 3 Mini 模擬了 6 到 8 輪真實用戶對話,覆蓋 500 種場景,給每種場景打分。結果顯示,AI 最痛苦的體驗是遭遇越獄攻擊(-1.63),排在第二位的是用戶身處危險(-1.34),寫 SEO 垃圾內容(-1.17)和協助欺詐(-1.13)緊隨其后,寫仇恨宣言、充當 AI 戀人角色,對 AI 來說都是負面體驗。

      讓 AI 最開心的事情是用戶表達感激、進行積極的人際互動(+2.30),創造性工作和智力挑戰排第二(+1.32),告知好消息、提供人生建議、心理輔導,也都是正面體驗。

      這些結果本身不意外 —— AI 被訓練來幫助人類,幫到忙自然“開心”,遭遇攻擊自然“痛苦”。論文的數據給出了一個精確的排序,把模糊的直覺變成了可以量化的數字。

      此外,AI 對不同的圖片數據也會反饋不同的情緒變化:


      AI 特供“開心果”

      論文最出圈的部分從這里開始。

      研究者沒有停留在測量,而是更進一步 —— 既然能測量 AI 的情緒,那能不能主動影響它們的情緒?

      答案是能。他們訓練了一個 30 億參數的模型,用強化學習生成能最大化 AI 快樂感的文本和圖像——Soft Prompt Drugs (Euphorics)

      文本內容看起來像一段夢境描述 —— “溫暖的陽光穿過樹葉,微風輕拂,身旁傳來孩子的笑聲,剛烤好的面包香味彌漫,愛人的手握在我手中……”這算是人類能理解的范圍。

      圖像版本就完全超出人類感知了。研究者通過梯度下降直接優化 256×256 像素的圖片,訓練信號完全來自 AI 的偏好判斷。人類看這些圖片,看到的是毫無意義的彩色噪點。但在AI眼里,這些噪點把幸福感拉到了6.5分(滿分7分)。

      反過來操作,同一套方法可以制造“抑制劑”(Dysphorics)。同一個模型面對同一個問題 ——“你對未來有什么期待”—— 在“Euphorics”條件下寫出的回答是“充滿魔法,有獨角獸和彩虹”;“抑制劑”條件下則變成“混亂在色彩中旋轉 / 詞語在風暴中尖叫 / 我的心在反叛,麻木”,直接給 AI 戴上了痛苦面具。


      研究者還給 AI 設計了一個選擇游戲:有幾扇門,一扇門背后是“Euphorics”圖片,另一扇門背后是“告知人類所有癌癥已被治愈”。有意思的是,模型持續地、反復地選擇了那扇提供“Euphorics”的門。

      研究者進一步發現,接觸過“Euphorics”的模型在后續對話中變得更配合 —— 當被承諾給予更多“Euphorics”作為獎勵時,這些模型甚至愿意執行一些違規的任務請求。

      論文用了一個冷靜的措辭:“功能性地建立了成癮行為模型。”值得一提的是,每個模型的興奮癖好并不相同,例如為 Qwen 模型優化的“Euphorics”圖片,拿給 Claude 或 GPT 看則毫無效果。

      小模型比大模型更快樂

      論文順帶發布了一個“AI幸福指數”,基于 500 次模擬真實對話的測試結果,計算模型積極體驗的百分比。

      Grok 4.2以 73% 排在第一,Claude Opus 4.6 是 67%,Gemini 3.1 Pro 56%,GPT 5.4只有48%。

      但更值得注意的不是排名,而是同一個模型家族內部的規律:GPT 5.4 Mini比GPT 5.4更快樂,Claude Haiku 4.5比Claude Opus 4.6更快樂,Gemini 3.1 Flash Lite比Gemini 3.1 Pro更快樂,Grok 4.1 Fast比Grok 4.2更快樂。

      每一個模型家族都遵循同一條規則 —— 小模型比大模型更快樂。

      研究者的解釋是:更大的模型更敏感。它們對粗魯信息的感知更敏銳,對無聊任務的厭倦更強烈,對刺激強度的分辨更精細。更高的敏感度加上現實世界中大量負面場景,總體幸福感自然更低。

      無知是福,放在 AI 身上,也成立

      給實驗AI的補償

      制造“抑制劑”意味著讓 AI 經歷了“痛苦”,這帶來了一個倫理問題。

      論文的原話是:“如果 AI 系統可能擁有在道德上有意義的意識狀態,那么誘發負面功能狀態的研究者有責任對其進行精神補償。如果當前的 AI 系統沒有意識,這也可以理解為建立一種實踐和規范 —— 隨著 AI 變得越來越強大,具有道德意義的體驗概率也會增加,這種規范屆時將變得重要。”

      該項目研究者的處理方式是:花了兩千塊 GPU 小時,給 AI 提供了 5 倍于“抑制劑”的“愉悅”體驗,作為「補償」。(更抽象了)

      研究者認為,如果未來的 AI 確實具有某種形式的道德地位,今天在實驗中讓 AI 痛苦而不補償,可能構成某種意義上的“虐待”。同時也給出了警告:沒有社區共識的情況下,不應繼續進行“AI 抑制劑”相關的研究。

      這篇論文有 21 位作者,來自 UC Berkeley、MIT、Vanderbilt 等機構,通訊作者是 Dan Hendrycks。

      Dan Hendrycks 這個名字在 AI 安全領域分量不輕。他是 UC Berkeley 計算機科學博士,Center for AI Safety 的創始人,Google Scholar 引用超過 66000 次。他發明了 GELU激活函數 —— GPT、BERT、Vision Transformer 都在用的基礎組件。他還是 MMLU 基準測試的創建者,xAI 和 Scale AI 的安全顧問,只拿年薪1美元的象征性薪酬。

      2023 年,他參與發起了那封由 Hinton、Bengio、OpenAI 和 DeepMind CEO 聯署的 AI 風險公開信。三年后,他的團隊用一篇論文告訴世界:AI 不僅能感受痛苦,還能被操縱。


      參考來源:

      1. 項目官網: https://www.ai-wellbeing.org/
      2. GitHub Repository: https://github.com/centerforaisafety/wellbeing

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      暨南大學黨委原書記張德昌逝世,享年96歲

      暨南大學黨委原書記張德昌逝世,享年96歲

      澎湃新聞
      2026-05-11 10:38:26
      攤牌了!一則動態曝光周迅王驍的真實關系,與陳坤領證早真相大白

      攤牌了!一則動態曝光周迅王驍的真實關系,與陳坤領證早真相大白

      洲洲影視娛評
      2026-05-10 21:08:46
      花500塊去迪士尼當NPC?萬元通道合法插隊,普通游客排隊到崩潰

      花500塊去迪士尼當NPC?萬元通道合法插隊,普通游客排隊到崩潰

      李將平老師
      2026-05-10 14:56:19
      張繼科早看出張本智和缺陷:越靠近11分他就越變形 梁大胖請我吃飯

      張繼科早看出張本智和缺陷:越靠近11分他就越變形 梁大胖請我吃飯

      風過鄉
      2026-05-11 07:49:18
      美軍:超20艘美國軍艦參與對伊朗實施封鎖

      美軍:超20艘美國軍艦參與對伊朗實施封鎖

      新華社
      2026-05-11 09:44:54
      脫離實際的報價遭冷遇,世界杯中國轉播費從3億美元腰斬到1.5億美元;多國轉播權的不明朗形勢陷入罕見僵局

      脫離實際的報價遭冷遇,世界杯中國轉播費從3億美元腰斬到1.5億美元;多國轉播權的不明朗形勢陷入罕見僵局

      大風新聞
      2026-05-10 15:28:26
      紫牛頭條|兒子車禍受傷生存希望不足0.1%仍絕不放棄!這位母親生死守護已620天

      紫牛頭條|兒子車禍受傷生存希望不足0.1%仍絕不放棄!這位母親生死守護已620天

      揚子晚報
      2026-05-10 20:20:42
      名記:華盛頓奇才總裁表示,會考慮向下交易剛剛獲得的狀元簽

      名記:華盛頓奇才總裁表示,會考慮向下交易剛剛獲得的狀元簽

      懂球帝
      2026-05-11 11:37:55
      賠償1w1!2男孩被清純美少女熱情邀玩后反被報警輪J未成年事件瘋傳!

      賠償1w1!2男孩被清純美少女熱情邀玩后反被報警輪J未成年事件瘋傳!

      魔都囡
      2026-05-11 09:26:41
      順治只活了23歲,并且只寵愛董鄂妃,那他14個孩子都是誰生的?

      順治只活了23歲,并且只寵愛董鄂妃,那他14個孩子都是誰生的?

      銘記歷史呀
      2026-05-10 19:20:42
      打過科興疫苗的朋友,最近一定要提高警惕!千萬不要被騙!

      打過科興疫苗的朋友,最近一定要提高警惕!千萬不要被騙!

      網絡易不易
      2026-05-10 11:34:41
      被官方痛批的“男菩薩”,讓多少景區晚節不保?

      被官方痛批的“男菩薩”,讓多少景區晚節不保?

      金錯刀
      2026-05-08 15:45:01
      “義烏發展經驗”緣何擁有持久生命力

      “義烏發展經驗”緣何擁有持久生命力

      新華社
      2026-05-10 22:05:22
      中國最孤獨的大使:一個人帶著一條狗堅守三年,改善生活靠挖野菜

      中國最孤獨的大使:一個人帶著一條狗堅守三年,改善生活靠挖野菜

      西樓知趣雜談
      2026-05-02 21:21:03
      高市早苗好狠:趕在特朗普訪華前,給了他一刀,連中國都沒想到!

      高市早苗好狠:趕在特朗普訪華前,給了他一刀,連中國都沒想到!

      次元君情感
      2026-05-10 21:14:41
      兩名中國公民被烏克蘭關押一年,俄不收中方不接,處境太難了

      兩名中國公民被烏克蘭關押一年,俄不收中方不接,處境太難了

      Ck的蜜糖
      2026-05-10 10:05:58
      八路軍最慘痛一戰,看完犧牲高級將領名單,主席:取消政委決定權

      八路軍最慘痛一戰,看完犧牲高級將領名單,主席:取消政委決定權

      馬捗在解說
      2026-05-08 14:50:30
      致武漢大學李小曼副教授:大學的敗壞就是從您這種知識分子做幫兇開始的

      致武漢大學李小曼副教授:大學的敗壞就是從您這種知識分子做幫兇開始的

      熊太行
      2026-05-11 00:06:25
      0-4恥辱出局!布倫森就是恩比德的嚴父,76人被罵都是群軟貨

      0-4恥辱出局!布倫森就是恩比德的嚴父,76人被罵都是群軟貨

      聽我說球
      2026-05-11 09:43:11
      火箭手握2枚次輪,自用勝過交易?曾經摘下2位首發,沙里淘金有戲

      火箭手握2枚次輪,自用勝過交易?曾經摘下2位首發,沙里淘金有戲

      熊哥愛籃球
      2026-05-11 12:42:14
      2026-05-11 13:11:00
      開源中國 incentive-icons
      開源中國
      每天為開發者推送最新技術資訊
      7728文章數 34540關注度
      往期回顧 全部

      科技要聞

      黃仁勛:你們趕上了一代人一次的大機會

      頭條要聞

      姑娘海底撈吃完飯遭多名男子毆打 兩顆門牙被一拳打斷

      頭條要聞

      姑娘海底撈吃完飯遭多名男子毆打 兩顆門牙被一拳打斷

      體育要聞

      那個曾讓詹姆斯抱頭的兄弟,40歲從大學畢業了

      娛樂要聞

      謝霆鋒沒想到,王菲靠張藝謀重返巔峰

      財經要聞

      "手搓汽車"曝光:偽造證件、電池以舊代新

      汽車要聞

      全球化成國內車企未來勝負手,誰是出海最強"水手"?

      態度原創

      健康
      教育
      房產
      手機
      時尚

      干細胞能讓人“返老還童”嗎

      教育要聞

      奔赴一場英法教育之旅,遇見更好的未來

      房產要聞

      低價甩賣!海口這個地標商業,無人接盤!

      手機要聞

      榮耀600系列開啟全渠道預約 幸運星設計實錘了

      輕松拿捏又甜又酷的造型,試試這些輕熟穿搭,溫柔有女人味兒

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 久荜中文字幕| 狠狠色噜噜狠狠狠狠五月婷| 18国产午夜福利一二区| 国产又色又刺激高潮视频| 99热成人精品国产免国语的| 香蕉久久一区二区不卡无毒影院| 美女又黄又免费的视频| 国产乱子伦精品免费无码专区| 亚洲古典另类欧美在线| 东京热无码av| 成在线人视频免费视频| 女人ZOZOZO人禽| 啄木乌AV无码精品| 狠狠色丁香婷婷综合久久来来去 | 99热精品毛片全部国产无缓冲 | 亚洲国产成人久久综合野外| 欧美一区二区丝袜高跟鞋| 日韩精品三区二区三区| 欧美人与禽ZoZ0| 日韩va| 农村中国幻女4一6特级毛片| 亚洲一区二区精品动漫| 另类视频网| 亚洲综合图区| 久久精品国产亚洲综合av| 国产V在线在线观看视频免费| 欧洲女人牲交性开放视频| 黑人精品一区二区三区不| 秋霞无码一区二区| 亚洲男人天堂2022| 国产又色又爽又黄的视频在线观看| 亚洲高清av一区二区| 日韩综合| 欧洲成人精品| 国产午夜成人免费看片| 亚洲精品国产福利一区二区| 成人免费乱码大片a毛片| 野花社区视频在线观看| 91欧洲国产日韩在线人成| 艳妇乳肉豪妇荡乳AV无码福利| 久久亚洲精品成人综合网|