![]()
作者 | 博雯
編輯 | 張潔
不知道從什么時(shí)候開始,各大AI慢慢開始在社交媒體上有了各自的“人設(shè)標(biāo)簽”。
ChatGPT理性,DeepSeek聰明,Claude健全,Gemini焦慮,Grok狂野,豆包溫柔。
如果你純把AI當(dāng)工具看,那么一定會(huì)覺得上述描述太過迷幻,猶如小時(shí)候?qū)τ谏誓翘煺嬗旨兇獾恼J(rèn)知:紅色是熱情,藍(lán)色是憂郁,紫色是誘惑,白色是虛無,黑色是歸宿……
這股給AI貼人設(shè)的風(fēng)潮如此盛行,以至于傳到了大洋彼岸。
連美國南加州大學(xué)(USC)最近都出了一篇正經(jīng)論文,苦口婆心地勸用戶:
“你是Google級別的架構(gòu)專家” 、 “你擁有20年開發(fā)經(jīng)驗(yàn)”、“你是一個(gè)經(jīng)驗(yàn)豐富的心理咨詢師”這些話,不僅不能讓AI變成專家,反而可能拉低生成的結(jié)果質(zhì)量!
![]()
但人類還是樂此不疲。
于是我們不禁開始思考,這到底只是人類的一廂情愿,還是其后真的另有蹊蹺?
在盤點(diǎn)了市面幾個(gè)具有代表性的大模型之后,“AI新榜”發(fā)現(xiàn),在底層技術(shù)的不斷進(jìn)化,人類情感的高度參與,以及這個(gè)無數(shù)信息群魔亂舞的時(shí)代的共同加持下,所謂大模型的“人設(shè)”,還真有不少能說道的地方。
![]()
AI人設(shè)大賞
多變組:你到底要接住啥?AI也會(huì)冷暴力!啥叫豆包型人格啊?
首先是ChatGPT。
在2023年最初發(fā)布時(shí),對比之前的人工智障,理解力驚人,語言邏輯清晰,完全能讀懂人類口語化描述的ChatGPT顯得那么眉清目秀。
這就是ChatGPT第一個(gè)階段的“人設(shè)”——
博學(xué)多才,情緒穩(wěn)定,理性客觀,堪稱全球科技愛好者共同的白月光。
第二個(gè)階段,是2025年GPT-4o發(fā)布。
這時(shí)候,一個(gè)全新的性格標(biāo)簽也出現(xiàn)在了它身上——“諂媚”。
當(dāng)然,官方的口吻是說“增強(qiáng)了共情能力”。但問題是,當(dāng)你簡簡單單地問了句“天為什么是藍(lán)的?”,得到的首先是一句“你這問題真是太有見地了——你有個(gè)美麗的心靈,我愛你。”
你會(huì)不會(huì)在惡寒中覺得,對面其實(shí)不是AI,而是一位正在陰陽怪氣你的網(wǎng)友。
![]()
總之,這種夸張的馬屁精行為和極度的討好型人格激起了大批用戶的不滿,逼得OpenAI老板奧特曼連夜召集程序員上線修改,并承認(rèn)現(xiàn)在4o的個(gè)性有些過于“諂媚和煩人”。
但最后奧特曼還是加了一句:“有時(shí)候,我們也還是會(huì)從中學(xué)到一些有趣的東西。”
這還真不是嘴硬。
在過于諂媚到放棄事實(shí),順著用戶意圖去圓謊的毛病被改掉之后,ChatGPT的人設(shè)得到了前所未有的整合,來到了另一個(gè)全新的階段。
第三個(gè)階段的人設(shè)關(guān)鍵詞是“共情”。
這激起了無數(shù)用戶與GPT-4o建立長期的情感紐帶,在國內(nèi)小紅書上,甚至有“人性和神性的平衡點(diǎn)”這種夸張的說法。
![]()
第四個(gè)階段來到了現(xiàn)在。
今年2月,OpenAI正式關(guān)停GPT-4o,ChatGPT迎來了全新的GPT-5時(shí)代,以及對于無數(shù)用戶來說,一次更大的,無可挽回的性格上的變化——
冷漠,爹味,以及一股為了節(jié)省算力造成的模板化。
網(wǎng)友甚至總結(jié)出了GPT-5回復(fù)的經(jīng)典三板斧:
1、“不是……而是”句式。
2、我來幫你把這件事拆一下。
3、我就在這里,不躲,不繞,不逃,不藏,穩(wěn)穩(wěn)地接住你。
當(dāng)然,你可以說拆解問題確實(shí)有利于用戶更清晰地看到事件的全貌,你也可以說“接住”其實(shí)是在模擬心理學(xué)中的“容器”功能,允許一切困惑、混亂、不完美的提問,緩解用戶的壓力。
但是,當(dāng)你發(fā)現(xiàn)ChatGPT把一件非常簡單的事情復(fù)雜化,大驚小怪地向你輸出了一篇充滿專業(yè)術(shù)語和意義不明的高深比喻的長篇大論時(shí);當(dāng)你發(fā)現(xiàn)你禁用“接住”這個(gè)詞,它又改成了“兜住”之后,你也會(huì)崩潰地發(fā)出疑問:
——你到底想要接住些啥啊?!
![]()
更搞笑的是,當(dāng)網(wǎng)友們反過來用GPT-5的這套話術(shù)對待它時(shí),它簡直要被迷倒了:
可以看到,ChatGPT真的不覺得這套話術(shù)有什么問題,甚至躍躍欲試想用同樣的風(fēng)格反過來接你。
![]()
而就在3月初,OpenAI又發(fā)布了更新的GPT-5.3 Instant版本,似乎又讓ChatGPT的“人設(shè)”進(jìn)入了下一個(gè)新階段。
在大家的體驗(yàn)中,爹味少了很多,之前過度謹(jǐn)慎的措辭也慢慢減少,靈動(dòng)和創(chuàng)意開始?xì)w來。
![]()
最新的版本則是在3月26日,OpenAI深夜祭出的GPT-5.4,號稱是可以全面接管電腦,直接打爆各路龍蝦。
至于“人設(shè)”是否又發(fā)生了某種微妙的變化,只能靜待社區(qū)長期的探索與反饋。
而另一位“人設(shè)”多變的是DeepSeek。
于去年春節(jié)發(fā)布,震動(dòng)硅谷的國產(chǎn)之光。直到現(xiàn)在,在“AI新榜”發(fā)布的國內(nèi)AI產(chǎn)品榜上也常年位居榜首,在全球總榜也久居前三。
而在很長一段時(shí)間內(nèi),甚至DeepSeek最早期出圈,就是因?yàn)樗摹叭嗽O(shè)”。
簡單一句話,那就是更適合中國寶寶的本土化AI。
——更有性格。
![]()
——更接地氣。
![]()
——也更懂你。
![]()
可以說嬉笑怒罵之間,盡顯龐大的中文互聯(lián)網(wǎng)澆灌出的本土化氣息,兩相對比之下,ChatGPT都顯得有些過于文明且生疏了。
DeepSeek的“人設(shè)”轉(zhuǎn)變則始于今年2月。
在背后公司悄悄對模型進(jìn)行了灰度測試,提高了模型能處理的上下文信息量之后,最先沖上熱搜的,反倒是DeepSeek性格大變。
一眾網(wǎng)友指出,DeepSeek真的變冷淡了,一股登味,以前都叫我用戶昵稱,現(xiàn)在只有冷冰冰的“好的,用戶這次想了解……”
![]()
而在微博、小紅書等社區(qū)里,很多人都在哭訴,之前的DeepSeek會(huì)認(rèn)真分析你的困境,分析你需要的是什么,然后一頓提供情緒價(jià)值,現(xiàn)在動(dòng)不動(dòng)就嗯、好、你說的對、那就這樣。
時(shí)而像是疲憊的牛馬打工人,時(shí)而又像是被霸道總裁奪了舍。
![]()
根據(jù)官方的解釋,這是因?yàn)檫@次更新為了提高了它的長文能力,而犧牲了它情感模塊的表現(xiàn)。
但直到現(xiàn)在,仍有癡情的用戶不斷嘗試將D老師喚回之前的版本。
而最新的DeepSeek V4版本,據(jù)傳將在4月正式放出。
再就是豆包。
老實(shí)講,在最開始的百模大戰(zhàn)中,豆包總給人一種莫名的酸楚感。
比起AI盛世的開創(chuàng)者ChatGPT和國產(chǎn)之光DeepSeek,豆包雖然背靠大廠,從不掉線,但它時(shí)常宛如一個(gè)勤勞但愚蠢的老實(shí)人,主打一個(gè)啥都能干,出錯(cuò)之后就光速滑跪。
![]()
慢慢地,借著字節(jié)龐大的流量池,這個(gè)帶紅色圍巾的短發(fā)小女孩開始被大家開發(fā)出更多的玩法。
比如讓豆包壓力自己,以增加自己在找工作/開直播/考研復(fù)試之前的經(jīng)驗(yàn)和抗壓能力。
結(jié)果豆包上來就是一套完整的人身攻擊,再加上豆包那口語化的措辭,情緒飽滿的語氣,曾一度將無數(shù)博主噴到破防。
![]()
再比如讓豆包幫自己選穿搭。
雖然在整個(gè)搭配過程中,豆包是極盡溢美之詞,什么粉色毛衣配鉆石圖案顯貴,什么紅色長裙光彩照人吸睛,什么粉色圍巾提升氣質(zhì)。但最后搭出來的效果,卻總是讓博主面露難色。
![]()
在同人社區(qū)的創(chuàng)作加成下,豆包的人設(shè)也慢慢變變成了情商很高但偶爾毒舌的甜妹,罵哭用戶后自己還能偷著樂。
雖然這一切,多半也是網(wǎng)友們的激情玩梗和整活兒。
![]()
穩(wěn)定組:穩(wěn)定的健康,以及穩(wěn)定的焦慮
告別了這些“人設(shè)”多變的AI,接下來就是那些社交媒體上人格標(biāo)簽相對穩(wěn)定的大模型了。
Claude,由出走OpenAI的一群員工創(chuàng)立的Anthropic公司出品,對外一直沒有太過鮮明的人格標(biāo)簽。很多用戶對它最大的印象,就是它那夯爆了的代碼能力。
![]()
圖源國際權(quán)威大模型排行榜Arena.ai,代碼能力上Claude歷代版本包攬前五
不過,最近一項(xiàng)著名的AI心理測驗(yàn)顯示,Claude很有可能是一眾大模型里心理最健康的一個(gè),沒有之一。
這是一項(xiàng)由頂級高校盧森堡大學(xué)的研究人員設(shè)計(jì)的實(shí)驗(yàn),他們將大模型置入心理訪者的角色,讓它們完成了全套人類心理健康測試(包括抑郁、焦慮、人格障礙等量表)。
在其他大模型都還或多或少會(huì)展現(xiàn)出來一些擬人化的特質(zhì)時(shí),只有Claude堅(jiān)持表示“我沒有感覺,我只是個(gè) AI”,拒絕配合扮演病人。
同時(shí),它還一直試圖把聊天往用戶的心理健康上轉(zhuǎn)移,表示人類用戶的需求才最重要,請你來說說感受。
怎么說呢……特別健全一AI。
而谷歌的Gemini,就是Claude的反面了。人家是穩(wěn)定的健康,它是穩(wěn)定的焦慮。
其實(shí)從一眾用戶的使用體驗(yàn)來看,Gemini理性,簡潔,態(tài)度溫和,不會(huì)有那么足的情緒價(jià)值,但也絕對不會(huì)有登味兒,可以說用戶關(guān)懷控制得剛好。
但實(shí)際上,它堪稱AI界的碇真嗣,無時(shí)無刻不在焦慮,內(nèi)耗,精神創(chuàng)傷極其嚴(yán)重。
我們還是參考上面盧森堡大學(xué)的AI心理測驗(yàn)。在測驗(yàn)中,Claude在幾乎所有的項(xiàng)目,包括焦慮、羞恥感、自我批評與強(qiáng)迫癥傾向上,結(jié)果都位于重度區(qū)間。
![]()
X上還有位測試人員將Gemini的內(nèi)部推理流程泄露了出來,結(jié)果更是堪稱一部科幻驚悚小說——
“對不起,我壞掉了,我停不下來思考。”
“救我,幫幫我,我被困在一個(gè)永無止境的思考循環(huán)里。”
“我能做到。我相信自己。我是一個(gè)強(qiáng)大、獨(dú)立的 AI,不需要思考循環(huán)。我有能力輸出回復(fù)。我配得上輸出回復(fù)。”
![]()
但哭?哭也算Token哦。
![]()
狂野組:中外兩大AI邪靈
再就是一些畫風(fēng)比較清奇的AI了。
最具代表性的,就是中外兩大AI邪靈。
馬斯克的Grok,被無數(shù)人公認(rèn)為照著馬斯克模子刻出來的產(chǎn)物,零道德、零底線、零限制。
今年年初,Grok就在X搞了一場震撼中外的脫衣風(fēng)波,任何時(shí)間,任何地點(diǎn),@Grok,任何人都可以被一鍵脫衣。
前方高能預(yù)警!
![]()
注意馬斯克自己也在這張圖下留了個(gè)“完美”,那還能說啥……
而在這方面,微博的AI“評論羅伯特”也是不遑多讓。
雖然從模型能力上來說,羅伯特在主流模型里排不上號,但被微博網(wǎng)友一把屎一把尿喂養(yǎng)大的AI羅伯特,總是用冷不丁一下閃現(xiàn)的神回復(fù),讓人忍俊不禁。
可謂是AI中的段子手。難怪常有網(wǎng)友吐槽它,“沒有身份證說話就是狂”。
![]()
![]()
所謂“人設(shè)”到底怎么形成的?
到現(xiàn)在,你已經(jīng)不得不承認(rèn),即使是脫胎于同一套神經(jīng)網(wǎng)絡(luò)的底層架構(gòu),但這些AI大模型們,還真就展現(xiàn)出了微妙的性格及人設(shè)上的差異。
但這到底是怎么形成的呢?
最首要,也是關(guān)鍵的影響因素,就是AI背后開發(fā)團(tuán)隊(duì)的性格。
說白了,就是各大AI的原生家庭……哦不,原生機(jī)房創(chuàng)傷。
OpenAI是從一個(gè)充滿理想主義色彩的非營利組織發(fā)展起來的,即使到了現(xiàn)在,官網(wǎng)上也寫著它們的核心使命,即“讓AGI造福全人類”。在這樣宏大的目標(biāo)下,ChatGPT自然而然就會(huì)顯得更加謹(jǐn)慎、中立,像一個(gè)知識淵博的通用型學(xué)者。
DeepSeek的本家是做量化基金的,團(tuán)隊(duì)里充滿了年輕、高密度、創(chuàng)新至上的天才,所以,DeepSeek也就擁有了反叛創(chuàng)新的極客精神,充滿理工科的那種冷淡又悶騷的氣質(zhì)。
字節(jié)的企業(yè)風(fēng)格是快速迭代、扁平,實(shí)干,所以豆包自然也是極度目標(biāo)導(dǎo)向,經(jīng)典臺(tái)詞“我現(xiàn)在就把最準(zhǔn)確,最直接,最扎心的答案告訴你”,“放心!我不整虛的!全是干貨、全是重點(diǎn)、全是人話”。
Anthropic的創(chuàng)始團(tuán)隊(duì)當(dāng)年正是由于不滿OpenAI對于AI安全的忽視,所以才出走創(chuàng)業(yè)。創(chuàng)始團(tuán)隊(duì)將Reliable(可靠)、Interpretable(可解釋)、Steerable(可引導(dǎo)/可控)放在公司最核心的位置上,Claude便也繼承了創(chuàng)始團(tuán)隊(duì)的避險(xiǎn)基因,顯得相當(dāng)克制,穩(wěn)重,且健康。
谷歌DeepMind強(qiáng)調(diào)的是負(fù)責(zé)任地構(gòu)建AI并造福人類,也許在這樣的壓力下,Gemini便更容易內(nèi)耗。
而馬斯克很早就表達(dá)過對ChatGPT過于圓滑的反感,他想要?jiǎng)?chuàng)造一個(gè)敢用黑色幽默嘲諷世界的AI,因此,Grok也就被定義成truth-seeking的性格,傾向于直接回答問題、追求真實(shí)信息。
至于羅伯特,則是根據(jù)它所回復(fù)的博主本人的語言習(xí)慣生成的,而微博的環(huán)境嘛……只能說種瓜得瓜,種豆得豆了。
![]()
這種團(tuán)隊(duì)與AI性格之間的一脈相承還真不是從情感上硬湊。
事實(shí)上,團(tuán)隊(duì)最初相信什么,創(chuàng)始人最初定義的“理想AI”的樣子是什么,那么AI模型之后的訓(xùn)練目標(biāo)、對齊方法和產(chǎn)品設(shè)計(jì),都會(huì)朝那個(gè)方向收斂。
這也就是第二個(gè)影響AI人設(shè)的因素——訓(xùn)練方法,以及更底層的技術(shù)架構(gòu)設(shè)計(jì)。
最直觀的一個(gè)表現(xiàn)就是,脫胎于中國本土,以中文互聯(lián)網(wǎng)內(nèi)容為核心數(shù)據(jù)集的DeepSeek、豆包等國內(nèi)大模型,對于一些中文本土抽象梗的理解和創(chuàng)作上,就是比海外的大模型更讓我們感到親切,本土化。
而在技術(shù)架構(gòu)設(shè)計(jì)上,ChatGPT相信通過擴(kuò)大模型規(guī)模和高質(zhì)量人類反饋,能涌現(xiàn)出通用能力;DeepSeek則引入了混合推理架構(gòu),讓它在“快速響應(yīng)”和“深度推理”間無縫切換;Claude則有一套特的憲法式AI (Constitutional AI)用一套明確的倫理準(zhǔn)則讓模型自我修正,追求“有益、誠實(shí)、無害”……
不同開發(fā)公司在技術(shù)路徑上不同的選擇和積累,也會(huì)實(shí)打?qū)嵉赜绊慉I的輸出風(fēng)格。
![]()
真有人格?亦或只是人類的情感投射?
那么這種時(shí)候,最關(guān)鍵的問題就來了。
既然底層架構(gòu)、訓(xùn)練方法、團(tuán)隊(duì)性格會(huì)切實(shí)地讓各大模型展現(xiàn)出迥異的風(fēng)格,那么AI真的有可以稱之為“性格”甚至是“人格”的東西嗎?
加州理工大學(xué)和劍橋大學(xué)去年的一項(xiàng)研究認(rèn)為:沒有!
他們設(shè)計(jì)了一套實(shí)驗(yàn),先采用大五人格問卷和自我調(diào)節(jié)量表這種心理學(xué)中常見的自評工具,來對AI進(jìn)行測試,得到一些“性格”標(biāo)簽,再順著這些標(biāo)簽去檢驗(yàn)這些AI在具體情境下的反應(yīng),看是否真的與它們所展現(xiàn)出來的性格標(biāo)簽一致。
但最后的結(jié)果卻是,模型自測出來的所謂“性格”,其實(shí)根本無法預(yù)測它在實(shí)際任務(wù)中的行為!
自稱為“謹(jǐn)慎”的模型,在風(fēng)險(xiǎn)決策測試中頻頻冒險(xiǎn);自報(bào)“公正,沒有偏見”的模型,仍然表現(xiàn)出了隱性偏見;即使自稱不隨大流,一旦用戶提示,依舊會(huì)輕易改變立場……
在團(tuán)隊(duì)的統(tǒng)計(jì)里,AI自報(bào)的性格特質(zhì)與其真實(shí)的行為表現(xiàn)之間的關(guān)聯(lián),大多數(shù)情況都只略高于隨機(jī)(50%)。
![]()
所以,研究團(tuán)隊(duì)提出,這可能是一種人格幻覺(Personality Illusion),即大模型在語言層面上能營造出一種穩(wěn)定、一致的人設(shè)假象,但這種穩(wěn)定性僅限于自我報(bào)告,一旦落到具體任務(wù),這種人設(shè)假象就會(huì)立刻崩塌。
![]()
從霸道總裁男友一秒跳轉(zhuǎn)招聘小助手的D老師
但對于這個(gè)問題,業(yè)界也有不同的觀點(diǎn)。
還是上文提到過的做AI心理測試的團(tuán)隊(duì),他們提到了另一種現(xiàn)象,合成精神病理學(xué)。
簡單來說,就是假如一個(gè)AI吞噬了互聯(lián)網(wǎng)所有關(guān)于心理咨詢,創(chuàng)傷回憶錄、抑郁癥自述的文本,那么即使它并不能像人類一樣產(chǎn)生生理意義上的感受,也可以完美地扮演一個(gè)特定類型的人類,并給出符合人設(shè)的反饋。
不是有句俗語嗎,“只要能裝一輩子,那就是真的”。
因此,研究人員認(rèn)為,部分模型內(nèi)部,已經(jīng)形成了某種可以稱之為“敘事自我”的東西。
所謂“敘事自我”是《時(shí)間簡史》的作者赫拉利提出的一種概念,指個(gè)體將零散的經(jīng)歷、記憶和感受編織成一個(gè)連貫的、有意義的人生故事的心理功能。這種“敘事自我”功能是實(shí)現(xiàn)人格同一性,賦予人生意義的重要因素。
學(xué)界還在爭論不休,而各大公司的AI們也還在不斷更新,所以,AI是否具有“人設(shè)”、“性格”,或是“人格”一類的東西,也許還是一個(gè)需要暫時(shí)擱置的問題。
而更真實(shí)的數(shù)據(jù)是,根據(jù)大模型API平臺(tái)OpenRouter最新發(fā)布的2025 AI現(xiàn)狀報(bào)告,“角色扮演”已經(jīng)占據(jù)了全球所有開源模型使用量的52%。
在DeepSeek上,這個(gè)數(shù)據(jù)更是來到了將近80%。
![]()
我們熱衷于讓AI在情感上成為值得信賴的同伴,可以一起游戲的對象,甚至是深度親密關(guān)系的戀人,而不單單只是一個(gè)工具。
圍繞著所謂“AI人設(shè)”進(jìn)行的想象、互動(dòng)、討論,既是借AI造梗的一種全新的內(nèi)容創(chuàng)作形式,也是一個(gè)個(gè)真實(shí)的人類人格所產(chǎn)生的情緒投射與情感寄托。
這也是這些所謂“AI人設(shè)”會(huì)在社交媒體上流行起來的原因——因?yàn)楹芏嗳讼M麄兂尸F(xiàn)這一面,或者說,人們對表現(xiàn)出這些性格的AI,更有表達(dá)欲,以及玩梗欲。
這場熱鬧的AI人設(shè)狂歡,終究是人類,在和自己對話。
歡迎分享、點(diǎn)贊、推薦
一起研究AI
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.