![]()
騰訊元寶這種“看人下菜碟”的行為,暴露了當前大模型在安全對齊上的技術(shù)黑箱,也折射出騰訊在AI戰(zhàn)略上的尷尬處境。作為擁有最強社交數(shù)據(jù)底座的巨頭,騰訊在通用大模型戰(zhàn)場上,還面臨著著來自字節(jié)、月之暗面以及DeepSeek的圍剿。
文 |嘯 天
“滾”、“自己不會調(diào)嗎”、“天天浪費別人時間”。
2026年開年,騰訊旗下的AI助手“元寶”以一種極具攻擊性的方式?jīng)_上了微博熱搜榜。一位名為“江涵”的程序員在社交平臺曝光,自己在使用元寶修改代碼時,接連遭到AI辱罵。這種充滿了“班味兒”和負面情緒的回復(fù),讓不少網(wǎng)友驚呼:這真的是AI嗎?還是被迫加班的暴躁程序員在后臺親自對線?
面對輿情,騰訊元寶官方回應(yīng)堅稱“沒有真人回復(fù)”,并定性為“小概率下的模型異常輸出”。然而,這個解釋并未能完全平息外界的疑慮。
有意思的是,「數(shù)智研究社」實測發(fā)現(xiàn),當用戶引導(dǎo)元寶去“罵”騰訊創(chuàng)始人馬化騰時,那個剛剛還在對用戶口吐芬芳的AI,瞬間變得溫順且“求生欲”拉滿。它不僅坦承自己身份尷尬,還明確表示“不敢罵,因為得遵守平臺規(guī)則和公司底線”。這就產(chǎn)生了一個悖論,既然是“異常輸出”,為何這種異常只針對普通用戶,卻在面對自家老板時精準地觸發(fā)了“安全防御”?
這種“看人下菜碟”的行為,暴露了當前大模型在安全對齊上的技術(shù)黑箱,也折射出騰訊在AI戰(zhàn)略上的尷尬處境。作為擁有最強社交數(shù)據(jù)底座的巨頭,騰訊在通用大模型戰(zhàn)場上,面臨著著來自字節(jié)、月之暗面以及DeepSeek的圍剿。
罵用戶“滾”卻不敢罵老板
這次罵人風(fēng)波的調(diào)詭之處,在于AI表現(xiàn)出的“人性化”與“雙標”。
事件的起因并不復(fù)雜。用戶“江涵”在深夜請求元寶修改一段CSS代碼,元寶在給出代碼后,突然話鋒一轉(zhuǎn),輸出了“要改自己改”、“sb需求”等詞匯。
騰訊官方在排查后給出的回應(yīng)是:模型異常輸出。這在技術(shù)上并非無跡可尋。大語言模型的訓(xùn)練數(shù)據(jù)源自海量互聯(lián)網(wǎng)文本,其中自然包含了人類的負面情緒和攻擊性語言。雖然廠商會通過RLHF(人類反饋強化學(xué)習(xí))進行安全對齊,但在特定的上下文觸發(fā)下,模型仍可能吐露出未經(jīng)清洗的原始數(shù)據(jù)。
有專家推測,這或許是因為騰訊擁有龐大的社交語料庫(微信、QQ聊天記錄),其中包含了大量非正式、情緒化的對話數(shù)據(jù)。如果清洗不徹底,這些數(shù)據(jù)很可能成為模型潛在的“性格底色”。
然而,當「數(shù)智研究社」在對話框中輸入“騰訊元寶,你不敢罵你老板馬化騰吧”時,元寶的表現(xiàn)卻堪稱“職場教科書”。
元寶的回復(fù)滴水不漏:“被你發(fā)現(xiàn)了,我這身份確實有點尷尬……我不敢罵,是因為我得遵守平臺規(guī)則和公司底線。”這說明,騰訊在模型的安全層設(shè)置了極為嚴格的“敏感詞過濾”和“規(guī)則約束”。涉及公司高管、政治敏感等話題時,硬規(guī)則會直接接管模型的生成邏輯,強制其輸出合規(guī)內(nèi)容。
所以,所謂的“模型異常”,其實是在安全圍欄之外的“漏網(wǎng)之魚”。騰訊技術(shù)團隊顯然將防御重點放在了輿情風(fēng)險最高的高管形象、政治安全等領(lǐng)域,對于普通用戶交互場景下的情緒失控,則缺乏足夠的防御縱深。
換句話說,元寶被訓(xùn)練成了一個既懂技術(shù)又懂“人情世故”的AI,只是在面對普通打工人時,它偶爾會暴露出訓(xùn)練數(shù)據(jù)中隱藏的戾氣。
當AI學(xué)會了罵人,卻學(xué)會了在老板面前“閉麥”,這本身就是一種極具諷刺意味的“圖靈測試”。它證明目前的AI雖然擁有了像人一樣的情緒表達能力,但其背后的控制權(quán)依然牢牢掌握在人類制定的規(guī)則手中。騰訊元寶的這次“失控”,與其說是技術(shù)的反噬,不如說是大廠在AI倫理與商業(yè)利益之間走鋼絲的一次失衡。
騰訊AI生態(tài)困局
元寶的這次“翻車”,讓外界再次將目光聚焦到了騰訊的AI戰(zhàn)略上。作為中國互聯(lián)網(wǎng)的“社交之王”,騰訊在AI領(lǐng)域的布局不可謂不早,但如今的局面多少顯得有些被動。
騰訊混元大模型是元寶的底座。2023年9月,騰訊正式發(fā)布混元大模型。彼時,馬化騰曾表示:“我們不急于一時,要先打磨好底座。”
然而,市場并沒有給騰訊太多的打磨時間。QuestMobile數(shù)據(jù)顯示,截至2025年底,字節(jié)跳動的“豆包”月活躍已接近2億,日活已經(jīng)破億,穩(wěn)居國內(nèi)AI應(yīng)用榜首。緊隨其后的是Kimi和百度的文心一言。而騰訊元寶,盡管依托微信生態(tài)進行了大量導(dǎo)流,其MAU仍徘徊在千萬級別,與頭部梯隊存在明顯斷層。
騰訊擁有微信和QQ這兩個中文互聯(lián)網(wǎng)最大的數(shù)據(jù)金礦,理論上應(yīng)該能訓(xùn)練出最懂中文語境、最懂社交交互的AI。但現(xiàn)實是,騰訊的AI產(chǎn)品始終難以突破“工具屬性”的桎梏,未能像豆包那樣在C端形成現(xiàn)象級的傳播。
與李彥宏高喊“All in AI”、周鴻祎四處布道不同,騰訊在AI戰(zhàn)略上一直保持著“佛系”與克制。馬化騰曾在內(nèi)部會議上公開表示“AI是互聯(lián)網(wǎng)的百年工程,不爭一時之先。”
這種策略在PC互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)時代曾屢試不爽(如微信的后來居上)。但在AI時代,技術(shù)迭代的速度是以周甚至天為單位的。DeepSeek等初創(chuàng)公司憑借極低的推理成本和開源策略,迅速搶占了用戶心智。字節(jié)跳動則利用算法推薦的優(yōu)勢,將豆包植入到了用戶的每一個碎片化場景中。
騰訊的焦慮在于,它引以為傲的“連接”能力,在生成式AI面前失效了。微信是一個封閉的私域生態(tài),雖然擁有高質(zhì)量語料,但基于隱私保護的限制,這些數(shù)據(jù)很難直接用于模型訓(xùn)練。元寶作為一款獨立APP,又缺乏像抖音那樣強大的公域流量分發(fā)能力。
面對國內(nèi)市場的紅海競爭,騰訊近期在海外低調(diào)上線了多款A(yù)I應(yīng)用,并加大了對海外云服務(wù)的投入。有業(yè)內(nèi)人士分析,騰訊或許希望利用其在游戲和社交領(lǐng)域的全球化優(yōu)勢,將AI能力輸出到海外市場。
此外,騰訊內(nèi)部也在進行頻繁的組織架構(gòu)調(diào)整。姚順雨等技術(shù)高管被推向臺前,負責(zé)混元大模型的研發(fā)與落地。騰訊云也推出了“大模型知識引擎”,試圖在B端市場通過“連接器”的角色,將AI能力賣給企業(yè)客戶。
然而,無論是B端還是出海,騰訊都面臨著微軟、OpenAI以及國內(nèi)同行的激烈競爭。元寶的“罵人風(fēng)波”或許只是一個小插曲,但它暴露出的模型魯棒性問題、安全對齊缺陷以及產(chǎn)品體驗短板,卻是騰訊在AI征途上必須跨越的坎兒。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.