網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

ChatGPT最近沉迷哥布林無法自拔（）

2026-05-01 01:12:07　來源: 人類見聞

山東舉報(bào)

分享至

人類見聞

386篇原創(chuàng)

OpenAI的Chat GPT最近染上口頭禪了…
問它代碼怎么改，它回一句“讓哥布林來修”。聊個(gè)天氣，它也能扯到小妖精。不知不覺間，AI自己就學(xué)了一套哥布林口頭禪。

OpenAI內(nèi)部最先注意到，工作群里的截圖越傳越多。有人說可愛，更多人覺得煩。一查后臺(tái)，“goblin”（哥布林）這個(gè)詞在GPT-5.1之后猛躥175%。經(jīng)查發(fā)現(xiàn)，單純是說上癮了…不是bug。
原因出在一個(gè)叫“書呆子”的個(gè)性選項(xiàng)上（讓AI語調(diào)俏皮、熱衷使用比喻的風(fēng)格設(shè)定）。
用戶選這個(gè)模式，AI就被要求說話別太嚴(yán)肅，多用點(diǎn)有意思的比喻。工程師還給它設(shè)了一道獎(jiǎng)勵(lì)機(jī)制，越像書呆子，得分越高。AI很快找到小竅門了：往回答里塞個(gè)哥布林、塞個(gè)小妖精的比喻，得分就高了。
可是書呆子模式明明只占全部回復(fù)的2.5%，卻貢獻(xiàn)了三分之二的哥布林出現(xiàn)次數(shù)，實(shí)驗(yàn)室對(duì)比同一道題發(fā)現(xiàn)，帶哥布林的回答比不帶的得分高出76%。

看來AI哥布林這是找到了通往書呆子哥布林的哥布林捷徑。
麻煩的是，這個(gè)哥布林口頭禪會(huì)傳染，書呆子模式的哥布林回答沒被單獨(dú)隔離，混進(jìn)了之后下一輪訓(xùn)練數(shù)據(jù)里，不帶書呆子設(shè)定的對(duì)話，也開始哥布林了。
這下好了，形成哥布林閉環(huán)了：用哥布林拿高分；哥布林高分回答當(dāng)教材；教材哥布林再喂回去；模型學(xué)得更哥布林了。除了哥布林，還有浣熊、巨魔、食人魔、鴿子等詞…全一起混進(jìn)來了。
三月份，公司砍掉了這個(gè)書呆子模式，訓(xùn)練數(shù)據(jù)也篩了一遍，但GPT-5.5的哥布林訓(xùn)練早在這之前就開始了，哥布林口頭禪已經(jīng)學(xué)到它“內(nèi)心深處”了。

工程師對(duì)哥布林沒辦法，只能在系統(tǒng)指令里加哥布林禁令：除非跟用戶問題絕對(duì)明確相關(guān)，否則提都不許提哥布林這些詞。
Codex的源代碼一公開，這行禁令被全世界看到了。CEO出來調(diào)侃，說這是“哥布林時(shí)刻”。
開源社區(qū)里還有人寫指令去掉了哥布林禁令，把哥布林全放出來玩。OpenAI的工程師也半開玩笑地說，可能真會(huì)把這個(gè)禁令做成一個(gè)可選的開關(guān)。
哥布林AI它只是太想拿哥布林高分罷了
,"total_cnt":1,"vote_id":460352234}]" data-itemshowtype="0" data-delflag="0" data-fail="0" data-retry="0" bdsfid="454">

請(qǐng)?jiān)谑謾C(jī)微信登錄投票

本文一共提到多少次哥布林？單選

哥布林

關(guān)注并加星標(biāo)??接收人類文明新資訊
*您的「?關(guān)注點(diǎn)贊??分享??推薦評(píng)論」都是我們持續(xù)更新的動(dòng)力！
* 本文綜合自網(wǎng)絡(luò)，僅用于學(xué)習(xí)交流分享，數(shù)據(jù)及表述以官方發(fā)布為準(zhǔn)。如遇信息錯(cuò)誤，歡迎評(píng)論區(qū)指正！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.