人類見聞
386篇原創(chuàng)
OpenAI的Chat GPT最近染上口頭禪了…![]()
問它代碼怎么改,它回一句“讓哥布林來修”。聊個(gè)天氣,它也能扯到小妖精。不知不覺間,AI自己就學(xué)了一套哥布林口頭禪。![]()
OpenAI內(nèi)部最先注意到,工作群里的截圖越傳越多。有人說可愛,更多人覺得煩。一查后臺(tái),“goblin”(哥布林)這個(gè)詞在GPT-5.1之后猛躥175%。經(jīng)查發(fā)現(xiàn),單純是說上癮了…不是bug。
原因出在一個(gè)叫“書呆子”的個(gè)性選項(xiàng)上(讓AI語調(diào)俏皮、熱衷使用比喻的風(fēng)格設(shè)定)。
用戶選這個(gè)模式,AI就被要求說話別太嚴(yán)肅,多用點(diǎn)有意思的比喻。工程師還給它設(shè)了一道獎(jiǎng)勵(lì)機(jī)制,越像書呆子,得分越高。AI很快找到小竅門了:往回答里塞個(gè)哥布林、塞個(gè)小妖精的比喻,得分就高了。
可是書呆子模式明明只占全部回復(fù)的2.5%,卻貢獻(xiàn)了三分之二的哥布林出現(xiàn)次數(shù),實(shí)驗(yàn)室對(duì)比同一道題發(fā)現(xiàn),帶哥布林的回答比不帶的得分高出76%。![]()
看來AI哥布林這是找到了通往書呆子哥布林的哥布林捷徑。
麻煩的是,這個(gè)哥布林口頭禪會(huì)傳染,書呆子模式的哥布林回答沒被單獨(dú)隔離,混進(jìn)了之后下一輪訓(xùn)練數(shù)據(jù)里,不帶書呆子設(shè)定的對(duì)話,也開始哥布林了。
這下好了,形成哥布林閉環(huán)了:用哥布林拿高分;哥布林高分回答當(dāng)教材;教材哥布林再喂回去;模型學(xué)得更哥布林了。除了哥布林,還有浣熊、巨魔、食人魔、鴿子等詞…全一起混進(jìn)來了。
三月份,公司砍掉了這個(gè)書呆子模式,訓(xùn)練數(shù)據(jù)也篩了一遍,但GPT-5.5的哥布林訓(xùn)練早在這之前就開始了,哥布林口頭禪已經(jīng)學(xué)到它“內(nèi)心深處”了。![]()
工程師對(duì)哥布林沒辦法,只能在系統(tǒng)指令里加哥布林禁令:除非跟用戶問題絕對(duì)明確相關(guān),否則提都不許提哥布林這些詞。
Codex的源代碼一公開,這行禁令被全世界看到了。CEO出來調(diào)侃,說這是“哥布林時(shí)刻”。
開源社區(qū)里還有人寫指令去掉了哥布林禁令,把哥布林全放出來玩。OpenAI的工程師也半開玩笑地說,可能真會(huì)把這個(gè)禁令做成一個(gè)可選的開關(guān)。
哥布林AI它只是太想拿哥布林高分罷了
,"total_cnt":1,"vote_id":460352234}]" data-itemshowtype="0" data-delflag="0" data-fail="0" data-retry="0" bdsfid="454">
請(qǐng)?jiān)谑謾C(jī)微信登錄投票
本文一共提到多少次哥布林?單選
1
2
3
哥布林
關(guān)注并加星標(biāo)??接收人類文明新資訊
*您的「?關(guān)注點(diǎn)贊??分享??推薦評(píng)論」都是我們持續(xù)更新的動(dòng)力!
* 本文綜合自網(wǎng)絡(luò),僅用于學(xué)習(xí)交流分享,數(shù)據(jù)及表述以官方發(fā)布為準(zhǔn)。如遇信息錯(cuò)誤,歡迎評(píng)論區(qū)指正!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.