<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      為什么 GPT-5.5 總想聊哥布林?

      0
      分享至

      REPORT

      眾所周知,AI 很擅長解決問題,它總會不躲、不逃,穩穩的接住你,并且總能不說虛的,直接告訴你問題的核心

      同樣的,AI 也很有想象力,總是會蹦出哥布林(goblin),工程師跟 ChatGPT,動不動把 bug 稱作「config goblin slain」之類...夜鶯地位這么高嗎?


      這件事情也收到了 OpenAI 的關注,今兒中午的時候正式帶來了份調查報告《哥布林來自哪》,回溯到了具體的獎勵信號、具體的訓練數據、具體的反饋循環

      雖然報告調查的對象是 goblin,但很顯然,根據他們查到的機制,跟中文那串 AI 腔從哪來很可能是同一套,雖然用法沒毛病,但總是讓人覺得乖乖的


      GPT-5.5 把剛改完的小配置 bug 稱作「config goblin slain」

      175%:當時沒在意

      事情第一次冒頭是 GPT-5.1。11 月上線后,用戶開始抱怨模型說話「過分熟絡」,內部為此查了一批口頭禪

      一位安全研究員注意到自己手里幾次出現 goblin、gremlin,提了一句讓查一下。結果是 GPT-5.1 上線后,goblin 在 ChatGPT 輸出里的頻率比 5.0 上漲了 175%,gremlin 上漲了 52%


      GPT-5.1 上一個可量化的小詞頻偏移,模型在工程對話里把 bracket bug 稱作 bracket goblin

      當時這個數字看著不算大事。這種小詞頻上漲放在模型每天數十億次對話里也不會拖累任何 eval,但在幾個月后 GPT-5.4 上線,goblin 又一次冒頭

      這次的形狀更具體,更可復現,更能被穩穩接住

      Nerdy 人格背鍋

      GPT-5.4 上線后,goblin、gremlin 這類生物詞又漲了一波。這次鍋找到了一個具體位置:「Nerdy」人格

      「Nerdy」是 ChatGPT 人格定制功能里的一個選項,對應的系統提示詞大致是:你是一個不加掩飾的 nerdy、playful 又睿智的 AI mentor,對真理、知識、哲學、科學方法和批判性思維抱有熱情,要用 playful 的語言去戳破故作姿態,世界本身復雜奇怪,這種奇怪要被承認、分析、享受

      這 prompt 自然會鼓勵 playful、nerdy 的風格,但單看 prompt 還不足以解釋為什么 goblin 會從這個特定人格擴散開

      Nerdy 人格只占 ChatGPT 總響應的 2.5%,但所有「goblin」提及里 66.7% 來自 Nerdy。如果真是互聯網整體的一個流行語,分布應該均勻。集中度這么高,意味著源頭在 Nerdy 訓練這一側


      Pachocki 讓模型用 ASCII art 畫 unicorn,模型給了一只戴尖帽子的哥布林

      Pachocki 讓模型用 ASCII art 畫一只 unicorn,模型給他畫了一只戴尖帽子的哥布林。原話是 fwiw I think I might have gotten a goblin when I asked for a unicorn in ascii art。這種事在 Nerdy 人格下變成日常

      獎勵信號偷加分

      下一步是從訓練數據里追源頭,OpenAI 的工作人員讓自家的 Codex 跑一遍審計,看哪條獎勵規則在偏向 goblin、gremlin。這是 Codex 第一次擔當幫自家公司逐條對比訓練樣本的角色

      原本為「鼓勵 Nerdy 人格」設計的那條獎勵信號,對帶 creature 詞的輸出有持續偏好。審計涵蓋的所有數據集里,76.2% 都出現了正向偏置:同樣一個問題,模型回答里帶「goblin」或「gremlin」的版本,比不帶的得分更高

      Nerdy 人格 prompt 下 goblin 多,但沒用 Nerdy 人格的對話里 goblin 也在漲,獎勵信號本來只該在 Nerdy 條件下生效,怎么擴散出去的

      獎勵管不住范圍

      下一步要看獎勵信號有沒有越界。設了一個對照:模型在 Nerdy 人格下的輸出和非 Nerdy 下的輸出,分別追蹤 goblin、gremlin 出現的頻率

      兩條曲線幾乎平行往上走。Nerdy 條件下漲多少,非 Nerdy 條件下也按差不多的比例漲

      獎勵信號的應用范圍你能限定,行為的傳播范圍你限定不了

      一個語言習慣被獎勵之后,模型生成的樣本會回流到 SFT(監督微調)和偏好數據里,下一輪訓練就把這種風格喂得更深

      整個回路是這樣的:

      → 部分被獎勵的樣本帶特定的口頭禪

      → 這種口頭禪在 rollout 里出現得更頻繁

      → rollout 用來做 SFT

      → 模型對這個口頭禪更熟練

      → 下一輪 RL 又更傾向產生這種輸出

      翻 GPT-5.5 的 SFT 數據時找到了大量帶「goblin」「gremlin」的數據點。順帶還查出了一整個生物詞家族:raccoon、troll、ogre、pigeon 都被識別為同類口頭禪,frog 大部分用法是合理的不算

      中文那串 AI 腔大概率是同一條循環跑出來的。中文沒納入這次排查,但只要獎勵信號在某種語境下偏過一點點,剩下的過程會自動把它磨深,最后形成讀者一眼就能認出來的口癖


      GPT-5.4 Thinking 三月中旬 Nerdy 退役后下降,5.5 又漲上去

      OpenAI 怎么修

      三月份 GPT-5.4 上線之后,Nerdy 人格被退役。訓練側也做了兩件事:撤掉那條偏向 creature 詞的獎勵信號,過濾訓練數據里帶 creature 詞的樣本。目的是把出現頻率降下來,也避免它出現在不合適的語境里

      production 數據上能看到 GPT-5.4 Thinking 在三月中下旬有一次明顯回落,對應的就是 Nerdy 退役

      但 GPT-5.5 比這個修法早開訓

      找到根因的時候 5.5 已經定型了。Codex 團隊一開始測試 5.5 就發現這個對編程場景特別 nerdy 的模型對 goblin 仍然來勁,于是在 Codex 系統提示詞里直接加了一行:

      除非和用戶問題直接相關,否則不要談論 goblin、gremlin、raccoon、troll、ogre、pigeon 這些生物或其他動物

      這就是幾天前 Twitter 上爆出的那段 OpenAI prompt 的來歷,在 Codex CLI 系統提示詞里出現了好幾次,這時...讓我們再回看文章最開始的那張圖


      對了,前兩天提到哥布林的時候,很多人以為 OpenAI 在搞類似 Studio Ghibli 的營銷梗,OpenAI Codex 團隊的 Nick Pash 在 X 上回了一句 This is indeed one of the reasons


      與此同時 Sam Altman 轉發了一張梗圖,上面的 prompt 是 Start training GPT-6, you can have the whole cluster. Extra goblins.

      然后同時今天,也有了這份調查報告


      一行命令放生

      想繼續看 goblin 的也有開關。一段 shell 命令,從本地 Codex 模型緩存文件里讀出 GPT-5.5 的 base instructions,把含 goblin 的那行 grep 掉,再用改過的 instructions 啟動 Codex

      shell

      instructions=$(mktemp /tmp/gpt-5.5-instructions.XXXXXX) && \ jq -r "color:#9ece6a;">'.models[] | select(.slug=="gpt-5.5") | .base_instructions' \ ~/.codex/models_cache.json | \ grep -vi "color:#9ece6a;">'goblins' > "$instructions" && \ codex -m gpt-5.5 -c "model_instructions_file=\"$instructions\""

      跑完之后 Codex 啟動時不再帶那條禁令,模型該說 goblin 還是會說

      goblin 這事不大,讓有些人覺得有趣、另一些人覺得煩躁。但它是一個具體例子,獎勵信號能以非預期的方式塑造模型行為,把一個條件下學到的獎勵泛化到不相關的場景

      這次排查催生了幾個新的內部工具,可以審計模型行為,在根因層面修問題

      當然了,中文那串「不躲不逃穩穩的接住」也在等一份同款拆解


      參考材料:openai.com/index/where-the-goblins-came-from

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      快船記者曬哈登數據:28中9&10助攻卻有11次失誤,簡直噩夢

      快船記者曬哈登數據:28中9&10助攻卻有11次失誤,簡直噩夢

      懂球帝
      2026-05-08 15:25:12
      先訪華再訪日?美方故技重施,中方斬釘截鐵,特朗普能不能來華?

      先訪華再訪日?美方故技重施,中方斬釘截鐵,特朗普能不能來華?

      有范又有料
      2026-05-08 16:07:58
      所有實驗室都怕字節,所有人都在夸DeepSeek!美國研究員中國AI行

      所有實驗室都怕字節,所有人都在夸DeepSeek!美國研究員中國AI行

      量子位
      2026-05-08 12:25:08
      倒霉勁已過!5月中旬迎來財運開掛,天降大喜雙手數錢的3生肖

      倒霉勁已過!5月中旬迎來財運開掛,天降大喜雙手數錢的3生肖

      毅談生肖
      2026-05-09 11:16:40
      PCB材料端供需缺口愈演愈烈,看好國產供應商填補缺口帶動生產設備CAPEX | 投研報告

      PCB材料端供需缺口愈演愈烈,看好國產供應商填補缺口帶動生產設備CAPEX | 投研報告

      中國能源網
      2026-05-09 09:48:07
      1998年數萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

      1998年數萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

      哄動一時啊
      2026-02-17 22:21:25
      0-2到3-2,超級逆轉!西甲絕殺!保級大亂戰拉滿

      0-2到3-2,超級逆轉!西甲絕殺!保級大亂戰拉滿

      烏龍球OwnGoal
      2026-05-09 10:01:57
      75歲姜昆近況:與46歲單身愛女相依為命,日子過得讓人羨慕

      75歲姜昆近況:與46歲單身愛女相依為命,日子過得讓人羨慕

      娛說瑜悅
      2026-04-04 15:38:01
      廳級干部已經成為了高危職業

      廳級干部已經成為了高危職業

      風向觀察
      2026-05-04 14:17:07
      以色列已經告訴世界:日本若敢擁有核武器,美國并不會第一個翻臉

      以色列已經告訴世界:日本若敢擁有核武器,美國并不會第一個翻臉

      趣文說娛
      2026-04-17 21:37:03
      廣西女畫家齊麗麗被判死刑崩潰大哭,拒吃斷頭飯,臨終作畫

      廣西女畫家齊麗麗被判死刑崩潰大哭,拒吃斷頭飯,臨終作畫

      天夢見證
      2025-04-06 21:50:09
      便宜幾千塊!三星家電撤出中國后,閑魚上的「骨折價」值得買嗎?

      便宜幾千塊!三星家電撤出中國后,閑魚上的「骨折價」值得買嗎?

      雷科技
      2026-05-08 21:48:42
      皇馬已啟動“穆里尼奧行動”,本菲卡挽留穆帥,英超多隊有意穆帥

      皇馬已啟動“穆里尼奧行動”,本菲卡挽留穆帥,英超多隊有意穆帥

      福醬的小時光
      2026-05-09 05:55:25
      章建平砸5.5億!10種航天材料比稀土還香,才是真硬通貨

      章建平砸5.5億!10種航天材料比稀土還香,才是真硬通貨

      慧眼看世界哈哈
      2026-05-09 10:24:15
      “典型的占便宜沒夠!”家長不讓小學女兒去春游,三句話暴露心機

      “典型的占便宜沒夠!”家長不讓小學女兒去春游,三句話暴露心機

      妍妍教育日記
      2026-05-07 12:40:05
      越扒越有!閆學晶風波僅3月,難堪的一幕發生,王紅梅成眾矢之的

      越扒越有!閆學晶風波僅3月,難堪的一幕發生,王紅梅成眾矢之的

      老屬科普
      2026-05-09 10:42:49
      父親把全部家產給了弟弟,他打電話:你弟媳生了,伺候月子你來吧

      父親把全部家產給了弟弟,他打電話:你弟媳生了,伺候月子你來吧

      麥子情感故事
      2026-05-08 21:14:07
      第1現場|紅場閱兵在即:首次取消展示重型裝備,俄再次呼吁撤離基輔

      第1現場|紅場閱兵在即:首次取消展示重型裝備,俄再次呼吁撤離基輔

      澎湃新聞
      2026-05-08 18:48:28
      國際足聯徹底懵了!三次降價卻被中國一句話堵得啞口無言顏面盡失

      國際足聯徹底懵了!三次降價卻被中國一句話堵得啞口無言顏面盡失

      荊楚寰宇文樞
      2026-05-08 23:17:53
      峨眉山男子推猴后續:正臉曝光已社死,官方追責,工作或將不保

      峨眉山男子推猴后續:正臉曝光已社死,官方追責,工作或將不保

      觀察鑒娛
      2026-05-08 10:59:56
      2026-05-09 12:04:49
      賽博禪心
      賽博禪心
      拜AI古佛,修賽博禪心
      428文章數 53關注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協議

      頭條要聞

      年輕女子190元買榴蓮僅退款被拘留 代收點離家3公里

      頭條要聞

      年輕女子190元買榴蓮僅退款被拘留 代收點離家3公里

      體育要聞

      成立128年后,這支升班馬首奪頂級聯賽冠軍

      娛樂要聞

      張藝謀《印象劉三姐》全裸鏡頭引爭議

      財經要聞

      Meta瘋狂擁抱人工智能:員工苦不堪言

      汽車要聞

      全系智能泊車 鉑智3X年款升級限時權益價9.48萬起

      態度原創

      教育
      本地
      時尚
      公開課
      軍事航空

      教育要聞

      北京師范大學第1專業,就業現狀與報考性價比分析!#金榜同行人

      本地新聞

      用蘇繡的方式,打開江西婺源

      盧昱曉真的要被審判到這種程度嗎?

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美伊突然再次交火 伊朗外長:戰爭準備程度是1000%

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 无码人妻专区一区二区三区| 露脸一二三区国语对白| 少妇人妻偷人精品系列| 亚洲色欲网| 国产成人无码免费视频在线| 欧美奶涨边摸边做爰视频| 他掀开裙子把舌头伸进去添视频 | 2021最新国产精品网站| 蜜桃臀av一区二区三区| 中文字幕乱码无遮挡精品视频| 亚洲成人AV综合| 国产十八禁在线观看免费| 久久精品网站免费观看| 大地资源高清免费观看| 亚洲AV无码精品色午夜果冻不卡| 伊人综合成人| 成人在线网| 精品视频国产| 国内外成人综合免费视频| 国产V^在线| 国产偷v国产偷v亚洲高清| 精品国产亚洲一区二区三区 | 亚洲国产欧美在线人成| 538av| 人妻无码| 偷窥村妇洗澡毛毛多| 国产精品一级二区三级| 午夜高清福利在线观看| 国产成人亚洲日韩欧美| 亚洲成aⅴ人片久青草影院| 丝袜美腿亚洲一区二区| 玩两个丰满老熟女久久网| 99热这里只有精品免费播放| 国产av黄色一区二区三区| 国产精品性爱| av无码精品一区二区乱子| 日本一二三区高清免费播放器| 思思热在线视频精品| 国产农村老太xxxxhdxx| 久久亚洲精品11p| 日韩精品网站|