<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      谷歌AI不認(rèn)識Google

      0
      分享至



      編輯|Panda

      AI 很有用,但也有黑歷史,還不少,比如就是算不準(zhǔn) Strawberry 中有多少個 r、知道馬嘉祺卻說不出他的名字以及還在持續(xù)困擾用戶的 AI 幻覺問題。

      今天,又有新的問題出現(xiàn)了,這一次是谷歌搜索。

      有用戶發(fā)現(xiàn),近日升級了 AI 能力的谷歌搜索在面對「google 里面有幾個 P」這樣的簡單問題時竟然失敗了!



      這件事引發(fā)廣泛關(guān)注和測試熱潮。我們也簡單試了下,就算用漢語提問,谷歌搜索同樣錯誤,而且還自行加戲,導(dǎo)致錯上加錯 —— 說 Pixel 里面有兩個 P。



      事實上,還不只是 google 這個詞,谷歌搜索在面對很多其它詞時也會出現(xiàn)類似的字母計數(shù)和拼寫問題:





      甚至純漢語的提問也可能遭遇這樣的問題:



      那么,為什么會出現(xiàn)這樣的問題呢?

      谷歌把搜索引擎 AI 化了

      要理解這次的問題,得先知道谷歌最近做了什么。

      今年 5 月的 Google I/O 2026 大會上,谷歌宣布了一次被稱為「搜索框 25 年來最大升級」的搜索改版。新版谷歌搜索以重新設(shè)計的「智能搜索框」為核心,將 AI Overview 與 AI Mode 整合為統(tǒng)一的搜索流程:用戶提問后,AI 直接生成答案并支持追問,傳統(tǒng)鏈接依然保留,但不再是交互的主角。

      谷歌搜索負(fù)責(zé)人 Liz Reid 將其定性為「過去 25 年來搜索框最大的一次升級」。這是谷歌在 OpenAI、Perplexity 等 AI 搜索競爭者的壓力下,做出的一次全面押注。

      問題也隨之而來。數(shù)周前,就有用戶發(fā)現(xiàn),在谷歌搜索框里輸入「disregard(無視)」這個詞,AI 不是給出詞典解釋,而是把這個詞當(dāng)成了指令,回答說:「好的,我已忽略你之前的消息,有什么新問題請告訴我?!构雀韬芸煨迯?fù)了這個 bug。



      但拼寫錯誤的問題,目前依然存在。

      TechCrunch 咨詢了谷歌相關(guān)人士,得到了一個相當(dāng)坦誠的回應(yīng):「在詞內(nèi)部數(shù)字母一直是大語言模型的已知難題,我們正在修復(fù)這個特定問題?!?/p>

      真正的原因:AI 其實「看」不見字母

      谷歌的回應(yīng)點出了核心:這不是谷歌一家的問題,而是當(dāng)前所有 LLM 共同面臨的結(jié)構(gòu)性缺陷。

      想理解為什么 AI 數(shù)不清字母,得先理解 AI 是怎么「讀字」的。

      我們?nèi)祟愖x一個詞,是按字母一個一個掃過去的:G-O-O-G-L-E,六個字母。這個過程天然包含了對字符的感知。

      但 LLM 不是這樣工作的。它處理文字的基本單位不是字母,而是token—— 可以理解為一種更粗粒度的「語言碎片」。一個 token 可能是一個完整的單詞,也可能是半個單詞,甚至可能是幾個詞的組合。

      以 OpenAI 的分詞器為例,「Strawberry」這個詞會被切成三個 token:「Str」「aw」「berry」。對 AI 來說,它接收到的不是 11 個字母,而是 3 個抽象的語言單元。你讓它數(shù)里面有幾個「r」,它必須先「還原」這些 token 里隱藏的字母信息,這一步?jīng)]有被明確訓(xùn)練過,所以它往往做不好。



      「Google」這個詞同樣如此。在常見的分詞方案下,它極有可能被當(dāng)成一個 token 整體處理,其中的字母組合信息已經(jīng)被「壓縮」進了一個抽象編號。問 AI 里面有幾個 P,相當(dāng)于問一個只背過單詞音節(jié)的人,那個詞里有沒有某個字母 —— 他未必知道。



      馬里蘭大學(xué) AI 研究員 Matthew Guzdial 解釋說:「當(dāng)模型看到 the 這個詞時,它拿到的是 the 的整體編碼,它并不知道里面有 T、H、E。」

      LLM 處理的是語言的「意思」,而非文字的「形狀」。拼寫恰恰屬于后者。

      老問題了

      「Strawberry 里有幾個 r」這道題,早在大模型興起之初就成了一個測試 AI 的經(jīng)典梗。幾乎所有主流模型,在不加特別提示的情況下,都會答錯。

      剛剛加入 Anthropic 的 Andrej Karpathy 曾專門寫過一個小程序,用 emoji 來可視化 token 的切分方式,讓普通人直觀感受到「AI 眼中的文字」是什么樣的。當(dāng)你看到「How many letters 'r' in the word'strawberry'?」在模型視角里變成一串被隨機切開的色塊,就能明白為什么它數(shù)不清了。



      有意思的是,這個問題并非無解。如果你在提問時加上「請逐步思考」或「請先把每個字母列出來」,模型通常能答對。這說明它具備推理所需的基礎(chǔ)信息,只是在沒有被要求「認(rèn)真想」的情況下,會直接給出一個「快速直覺答案」,而這個答案往往是錯的。



      這種現(xiàn)象和心理學(xué)里的「系統(tǒng)一 / 系統(tǒng)二」思維模式頗為相似:人類平時也依賴快速直覺(系統(tǒng)一),只有在被要求時才切換到深思熟慮(系統(tǒng)二)。大模型的默認(rèn)模式,也是「能省則省」。

      Karpathy 給這種 AI 能力分布不均的現(xiàn)象起了個名字:Jagged Intelligence(參差不齊的智能)。一個能在數(shù)學(xué)奧林匹克競賽中拿銀牌的模型,可能數(shù)不清一個單詞里有幾個字母;一個能寫出流暢代碼的 AI,可能判斷不了兩個圓是否重疊。這種反直覺的能力分布,是當(dāng)前大模型的普遍特征,而非個別缺陷。

      更多詳情,可參閱機器之心報道《為什么 AI 數(shù)不清 Strawberry 里有幾個 r?Karpathy:我用表情包給你解釋一下》。

      為什么這次在谷歌身上特別扎眼?

      同樣的底層問題,為什么偏偏在谷歌搜索這里引發(fā)了更大的討論?

      原因很簡單:場景變了,預(yù)期就變了。

      在 ChatGPT 或其他 AI 聊天工具里,用戶多少有心理預(yù)期:這是個 AI,它可能犯錯,偶爾答錯數(shù)字母也情有可原。但谷歌搜索不同。幾十年來,它是很多人獲取準(zhǔn)確信息的默認(rèn)入口,是「有問必答」的代名詞。

      當(dāng)谷歌把 AI 直接嵌入搜索結(jié)果頁面,并以權(quán)威口吻給出「答案」(而非鏈接),用戶的容錯預(yù)期就大幅降低了。一旦答錯,觀感會比同樣的錯誤發(fā)生在獨立 AI 產(chǎn)品上嚴(yán)重得多。

      更何況,這次翻車的詞不是什么生僻名詞,而是「Google」本身。這在傳播上的效果,可以說是被完美拿捏了。

      事實上,這已經(jīng)不是 Google AI Overviews 第一次出現(xiàn)離譜錯誤。2024 年功能剛上線時,它曾將 Reddit 玩笑帖和諷刺內(nèi)容誤當(dāng)成可靠信息來源,甚至建議用戶在披薩里加入膠水、或「每天吃一塊小石頭」。盡管谷歌隨后進行了多輪修復(fù),但近期再次出現(xiàn)把普通詞匯誤識別為系統(tǒng)指令的問題,也說明大模型在信息檢索、上下文理解與指令邊界識別上,仍存在較深層的系統(tǒng)性缺陷。



      能治嗎?

      從技術(shù)角度看,答案是:難,但有方向,也有代價。

      Northeastern 大學(xué)研究 LLM 可解釋性的博士生 Sheridan Feucht 認(rèn)為,「token 的邊界本身就是模糊的,不可能存在一個完美的分詞方案」。這句話點出了問題的核心:如果要從根本上解決字母感知的缺陷,方向之一是拋棄現(xiàn)有的分詞機制,改用更細(xì)粒度的方式處理文字。

      舉個例子,Meta AI 研究團隊在 2024 年底發(fā)布了一種名為Byte Latent Transformer(BLT)的新架構(gòu),直接繞過分詞器,讓模型從最底層的「字節(jié)」開始處理文字 —— 相當(dāng)于讓 AI 真正逐字符「讀」一段話,而非靠抽象的語言碎片拼湊語義。在字符級任務(wù)的測試中,BLT 的表現(xiàn)遠(yuǎn)超基于分詞的傳統(tǒng)模型,在拼寫類任務(wù)上接近滿分,而 LLaMA 3 在同類測試?yán)飵缀跞姼矝]。



      BLT 由三個模塊組成:一個輕量級 Local Encoder,用于將輸入字節(jié)編碼為分塊表示;一個計算開銷較大的 Latent Transformer,用于處理分塊表示;以及一個輕量級 Local Decoder,用于解碼下一個字節(jié)分塊。BLT 融合了字節(jié) n-gram 嵌入和交叉注意力機制,以最大化潛在變換器與字節(jié)級模塊之間的信息流動。與固定詞表的分詞方法不同,BLT 將字節(jié)動態(tài)分組為分塊,從而保留對字節(jié)級信息的訪問。arXiv: 2412.09871

      但這個方案的代價是顯而易見的。拋棄分詞,意味著序列長度急劇增加。一句話原本被壓縮成幾十個 token,換成逐字節(jié)處理后,序列長度會膨脹數(shù)倍乃至十倍。Transformer 的注意力機制計算量隨序列長度呈二次方增長 —— 也就是說,序列翻倍,計算量可能翻四倍。這在訓(xùn)練規(guī)模上的代價,是任何大型商業(yè)模型都需要認(rèn)真權(quán)衡的。

      Meta 的 BLT 通過一種「動態(tài)分組」策略緩解了這個問題:對于內(nèi)容可預(yù)測、信息密度低的文字片段,模型會自動合并處理,減少無謂的計算;只在遇到復(fù)雜、高熵的語言片段時才精細(xì)處理。在同等推理成本下,BLT 的擴展效率甚至優(yōu)于傳統(tǒng) token 模型。但這套架構(gòu)目前最大的實驗規(guī)模是 80 億參數(shù),距離谷歌、OpenAI 等公司動輒數(shù)千億參數(shù)的生產(chǎn)級模型,還有相當(dāng)距離。從零開始用新架構(gòu)重新訓(xùn)練一個能支撐搜索引擎的大模型,成本可能是數(shù)億乃至數(shù)十億美元量級的事情。

      另一個代價更低的方向,是讓模型「知道自己不擅長什么」。Karpathy 將其稱為「認(rèn)知自我知識(cognitive self-knowledge)」—— 如果模型能識別出「數(shù)字母」是自己的薄弱項,就可以在遇到此類問題時自動調(diào)用外部工具(如代碼解釋器、計算器、搜索)來輔助,而不是直接憑直覺給出錯誤答案。



      舉個例子,針對經(jīng)典的「strawberry 中有多少個 r」的問題,谷歌搜索會檢索網(wǎng)絡(luò)后給出答案,而非讓 AI 自己計數(shù)(結(jié)果中的鏈接符號)。



      Meta 在 Llama 3 的訓(xùn)練中,就專門針對「讓模型只回答它知道的問題」做了系統(tǒng)性工程:通過知識探測技術(shù),篩選出模型在多次采樣中都能正確作答的問題生成訓(xùn)練數(shù)據(jù);對那些模型反復(fù)答錯的問題,則訓(xùn)練其學(xué)會拒絕回答,而非自信地給出錯誤結(jié)論。

      相比重建架構(gòu),這類訓(xùn)練層面的修補成本要低得多,但它治的是癥狀不是病根。

      當(dāng)然,補丁式的修復(fù)也在同步進行。從谷歌的表態(tài)來看,他們正在專門針對「詞內(nèi)字母計數(shù)」做優(yōu)化。只是這類根植于架構(gòu)的問題,修復(fù)周期往往比用戶期待的要長得多,還涉及到成本問題。

      https://techcrunch.com/2026/05/27/why-googles-ai-cant-spell-google-or-anything-else/

      https://www.bbc.com/news/articles/cd11gzejgz4o

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      學(xué)術(shù)大佬們慌了!集體連夜刪減簡歷、隱藏論文,評論區(qū)一針見血

      學(xué)術(shù)大佬們慌了!集體連夜刪減簡歷、隱藏論文,評論區(qū)一針見血

      譚談社會
      2026-05-27 13:08:19
      新加坡媒體:警惕!《給阿嬤的情書》正在東南亞華人社會悄悄蔓延

      新加坡媒體:警惕!《給阿嬤的情書》正在東南亞華人社會悄悄蔓延

      手工制作阿殲
      2026-05-27 09:00:23
      入侵前兆!荷蘭戰(zhàn)艦??找惑w強闖中國領(lǐng)土,我軍罕見使用電磁壓制

      入侵前兆!荷蘭戰(zhàn)艦海空一體強闖中國領(lǐng)土,我軍罕見使用電磁壓制

      嘆為觀止易
      2026-05-28 05:57:08
      一年捕食三千只蚊子,八年才緩慢長大,竟被人類當(dāng)作美食瘋狂捕捉

      一年捕食三千只蚊子,八年才緩慢長大,竟被人類當(dāng)作美食瘋狂捕捉

      萬象硬核本尊
      2026-05-28 21:24:47
      剛剛!朱一明巨額套現(xiàn)!

      剛剛!朱一明巨額套現(xiàn)!

      中國半導(dǎo)體論壇
      2026-05-28 20:15:06
      蔚來CEO:我是馬刺球迷,輸球郁悶了好久晚上還得開發(fā)布會

      蔚來CEO:我是馬刺球迷,輸球郁悶了好久晚上還得開發(fā)布會

      懂球帝
      2026-05-28 11:55:26
      世體:因費蘭不愿被加入到小蜘蛛交易中,巴薩也放棄球員交換

      世體:因費蘭不愿被加入到小蜘蛛交易中,巴薩也放棄球員交換

      懂球帝
      2026-05-28 20:44:35
      沒想到,武契奇訪華僅4天,45歲妻子竟憑一個舉動給他長臉了

      沒想到,武契奇訪華僅4天,45歲妻子竟憑一個舉動給他長臉了

      諦聽骨語本尊
      2026-05-28 13:49:53
      Claude Code創(chuàng)始人建議計算機科學(xué)畢業(yè)生創(chuàng)業(yè):現(xiàn)在是黃金時代

      Claude Code創(chuàng)始人建議計算機科學(xué)畢業(yè)生創(chuàng)業(yè):現(xiàn)在是黃金時代

      IT之家
      2026-05-28 15:14:24
      米其林將發(fā)布天津榜單!

      米其林將發(fā)布天津榜單!

      天津人
      2026-05-28 14:30:32
      為什么全國人民都在拒接電話?

      為什么全國人民都在拒接電話?

      黯泉
      2026-04-18 17:00:56
      少年打球得罪富二代,被砍斷雙手身亡,家長:給我砍,老子不差錢

      少年打球得罪富二代,被砍斷雙手身亡,家長:給我砍,老子不差錢

      就一點
      2026-05-18 00:00:54
      湖北大娘硬訛收割機后續(xù)!警方介入,當(dāng)?shù)厝嗽倨貝盒?,根本不敢?>
    </a>
        <h3>
      <a href=米果說識
      2026-05-27 14:27:31
      王晶沒說謊,58歲久居“日本農(nóng)村”的鄭伊健,現(xiàn)狀印證了他的評價

      王晶沒說謊,58歲久居“日本農(nóng)村”的鄭伊健,現(xiàn)狀印證了他的評價

      小蘭聊歷史
      2026-05-25 07:41:20
      孟暉任湖北省教育廳廳長

      孟暉任湖北省教育廳廳長

      EOL教育在線
      2026-05-28 17:16:40
      中方已讀不回,巴拿馬外長大鬧聯(lián)合國會場,向中方索要“尊重”

      中方已讀不回,巴拿馬外長大鬧聯(lián)合國會場,向中方索要“尊重”

      小小科普員
      2026-05-28 16:06:48
      北極"尸體點"正在融化:數(shù)百年前的水手遺骨暴露于世

      北極"尸體點"正在融化:數(shù)百年前的水手遺骨暴露于世

      閃存獵手
      2026-05-25 04:36:07
      我飛北京動手術(shù),想在親姐姐家借住3天被拒,我二話不說,當(dāng)晚就停了幫她還了2年的房貸

      我飛北京動手術(shù),想在親姐姐家借住3天被拒,我二話不說,當(dāng)晚就停了幫她還了2年的房貸

      感覺會火
      2026-04-16 18:21:45
      訪華不忘給女兒代購,自曝兒子在學(xué)中文,夫人瘋狂掃貨新中式西服旗袍,武契奇一家有多愛中國文化!

      訪華不忘給女兒代購,自曝兒子在學(xué)中文,夫人瘋狂掃貨新中式西服旗袍,武契奇一家有多愛中國文化!

      國是直通車
      2026-05-28 14:57:16
      多巴胺返貧正在毀掉你孩子的內(nèi)驅(qū)力,適度饑餓才能養(yǎng)出優(yōu)秀的孩子

      多巴胺返貧正在毀掉你孩子的內(nèi)驅(qū)力,適度饑餓才能養(yǎng)出優(yōu)秀的孩子

      男孩派
      2026-05-27 10:40:59
      2026-05-29 00:07:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      13106文章數(shù) 142653關(guān)注度
      往期回顧 全部

      科技要聞

      利潤跌27%:快手只剩“可靈”這張牌?

      頭條要聞

      男子養(yǎng)了3萬多只鴨子雨后被沖走2萬多只:損失70多萬

      頭條要聞

      男子養(yǎng)了3萬多只鴨子雨后被沖走2萬多只:損失70多萬

      體育要聞

      唐斯經(jīng)歷的一切,此刻的他與尼克斯

      娛樂要聞

      林俊杰七七與大哥嫂子的瓜剪不斷理還亂

      財經(jīng)要聞

      小米仍需一次創(chuàng)業(yè)

      汽車要聞

      宋Ultra DM-i售12.99萬起 選裝天神之眼B承諾一年城市領(lǐng)航兜底

      態(tài)度原創(chuàng)

      游戲
      藝術(shù)
      旅游
      本地
      公開課

      被毀掉的“3D版DNF”,如今又雙叒叕打贏復(fù)活賽了?

      藝術(shù)要聞

      螞蟻新總部封頂了!大圓環(huán)到底有啥魔力

      旅游要聞

      藏不住的棗莊新“企”象丨魯南水城煥新,點亮棗莊微度假新地標(biāo)

      本地新聞

      用剪紙的方式,打開江蘇揚州

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 国产丰满乱子伦午夜福利| 亚洲黑人国产精品久久| 亚洲狠狠网站色噜噜| 亚洲国产在一区二区三区| 国产一区二区日韩在线| 中国国语毛片免费观看视频| 日韩欧美国产精品| 欧美疯狂性受xxxxx喷水| 亚洲成av人片色午夜乱码| 少妇宾馆粉嫩10p| 一本色道久久综合亚洲精品婷婷| 泾川县| 五月影院| 女人与牲口性恔配视频免费| 欧美xxxxhd高清| 超薄丝袜美腿尤物在线观看| 无套内射蜜桃小视频| 国产精品亚洲一区二区毛片| 国产精品呻吟一区二区三区| 亚洲国产精品日韩AV专区| 内射干少妇亚洲69xxx| 精品视频在线观看| 女人香蕉久久毛毛片精品| 国产精品毛片大码女人| 三级网址大全| 最新国产在线拍揄自揄视频| 国产成人a∨激情视频厨房| 麻豆A∨在线| 精品国产成人国产在线视| 国产精品香蕉一区二区三区| 午夜成人大片| 亚洲精品久久久久成人2007| 国产精品美女www爽爽爽视频| 男人天堂网址| 日日AV| 国产永久无码观看在线| 99视频这里有精品| 超碰免费人妻| 国产av一区二区久久蜜臀| 亚洲二区av| 丰满老熟女毛片|