<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      這不是構(gòu)建數(shù)字心智的方式:推理失敗如何阻礙AI模型實(shí)現(xiàn)人類智能

      0
      分享至

      一項(xiàng)新研究的作者認(rèn)為,現(xiàn)有的大語(yǔ)言模型架構(gòu)可能無(wú)法支撐實(shí)現(xiàn)人類級(jí)人工智能所需的問(wèn)題解決能力。



      最新研究表明,當(dāng)今最流行的人工智能工具在架構(gòu)上的限制,可能會(huì)制約它們能夠達(dá)到的智能上限。

      2月5日發(fā)表在預(yù)印本平臺(tái)arXiv上的一項(xiàng)研究指出,現(xiàn)代大語(yǔ)言模型在其問(wèn)題解決邏輯中天生容易出現(xiàn)斷裂,即所謂的「推理失敗」。

      當(dāng)大語(yǔ)言模型丟失了可靠完成任務(wù)所需的關(guān)鍵信息,導(dǎo)致對(duì)看似簡(jiǎn)單的問(wèn)題給出錯(cuò)誤答案時(shí),就發(fā)生了推理失敗。該論文是對(duì)現(xiàn)有研究的綜述,專門(mén)考察了Transformer模型——這是一種神經(jīng)網(wǎng)絡(luò)架構(gòu),支撐著包括ChatGPT、Claude和Google Gemini在內(nèi)的流行AI聊天機(jī)器人。

      根據(jù)大語(yǔ)言模型在「人類最后考試」等評(píng)估中的表現(xiàn),一些科學(xué)家認(rèn)為,底層的神經(jīng)網(wǎng)絡(luò)架構(gòu)有朝一日可能催生出能夠達(dá)到人類級(jí)認(rèn)知的模型。然而,研究人員指出,雖然Transformer架構(gòu)使大語(yǔ)言模型在語(yǔ)言生成等任務(wù)上極為強(qiáng)大,但它也抑制了實(shí)現(xiàn)真正人類級(jí)推理所需的那種可靠的邏輯過(guò)程。

      「大語(yǔ)言模型已展現(xiàn)出卓越的推理能力,在廣泛的任務(wù)上取得了令人矚目的成果,」研究人員在論文中表示。「盡管取得了這些進(jìn)步,嚴(yán)重的推理失敗依然存在,甚至在看似簡(jiǎn)單的場(chǎng)景中也會(huì)發(fā)生……這種失敗被歸因于模型缺乏整體規(guī)劃和深度思考的能力。」

      大語(yǔ)言模型的局限性

      大語(yǔ)言模型在海量文本數(shù)據(jù)上進(jìn)行訓(xùn)練,通過(guò)逐詞預(yù)測(cè)一個(gè)合理的答案來(lái)響應(yīng)用戶的提示。它們通過(guò)將稱為「標(biāo)記」的文本單元串接在一起來(lái)實(shí)現(xiàn)這一點(diǎn),這些串接方式基于從訓(xùn)練數(shù)據(jù)中學(xué)到的統(tǒng)計(jì)模式。

      Transformer還使用一種稱為「自注意力」的機(jī)制來(lái)跟蹤長(zhǎng)文本序列中單詞和概念之間的關(guān)系。自注意力機(jī)制加上龐大的訓(xùn)練數(shù)據(jù)庫(kù),使得現(xiàn)代聊天機(jī)器人非常擅長(zhǎng)對(duì)用戶提示生成令人信服的答案。

      然而,大語(yǔ)言模型并不進(jìn)行傳統(tǒng)意義上的任何實(shí)際「思考」。相反,它們的響應(yīng)由算法決定。對(duì)于需要多步驟真正解決問(wèn)題的長(zhǎng)任務(wù),Transformer可能會(huì)丟失關(guān)鍵信息,并退回到從訓(xùn)練數(shù)據(jù)中學(xué)到的模式。這導(dǎo)致了推理失敗。

      「這一根本弱點(diǎn)不僅限于基本任務(wù),還擴(kuò)展到數(shù)學(xué)問(wèn)題的組合、多事實(shí)聲明驗(yàn)證以及其他本質(zhì)上具有組合性的任務(wù),」研究人員在論文中表示。

      推理失敗也是為什么大語(yǔ)言模型在被用戶告知回答錯(cuò)誤后,常常仍然重復(fù)同樣的回復(fù);或者對(duì)同一問(wèn)題的不同表述方式給出不同答案——即使被要求逐步解釋其推理過(guò)程也是如此。

      英國(guó)阿蘭·圖靈研究所的高級(jí)研究數(shù)據(jù)科學(xué)家費(fèi)德里科·南尼認(rèn)為,大語(yǔ)言模型通常呈現(xiàn)為推理的東西,多半只是表面功夫。

      「人們發(fā)現(xiàn),如果你告訴大語(yǔ)言模型不要直接回答,而是『一步步思考』并先寫(xiě)出推理過(guò)程,它往往能得到正確答案,」南尼告訴媒體。「但這是一種技巧。這不是人類意義上的真正推理——它仍然只是裝扮成思維鏈的下一詞元預(yù)測(cè),」他說(shuō)。「當(dāng)我們說(shuō)這些模型『推理』時(shí),我們實(shí)際的意思是,它們寫(xiě)出一個(gè)推理過(guò)程——聽(tīng)起來(lái)像是一串合理的推理鏈條。」

      現(xiàn)有AI基準(zhǔn)測(cè)試的不足

      研究人員發(fā)現(xiàn),當(dāng)前評(píng)估大語(yǔ)言模型表現(xiàn)的方法在三個(gè)關(guān)鍵方面存在不足。第一,重新表述提示詞可能會(huì)影響結(jié)果。第二,基準(zhǔn)測(cè)試隨著使用次數(shù)的增加而退化并受到污染。第三,它們只評(píng)估最終結(jié)果,而不是模型得出結(jié)論所用的推理過(guò)程。

      這意味著當(dāng)前的基準(zhǔn)測(cè)試可能?chē)?yán)重高估了大語(yǔ)言模型的能力,并低估了它們?cè)诂F(xiàn)實(shí)使用中失敗的頻率。



      「我們的立場(chǎng)不是說(shuō)基準(zhǔn)測(cè)試有缺陷,而是它們需要進(jìn)化,」該研究的合著者、加州理工學(xué)院的計(jì)算機(jī)科學(xué)與機(jī)器人學(xué)學(xué)生宋培陽(yáng)通過(guò)電子郵件表示。同樣地,南尼表示,基準(zhǔn)測(cè)試往往會(huì)滲入到大語(yǔ)言模型的訓(xùn)練數(shù)據(jù)中,這意味著后續(xù)的大語(yǔ)言模型會(huì)學(xué)會(huì)如何欺騙這些基準(zhǔn)測(cè)試。

      「除此之外,既然模型已投入生產(chǎn)環(huán)境,使用本身也成了一種基準(zhǔn)測(cè)試,」南尼說(shuō)。「你把系統(tǒng)擺在用戶面前,看看哪里出問(wèn)題——這就是新的測(cè)試。所以是的,我們需要更好的基準(zhǔn)測(cè)試,也需要減少依賴AI來(lái)檢查AI。但這在實(shí)踐中非常困難,因?yàn)檫@些工具已經(jīng)融入我們的工作方式,直接使用它們極其方便。」

      通往通用人工智能的新架構(gòu)?

      與近期其他研究不同,這項(xiàng)新研究并不認(rèn)為神經(jīng)網(wǎng)絡(luò)方法在追求通用人工智能的道路上是死胡同。相反,研究人員將其比作計(jì)算機(jī)的早期時(shí)代,指出理解大語(yǔ)言模型為何失敗是改進(jìn)它們的關(guān)鍵。

      然而,他們確實(shí)認(rèn)為,僅僅在更多數(shù)據(jù)上訓(xùn)練模型或擴(kuò)大模型規(guī)模,不太可能獨(dú)自解決這個(gè)問(wèn)題。這意味著,開(kāi)發(fā)通用人工智能可能需要一種根本不同的模型構(gòu)建方法。

      「神經(jīng)網(wǎng)絡(luò),尤其是大語(yǔ)言模型,顯然是通用人工智能圖景的一部分。它們的進(jìn)展是非凡的,」宋說(shuō)。「然而,我們的綜述表明,僅靠擴(kuò)展規(guī)模不太可能解決所有推理失敗……[這意味著]達(dá)到人類級(jí)推理可能需要架構(gòu)上的創(chuàng)新、更強(qiáng)的世界模型、改進(jìn)的魯棒性訓(xùn)練,以及與結(jié)構(gòu)化推理和具身交互的更深度融合。」

      南尼對(duì)此表示贊同。「從心智哲學(xué)的角度來(lái)看,我認(rèn)為我們基本上已經(jīng)找到了Transformer的極限。它們不是你構(gòu)建數(shù)字心智的方式,」他說(shuō)。「它們對(duì)文本的建模極其出色,以至于幾乎無(wú)法分辨一段文字是出自人類還是機(jī)器之手。『但這就是它們的本質(zhì):語(yǔ)言模型……這種架構(gòu)的潛力是有限的。』」

      如果朋友們喜歡,敬請(qǐng)關(guān)注“知新了了”!

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      宇樹(shù)發(fā)布GD01載人變形機(jī)甲 定價(jià)390萬(wàn)元起

      宇樹(shù)發(fā)布GD01載人變形機(jī)甲 定價(jià)390萬(wàn)元起

      財(cái)聯(lián)社
      2026-05-12 12:27:07
      電池安全,需要一次徹底的“證偽”

      電池安全,需要一次徹底的“證偽”

      汽車(chē)公社
      2026-05-08 08:39:52
      黃仁勛真是被白宮徹底封殺了

      黃仁勛真是被白宮徹底封殺了

      大貓財(cái)經(jīng)Pro
      2026-05-12 14:04:28
      揚(yáng)眉吐氣史無(wú)前例!第一次把在任美國(guó)國(guó)務(wù)卿永久攔在中國(guó)國(guó)門(mén)外

      揚(yáng)眉吐氣史無(wú)前例!第一次把在任美國(guó)國(guó)務(wù)卿永久攔在中國(guó)國(guó)門(mén)外

      雪中風(fēng)車(chē)
      2026-05-12 13:10:31
      湖南省長(zhǎng)暗訪安全生產(chǎn)工作,逐項(xiàng)點(diǎn)名問(wèn)題

      湖南省長(zhǎng)暗訪安全生產(chǎn)工作,逐項(xiàng)點(diǎn)名問(wèn)題

      澎湃新聞
      2026-05-12 13:54:05
      高校APP現(xiàn)“吸煙區(qū)可以配備板凳嗎,站著抽好累”訴求,老師以超400字回復(fù)駁回:實(shí)在“站不住”,建議從今天開(kāi)始嘗試戒煙

      高校APP現(xiàn)“吸煙區(qū)可以配備板凳嗎,站著抽好累”訴求,老師以超400字回復(fù)駁回:實(shí)在“站不住”,建議從今天開(kāi)始嘗試戒煙

      極目新聞
      2026-05-12 14:38:40
      上海地鐵打人爆火!兩老人施暴女孩,官方怒批倚老賣(mài)老,追責(zé)難逃

      上海地鐵打人爆火!兩老人施暴女孩,官方怒批倚老賣(mài)老,追責(zé)難逃

      奇思妙想草葉君
      2026-05-12 02:14:56
      中國(guó)在美伊開(kāi)戰(zhàn)后石油日進(jìn)口減少25%,但庫(kù)存創(chuàng)新高,還將部分石油出售

      中國(guó)在美伊開(kāi)戰(zhàn)后石油日進(jìn)口減少25%,但庫(kù)存創(chuàng)新高,還將部分石油出售

      爆角追蹤
      2026-05-12 09:20:42
      “悶殺”,也許是最終選擇!

      “悶殺”,也許是最終選擇!

      深度報(bào)
      2026-05-10 22:44:58
      蘋(píng)果AI眼鏡官宣:40克超輕,戴上自動(dòng)調(diào)度數(shù)

      蘋(píng)果AI眼鏡官宣:40克超輕,戴上自動(dòng)調(diào)度數(shù)

      呼呼歷史論
      2026-05-11 00:22:15
      問(wèn)界M9尾燈能"畫(huà)"長(zhǎng)城黃河,49.98萬(wàn)起預(yù)售

      問(wèn)界M9尾燈能"畫(huà)"長(zhǎng)城黃河,49.98萬(wàn)起預(yù)售

      硅嶼手記
      2026-05-12 07:50:33
      樓市消費(fèi)雙爆發(fā),深圳在布一個(gè)什么局?

      樓市消費(fèi)雙爆發(fā),深圳在布一個(gè)什么局?

      智谷趨勢(shì)
      2026-05-11 23:22:47
      創(chuàng)業(yè)板迎來(lái)第二只千元股!中際旭創(chuàng)一度突破1000元,近一年上漲956%

      創(chuàng)業(yè)板迎來(lái)第二只千元股!中際旭創(chuàng)一度突破1000元,近一年上漲956%

      界面新聞
      2026-05-12 11:58:06
      特斯拉宣布停產(chǎn),震驚全網(wǎng)!

      特斯拉宣布停產(chǎn),震驚全網(wǎng)!

      財(cái)經(jīng)三分鐘pro
      2026-05-12 15:10:58
      湖南一高校招聘被質(zhì)疑設(shè)“蘿卜崗”,入圍中14人系本校人員 當(dāng)?shù)叵嚓P(guān)部門(mén)稱已在調(diào)查

      湖南一高校招聘被質(zhì)疑設(shè)“蘿卜崗”,入圍中14人系本校人員 當(dāng)?shù)叵嚓P(guān)部門(mén)稱已在調(diào)查

      紅星新聞
      2026-05-12 16:37:13
      張本智和回應(yīng)驚天逆轉(zhuǎn):決勝局領(lǐng)先被翻盤(pán),不是崩盤(pán)是成長(zhǎng)的代價(jià)

      張本智和回應(yīng)驚天逆轉(zhuǎn):決勝局領(lǐng)先被翻盤(pán),不是崩盤(pán)是成長(zhǎng)的代價(jià)

      洲洲影視娛評(píng)
      2026-05-11 23:13:35
      深圳夫妻囤存儲(chǔ)芯片:5個(gè)月后身價(jià)狂漲320億元

      深圳夫妻囤存儲(chǔ)芯片:5個(gè)月后身價(jià)狂漲320億元

      快科技
      2026-05-12 11:18:38
      封神戰(zhàn)!米切爾上半場(chǎng)8中1+下半場(chǎng)39分平歷史紀(jì)錄 導(dǎo)逆轉(zhuǎn)進(jìn)天王山

      封神戰(zhàn)!米切爾上半場(chǎng)8中1+下半場(chǎng)39分平歷史紀(jì)錄 導(dǎo)逆轉(zhuǎn)進(jìn)天王山

      醉臥浮生
      2026-05-12 10:39:59
      女子推搡哨兵后續(xù):官媒發(fā)聲,知情人爆料,恐不止坐牢這么簡(jiǎn)單

      女子推搡哨兵后續(xù):官媒發(fā)聲,知情人爆料,恐不止坐牢這么簡(jiǎn)單

      奇思妙想草葉君
      2026-05-12 16:29:44
      局地可達(dá)35~37℃!河北大范圍高溫天氣即將登場(chǎng)

      局地可達(dá)35~37℃!河北大范圍高溫天氣即將登場(chǎng)

      極目新聞
      2026-05-12 17:40:42
      2026-05-12 18:47:00
      知新了了
      知新了了
      專注于新知、科普的傳播
      5988文章數(shù) 2275關(guān)注度
      往期回顧 全部

      科技要聞

      宇樹(shù)發(fā)布載人變形機(jī)甲,定價(jià)390萬(wàn)元起

      頭條要聞

      為見(jiàn)女兒最后一面老人第一次坐高鐵 買(mǎi)不到票求助特警

      頭條要聞

      為見(jiàn)女兒最后一面老人第一次坐高鐵 買(mǎi)不到票求助特警

      體育要聞

      總是掉鏈子的“倒霉蛋”,闖進(jìn)了歐戰(zhàn)決賽

      娛樂(lè)要聞

      劉濤曬媽祖誕辰活動(dòng)照 評(píng)論區(qū)變?cè)S愿池

      財(cái)經(jīng)要聞

      黃仁勛真是被白宮徹底封殺了

      汽車(chē)要聞

      吉利銀河“TT”申報(bào)圖曝光 電動(dòng)尾翼+激光雷達(dá)

      態(tài)度原創(chuàng)

      家居
      藝術(shù)
      房產(chǎn)
      游戲
      健康

      家居要聞

      極簡(jiǎn)主義下的居住場(chǎng)域與空間

      藝術(shù)要聞

      這位畫(huà)家的油畫(huà)美人讓人驚嘆不已!

      房產(chǎn)要聞

      穗八條引爆樓市!萬(wàn)博寶藏紅盤(pán),五一勁銷(xiāo)出圈

      小島秀夫新動(dòng)態(tài):票選DS2最愛(ài)角色!反派竟是第一

      干細(xì)胞能讓人“返老還童”嗎

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 中文字幕高清在线观看| 亚洲AV秘 无码二区在线| 日韩欧美aⅴ综合网站发布| 东京热一本无码av| 国内精品久久久久影院嫩草| 中文字幕色av一区二区三区| 在线精品国产大象香蕉网| 久久人人爽人人人人爽AV| 国产精品天堂蜜av在线播放| 在线黄色av网址| 曰本女人牲交全视频免费播放| 国产精品成人av在线观看春天| 国产XXXX视频| 色天堂福利| 亚洲色精品VR一区二区| 蜜臀人妻精品一区二区免费| 97se狠狠狠狠狼亚洲综合网| 国产高清在线观看a| 人妻久久中文| 国内精品自在拍精选| 人妻教师痴汉电车波多野结衣| 男女猛烈无遮挡午夜视频| 亚洲欧洲日韩国内高清| 亚洲熟妇AV乱码在线观看| 成人午夜在线观看日韩| 色香色欲综合网| 国产伦子沙发午休系列资源曝光 | 精品国产午夜福利在线观看| 人人做人人澡人人人爽| 青青草原国产精品啪啪视频| 中文字幕有码高清日韩| 欧美性福网址| www.一区二区| 蜜桃视频中文字幕一区二区三区 | 蜜桃av在线一区二区| 欧美成人精品三级在线观看| 最新在线中文字幕| 久久久麻豆三级黄色妇人网站 | 国产在线观看网址不卡一区| 黄色综合网| 国产美女mm131爽爽爽毛片 |