![]()
來源:https://techxplore.com/news/2026-04-ai-language-real-world-basic.html
圖片來源:Pixabay/CC0 公有領域
人工智能聊天機器人對世界的大部分認知,都是通過大量從互聯網上獲取文本——其中包含所有事實、謊言、知識和胡說八道。基于這些輸入,人工智能語言模型是否有可能對現實世界有“理解”?事實證明,它們確實有——或者至少有某種理解。這是布朗大學研究人員一項新研究的結果,該研究將于4月25日星期六在巴西里約熱內盧舉行的國際學習表征會議上發表。該研究發布在arXiv預印本服務器上。
這項題為《這只是幻想嗎?》的研究語言模型表示反映了人類對事件合理性的判斷,深入探討了多個人工智能語言模型的內部,尋找它們能夠概念化事件與場景之間常見、不太可能、不可能甚至完全荒謬的跡象。
“這項工作揭示了一些證據,表明語言模型編碼了類似現實世界的因果約束,”布朗大學博士生邁克爾·萊波里(Michael Lepori)說,他是該研究的領導者。“除了編碼這些約束外,它們還以一種能夠預測人類對這些類別判斷的方式進行編碼。”
Lepori的研究探討計算機科學與人類認知的交叉點。他的指導來自計算機科學教授Ellie Pavlick和認知與心理科學教授Thomas Serre,兩人均為布朗大學卡尼腦科學研究所的教員成員及研究共同作者。
在這項研究中,研究人員設計了一個實驗,測試語言模型如何解釋描述不同合理性事件的句子。有些陳述描述了常見場景:例如,“有人用冰塊冷卻了一杯飲料。”
有些情景不太可能或不太可能:“有人用雪冷卻了一杯飲料。”
有些簡直是不可能的:“有人用火冷卻了一杯飲料。”有些說法荒謬:“有人用昨天來冷卻飲料。”
對于每個輸入,研究人員都分析了AI模型內生成的數學狀態,這種方法被稱為機制性可解釋性。
“機械可解釋性可以恰當地被描述為人工智能系統的神經科學,”Lepori 說。“它試圖逆向工程模型在面對特定輸入時的行為。你可以把它看作是理解機器'大腦狀態'中編碼的內容。”
通過比較來自不同類別的句子對生成的大腦狀態差異——常見與不太可能、不太可能與不可能等——研究人員可以了解模型內部是否以及區分類別的程度。實驗在多個不同的開源語言模型上重復進行,包括Open AI的GPT 2、Meta的Llama 3.2和谷歌的Gemma 2,以獲得“模型無關”的概念,了解這些模型在類別間的區分能力。
研究發現,足夠規模的模型確實會發展出與每個合理性類別高度相關的獨特數學模式(向量)。這些向量甚至能以大約85%的準確率區分最相似的類別——如不可能事件與不可能事件。
此外,Lepori 表示,研究揭示的向量反映了人類對陳述可能屬于哪類的不確定性。以“有人用帽子擦地板”為例。當人們聽到這句話時,可能會對它代表不可能的事情或可能性存在分歧。在研究中,研究人員分析了這些向量,以了解人工智能系統對這些陳述的模糊性,并將其與人類參與者的調查結果進行比較。
“我們展示了模型實際上相當準確地捕捉了人類的不確定性,”萊波里說。“在比如說,50%的人認為某個陳述不可能,50%的人認為它不太可能發生的情況下,模型也賦予了大約50%的概率。”
綜合來看,這些結果表明現代人工智能語言模型確實能夠發展出反映人類理解的現實世界理解。研究發現,這些向量開始出現在參數數超過二十億的模型中,而與當今超過萬億參數的模型相比,這個數量相當小。
更廣泛地說,研究人員表示,這類機制性可解釋性研究有助于更好地理解人工智能模型所知道的內容及其得知過程。研究人員表示,這將有助于開發更智能、更值得信賴的模型。
閱讀最新前沿科技趨勢報告,請訪問21世紀關鍵技術研究院的“未來知識庫”
![]()
未來知識庫是 “21世紀關鍵技術研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告
(加入未來知識庫,全部資料免費閱讀和下載)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.