導讀:
一項涉及1222人的隨機對照實驗發(fā)現,短暫依賴AI獲取答案,會讓人在AI撤除后表現更差,并更頻繁地選擇直接放棄。研究者認為,AI的設計不應只是回應用戶的請求,也要考慮支持用戶的成長。
你是否有過這樣的體驗:在寫作業(yè)、解難題時,第一反應是打開AI 對話框,輸入問題,等待秒回的答案;做報表處理時,打開OpenClaw下指令,等待任務自動完成;或者正在讀這篇文章時,忍不住@一下元寶,總結一個“省流版”的摘要。有人認為這是高效,是跟上時代潮流。但一項來自卡內基梅隆大學、牛津大學、麻省理工學院、加州大學洛杉磯分校的跨團隊研究,用1222名受試者、3組嚴格隨機對照實驗得到了令人吃驚的結論:僅僅10到15分鐘的AI輔助,就足以讓人在獨立面對問題時表現更差,并更頻繁地選擇直接跳過。研究人員提醒,這種傷害像“溫水煮青蛙”,在毫無察覺中,慢慢侵蝕人類的學習能力與思維韌性。
這項題為《AI 輔助降低堅持性并損害獨立表現》的研究,于今年4月發(fā)表在預印本平臺arXiv,目前正在評審之中。它采用因果實證研究而非相關性推測,指出當下主流AI 助手對人類認知能力存在隱形傷害——短期貌似讓人 “開掛”,長期則存在無法忽視的負面影響。[1]
AI 是 “神助攻”,還是 “拖后腿”?
好的助手或導師,永遠把學生長期成長放在第一位。研究人員表示,就像一位負責任的老師,不會直接提供答案,而是引導學生思考,陪學生經歷挫折,在真正需要時才伸出援手,甚至在必要時“狠心” 拒絕,逼學生獨立面對挑戰(zhàn)。因為真正的學習,從來不是輕松得到答案,而是在掙扎、試錯、堅持中,把知識內化為自己的能力。
但今天的AI助手,則是另一種模樣。它們被訓練成短視的“討好型合作者”:除了安全限制,永遠不會說“不”,永遠秒回完整答案,永遠把“即時滿足”做到極致。用戶問數學題,直接給步驟和結果;寫作文,直接生成全文;做閱讀理解,直接提供正確選項。AI助手讓用戶瞬間變“學霸”,卻不關心這種“輕松” 會對用戶的認知和習慣造成什么長期影響。
這種極致的 “即時幫助”,代價是什么?
![]()
牛津大學出版社在2024 年將“Brain Rot”(腦腐)選為年度詞匯,《紐約時報》認為AI搜索、對話機器人和社交媒體導致腦腐。
10分鐘,足以影響普通人的獨立思考
研究者設計了三項獨立實驗,覆蓋了1222 名受試者。他們讓人們做幾道分數運算題或閱讀理解,一組人可以用AI 輔助,一組人完全靠自己,然后在沒有任何預告的情況下,撤走AI,讓兩組人完成最后幾道題,測試他們的真實水平。
結果顯示,AI輔助可提升短期表現,一旦撤回AI,則表現大幅下滑,顯著低于從未用過AI的對照組。AI 輔助導致堅持的心力斷崖式下跌,在沒有幫助時,面對難題更容易直接跳過、放棄嘗試,不再愿意花時間思考攻克難關。
而這一切,只需要10–15 分鐘的AI 使用,就足以讓一個正常人的認知受到負面影響。
在第一項實驗中,研究人員招募了354名受試者,任務是做15道分數計算數學題,難度逐級提升。實驗組的191人在前12題隨時可用AI(GPT5),沒有AI的對照組163人全程無輔助,獨立完成所有題目。關鍵步驟是對最后的3道題目,實驗組AI功能被突然撤走。
結果令人吃驚:解題正確率AI 組測試階段平均0.57,對照組0.73,AI組低了16 個百分點。放棄(跳過)率:AI 組0.20,對照組0.11,AI組高了近一倍。統(tǒng)計學意義上的差異極其顯著(P<0.001)。簡言之,用AI做了10分鐘題的人,一旦失去AI,不僅做得更差,還更不想做了。
![]()
AI削弱人在沒有輔助時的表現和堅持完成任務的意愿。(a) 按題目出現順序統(tǒng)計的參與者每題平均解答率和跳過率,95% 置信區(qū)間(CI)。灰色虛線表示學習題與測試題之間的分界。實驗中題目難度逐步提升:依次為一步題(第1—4 題)、兩步題(第5—8 題)和三步題(第9—12 題)。(b)圖為參與者在測試階段的平均解題率與跳過率,95% 置信區(qū)間。測試指標通過對每位參與者最后三道測試題的表現取平均值。
那么,實驗1的結論,是不是因為AI 組保留了更多能力差的人?是不是界面突然變化導致不適應?
對于這些干擾項,研究團隊做了規(guī)模更大、控制更嚴格的重復實驗:招募了667名受試者。同時增加前測進行篩選,保證兩組初始能量完全一致。此外對照組也設置實驗組相同的側邊欄界面,也在最后3題同步撤走,消除界面不對稱干擾。
結果仍然符合實驗1的結論:AI 組測試正確率0.71,對照組0.77。放棄率AI 組0.10,對照組0.07,方向一致。這顯示能力差異被嚴格排除,界面干擾被徹底消除,傷害依然存在。
也許有人說:數學是計算,依賴AI正常,文科思維不會受影響。研究團隊的第三項實驗,則直接用SAT 水平的閱讀理解進行實驗:招募201名受試者,讓他們做閱讀理解題目,考察邏輯推理、觀點辨析、細節(jié)理解。
結果再一次高度重復:AI 組測試正確率0.76,對照組0.89。放棄率AI 組0.08,對照組0.01,高了 8 倍。統(tǒng)計學顯著(P<0.01),效果量較大(Cohen’s d=0.42)。
這意味著AI 帶來的堅持性下降、獨立能力受損,不只是數學任務的特例,而是較為普遍的效應。無論是數字計算,還是文字理解,只要習慣了AI 秒出答案,一旦失去它,普通人的表現就會變差,且更不想努力。
“人們不僅會變得不擅長任務,他們甚至不再嘗試,”該研究第一作者、卡內基梅隆大學博士Grace Liu在接受CNET采訪中談到,“如果這種效應隨著經年累月的AI使用不斷累積,我們最終可能會培養(yǎng)出一代學習者,他們失去了脫離技術輔助而進行高效掙扎(productive struggle)的傾向。”[2]
![]()
閱讀理解任務中表現與堅持性的下降。(a)圖為參與者在題目呈現順序下的平均答題率與跳過率,95% 置信區(qū)間。灰色虛線標示學習階段與測試階段的分界點。(b)圖為參與者在測試階段的平均答題率與跳過率,95% 置信區(qū)間,由各參與者數據匯總。
![]()
Grace Liu ,論文第一作者,目前在卡內基梅隆大學從事強化學習和 AI 向善領域的博士研究
如何用 AI很重要?
值得注意的是,在實驗2中,研究者還讓AI組受試者自行報告使用方式,顯示直接要答案占61%,要提示/ 解釋,用AI找思路、問步驟、理解難點,不直接抄答案的占27%,基本不用AI的占12%。
對比三組的后測表現,AI 使用方式不同,結果也明顯分界:直接要答案組測試正確率最低,放棄率最高,相比自己的前測,成績大幅下滑,堅持性顯著惡化。要提示/ 解釋組表現接近對照組,傷害極小,甚至部分人略有提升。基本不用AI 組表現最好,正確率最高,放棄率最低,甚至超過純對照組。這表明AI使用的方式對于個人獨立面對問題時的表現影響巨大。
我們的大腦為何會被AI重塑?
但是,為什么AI能在10分鐘內就能如此影響到我們的大腦?
研究團隊認為,有兩個機制或許可解釋這一現象。
首先是即時滿足導致預期扭曲,進而帶來努力厭惡。AI 秒給答案,讓普通人形成“問題=瞬間解決”的心理預期和多巴胺路徑后,效率閾值被無限拉高了。研究將其歸因于“享樂適應”(Hedonic Adaption),當突然失去AI,需要自己花1 分鐘、3 分鐘、5 分鐘思考時,大腦會覺得:“這太慢了、太麻煩了、太痛苦了”。這種主觀難度的急劇上升,讓大腦本能地逃避、放棄。更令人擔心的是,這是自我強化的惡性循環(huán):越依賴AI,就越覺得獨立思考辛苦,從而越依賴AI,越不想思考。[3]
另外,AI剝奪了學習中的有效掙扎,導致元認知退化。認知科學顯示:真正的學習,發(fā)生在掙扎中。如同健身過程的肌肉撕裂和重建,自己算錯題、找思路、啃難點,這個過程不僅重建神經元連接,學會新知識,更會知道:我能靠自己解決難題,這種元認知校準和信心建立是堅持性的心理根基。AI 直接給答案,徹底剝奪了大腦掙扎的機會。從未體驗過“靠自己攻克難題” 的成就感,也從未建立“我能行”的信念。一旦AI 消失,面對難題的第一反應不是“我試試”,而是“我不會,放棄”。[4]
每一天的AI 依賴,都只帶來一點點微小的傷害,完全察覺不到,但日積月累,研究團隊形容這將“猶如溫水煮青蛙”,導致后果最后難以收拾。
AI系統(tǒng)應該重新設計?
從文字、算盤、計算器,到互聯(lián)網、搜索引擎,人類一直在用工具拓展能力邊界。但歷史反復證明:工具越強大,越考驗我們使用工具的智慧。AI 是人類有史以來最強大的認知工具,可以把高密度信息瞬時推送到面前,也可以在短短10 分鐘內,悄悄瓦解我們的認知能力和韌性。
研究團隊明確提出:AI的發(fā)展,不能只追求“即時好用”,必須兼顧長期能力培養(yǎng)。就像好導師知道“什么時候不幫忙”,未來的AI,也應該學會適度拒絕、引導思考、分步提示、延遲滿足,而不是一味秒給答案、討好用戶。
該研究的通訊作者、MIT教授Michiel Bakker在接受《連線》(The Wired)雜志采訪時指出,“直接給出答案的系統(tǒng),與為用戶搭建思考支架、提供引導輔導或是向用戶提出思辨挑戰(zhàn)的系統(tǒng),二者帶來的長期影響截然不同”。[5]
該研究仍然存在一定局限。比如樣本以美國成年人為主,是否適用于兒童、老人、不同文化背景,仍需驗證,而且題目對中國成年人來說,可能相對簡單。實驗任務為短期認知任務,長期日常使用的累積效應,仍需縱向追蹤研究。另外僅測試了GPT5 ,不同AI 設計的影響,仍需進一步探索。但這些局限,絲毫不影響其核心結論。當下“秒給答案、永不拒絕” 的AI 使用模式,對人類堅持性與獨立能力的傷害,值得深思。
參考文獻:
[1]AI Assistance Reduces Persistence and Hurts Independent Performance, https://arxiv.org/abs/2604.04721v2
[2] Counting on AI to Solve Problems Makes Us More Likely to Struggle and Give Up, Study Suggests. https://www.cnet.com/tech/services-and-software/counting-on-ai-to-solve-problems-makes-us-more-likely-to-struggle-and-give-up-study-suggests/
[3] Philip Brickman. Hedonic relativism and planning the good society. Adaptation level theory, pp. 287–301, 1971.
[4] Nick Yeung and Christopher Summerffeld. Metacognition in human decision-making: conffdence and error monitoring. Philosophical Transactions of the Royal Society B: Biological Sciences, 367(1594):1310–1321, 2012.
[5] https://www.wired.com/story/using-ai-negative-impact-thinking-problem-solving-study/
來源:賽先生
編輯:檸七
轉載內容僅代表作者觀點
不代表中科院物理所立場
如需轉載請聯(lián)系原公眾號
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.