這是斯坦福大學(xué)李飛飛團隊發(fā)布的《 2025 AI Index Report 》,被認(rèn)為 是迄今規(guī)模最大、最綜合的AI發(fā)展數(shù)據(jù)報告。報告全面揭示了這一變革的核心趨勢:AI已從實驗室走向日常生活,成為推動經(jīng)濟、科學(xué)與全球治理的關(guān)鍵力量。
報告非常具體地呈現(xiàn)出一些事實,例如,中美在AI行業(yè)的投資有著較大差距。2024年全球私人AI投資達(dá)2523億美元,其中生成式AI吸引339億美元,同比增長18.7%。美國以1091億美元投資領(lǐng)先,是排名第二的中國(93億美元)的11.7倍,是英國(45億美元)的24.1倍。
自2013年以來的綜合數(shù)據(jù)也呈現(xiàn)出類似的趨勢。近十年來,美國新融資的人工智能公司數(shù)量約為中國的4.3倍,英國的7.9倍。
這表明中國在AI投資方面仍有較大上升空間。
雖然美國在頂尖模型開發(fā)上仍居主導(dǎo)(2024年推出40個標(biāo)志性模型),但中國在論文總量、專利授權(quán)等方面領(lǐng)先,并在模型質(zhì)量上快速追趕。中東、拉美和東南亞地區(qū)也開始推出有影響力的模型,全球AI生態(tài)呈現(xiàn)多極化趨勢。
斯坦福大學(xué)李飛飛團隊發(fā)現(xiàn),人工智能在多項嚴(yán)苛測試中表現(xiàn)卓越。2024年,模型在MMMU、GPQA和SWE-bench等新基準(zhǔn)上的性能分別提升18.8%、48.9%和67.3%。
更值得關(guān)注的是,AI的使用成本大幅降低:達(dá)到GPT-3.5水平的模型推理成本在18個月內(nèi)下降超過280倍。同時,開源模型幾乎追平閉源模型,性能差距從8%縮小至1.7%,技術(shù)民主化進程加速。
伴隨AI能力的增長,信任與安全挑戰(zhàn)日益嚴(yán)峻。2024年報告的AI相關(guān)事故數(shù)量增加56.4%,但企業(yè)對負(fù)責(zé)任AI風(fēng)險的認(rèn)知與實際行動間仍存在差距。對此,全球政策制定者展現(xiàn)出強烈緊迫感。
美國年度AI法規(guī)數(shù)量翻倍,全球AI立法總量較2016年激增9倍。從OECD到聯(lián)合國,國際組織密集出臺治理框架,共同聚焦透明度、公平性與可信度。
本文節(jié)選自李飛飛團隊發(fā)布的《2025年人工智能指數(shù)報告》,由「白鯨實驗室」編輯整理,若需要完整版PDF報告,可在文末留言“PDF”。
第一章:研究與開發(fā)
2024年12月,DeepSeek推出了V3模型,引起了廣泛關(guān)注,尤其是因為該模型在計算資源需求遠(yuǎn)低于許多領(lǐng)先的大語言模型的情況下,實現(xiàn)了卓越的性能。
下圖比較了美國和中國一些標(biāo)志性機器學(xué)習(xí)模型的訓(xùn)練計算量,凸顯了一個關(guān)鍵趨勢:美國頂級人工智能模型的計算量,通常遠(yuǎn)高于中國模型。
根據(jù)Epoch AI的研究數(shù)據(jù),自2021年底以來,中文前十大語言模型的訓(xùn)練算力年均增長約3倍,顯著低于2018年以來全球其他地區(qū)5倍的年均增速。
![]()
機器學(xué)習(xí)是 2023年人工智能領(lǐng)域最熱門的研究主題,占總論文數(shù)量的 75.7%,其次是計算機視覺(47.2%)、模式識別(25.9%)和自然語言處理。過去一年中,關(guān)于生成式人工智能的論文數(shù)量出現(xiàn)了顯著增長。
![]()
雖然追蹤人工智能論文總量能提供一個對人工智能研究 活動的宏觀視角,但聚焦于被引用次數(shù)最多的論文則能揭示該領(lǐng)域最具影響力的研究成果。這項分析揭示了一些最具開創(chuàng)性和影響力的人工智能研究正在哪里興起。
今年,人工智能指數(shù)通過OpenAlex的引文數(shù)據(jù),確定了2021年、2022年和2023年被引用次數(shù)最多的100篇人工智能論文。
2023年被引用次數(shù)最多的人工智能論文包括OpenAI的GPT-4技術(shù)報 告、Meta 的 Llama 2技術(shù)報告和谷歌的PaLM-E的技術(shù)報告。值得注意的是,由于引用的滯后性,今年報告中被引用次數(shù)最多的論文在今后的版本中可能會有所變化。
![]()
學(xué)術(shù)界持續(xù)產(chǎn)出最多被引的人工智能論文,2023年為42篇,2022年為27篇,2021年為34篇(圖1.1.12)。
值得注意 的是,產(chǎn)業(yè)界貢獻出現(xiàn)了顯著下降,百強論文的數(shù)量從2021年的17篇和2022年的19篇,驟降至2023年的僅7篇。隨著人工智能研究競爭日益激烈,許多行業(yè)人工智能實驗室降低發(fā)表論文頻率或減少披露研究細(xì)節(jié)。
![]()
下圖展示了2021至2023年間,全球人工智能領(lǐng)域高被引百強論文來源機構(gòu)分布情況。部分機構(gòu)在圖表中可能出現(xiàn)空白柱,這表明該機構(gòu)在某年未發(fā)表百強論文。
此外,下圖僅列出了排名前10的機構(gòu),盡管許多其他機構(gòu)也做出了重要貢獻。谷歌每年均位居榜首,但在2023年與清華大學(xué)并列第一,兩者均有8篇論文入選百強。2023年,卡內(nèi)基梅隆大學(xué)是排名最高的美國學(xué)術(shù)機構(gòu)。
![]()
為了展示人工智能領(lǐng)域不斷演變的地緣政治格局,人工智能指數(shù)展示了標(biāo)志性模型所屬的國家。下圖展示了歸因于研究人員所屬機構(gòu)所在地的標(biāo)志性人工智能模型總數(shù)。
2024年,美國以40個標(biāo)志性人工智能模型遙遙領(lǐng)先,中國以15個緊隨其后,法國則有3個。2024 年全球主要經(jīng)濟體包括美國、中國和歐盟均報告說,2024年發(fā)布的標(biāo)志性模型少于上一年。
自2003年以來,美國開發(fā)的模型數(shù)量超過了英國、中國和加拿大等其他主要國家。
![]()
下圖分別呈現(xiàn)了2024年度及過去十年間,機器學(xué)習(xí)領(lǐng)域標(biāo)志性模型研發(fā)的主導(dǎo)機構(gòu)分布情況。2024年,貢獻最多的是谷歌(7 個)、OpenA(I 7 個模型)和阿里巴巴(4 個)。
自2014年以來,谷歌以187個標(biāo)志性模型遙遙領(lǐng)先,其次是 Meta(82個)和微軟(39個)。在學(xué)術(shù)機構(gòu)中,卡內(nèi)基梅 隆大學(xué)(25個)、斯坦福大學(xué)(25個)和清華大學(xué)(22個)自2014年以來在標(biāo)志性模型研發(fā)方面成果最多。
![]()
![]()
第二章:技術(shù)性能
本章節(jié)節(jié)人工智能指數(shù)呈現(xiàn)2024年人工智能領(lǐng)域的主要發(fā)展趨勢和全方位高層視角覽。
去年人工智能指數(shù)報告指出,人工智能已在多數(shù)任務(wù)中超越人類水平,僅剩競賽級數(shù)學(xué)和視覺常識推理等少數(shù)例外。過 去一年間,人工智能系統(tǒng)持續(xù)改進,在多個原屬挑戰(zhàn)性的比較 基準(zhǔn)中已實現(xiàn)對人類表現(xiàn)的超越。
下圖展示了人工智能系統(tǒng)相對于人類基線在8類比較基準(zhǔn)(涵蓋 11 項任務(wù),如圖像分類、基礎(chǔ)閱讀理解等)中的進 展。人工智能指數(shù)團隊為每類任務(wù)選取一個代表性基準(zhǔn),今年新增 GPQA Diamond 和 MMMU等新發(fā)布基準(zhǔn),以展示人工智能在極端復(fù)雜認(rèn)知任務(wù)中的突破。
![]()
美國在人工智能研究和模型開發(fā)領(lǐng)域長期占據(jù)主導(dǎo)地位,中國則穩(wěn)居第二。然而,最新證據(jù)表明,這一格局正在快速變 化,中國開發(fā)的模型正逐步趕超美國同行。
2023年,美國領(lǐng)先模型的性能顯著優(yōu)于中國模型。在 LMSYS Chatbot Arena平臺上,2024年1月,美國頂尖模型的表現(xiàn)比中國最佳模型高出 9.3%。但到2025年2月,這一差距已縮小至僅 1.70%。2023年底,在 MMLU、 MMMU、MATH 和 HumanEval 等比較基準(zhǔn)中,中美模型的性 能差距分別為 17.5、13.5、24.3 和 31.6 個百分點。
而到2024年底,這些差距已大幅縮小至 0.3、8.1、1.6 和 3.7 個百分點。DeepSeek-R1 的發(fā)布引發(fā)了廣泛關(guān)注,除此之外,另一原因在于該公司稱其成果僅需通常訓(xùn)練此類模型所需硬件資源的一小部分即可實現(xiàn)。除了對美國股市造成影響外,DeepSeek-R1 的發(fā)布還引發(fā)了對美國半導(dǎo)體出口管制有效性的質(zhì)疑。
![]()
![]()
近年來,人工智能前沿模型的性能逐漸趨同,多家供應(yīng)商現(xiàn)已能提供高性能模型。這一現(xiàn)象標(biāo)志著自2022年底以來的轉(zhuǎn)變——當(dāng)時ChatGPT的發(fā)布(被廣泛視為 AI 進入公眾視野 的突破性事件)正值OpenAI和谷歌兩大巨頭主導(dǎo)市場的時期。
OpenA(I成立于2015年)于2020年發(fā)布GPT-3,而谷歌則在2022年推出了PaLM 和 Chinchilla等模型。
此后,新競爭者陸續(xù)入場,包括Meta 的 Llama 系列、Anthropic 的 Claude、High-Flyer 的 DeepSeek、Mistral 的 Le Chat 以及 xAI 的 Grok。隨著競爭加劇,模型性能差距日益縮小。根據(jù)去年的人工智能指數(shù)報告,在廣泛使用的人工智能排名平臺Chatbot Arena Leaderboard上,第一名與第十名模型的性能差距為11.9%;而到2025年初,這一差距已縮小至5.4%。
同樣,前兩名模型的差異從2023 年的4.9%降至2024年的僅0.7%。人工智能領(lǐng)域競爭日趨激烈,印證了2023 年的預(yù)測:人工智能企業(yè)缺乏抵御競爭對手的技術(shù)護城河。
![]()
盡管 MMLU 備受關(guān)注,但它也面臨顯著批評。有觀點認(rèn)為,該比較基準(zhǔn)包含錯誤或過于簡單的問題,可能無法有效挑戰(zhàn)日益先進的系統(tǒng)。2024 年,多倫多大學(xué)、滑鐵盧大學(xué)和卡內(nèi)基梅隆大學(xué)的研究團隊推出了 MMLU-Pro,這是 MMLU 的一個更具挑戰(zhàn)性的版本。
該版本剔除了噪聲問題和瑣碎問題,擴展了復(fù)雜題目,并增加了模型的選項數(shù)量。圖中展示了MMLU-Pro的性能趨勢,其中DeepSeek-R1以 84.0%的得分位居榜首。
![]()
第三章:負(fù)責(zé)人的人工智能
人工智能安全事件數(shù)據(jù)庫(AI Incident Database, AIID)記錄了人工智能的倫理濫用案例,例如自動駕駛汽車導(dǎo)致行人死亡,或人臉識別系統(tǒng)導(dǎo)致錯誤逮捕。
目前,事件追蹤主要依賴公開的媒體報道,這意味著實際事件數(shù)量可能更 高,因為許多事件未被報告。2024年,相關(guān)討論聚焦于優(yōu)化“嚴(yán)重”事件的界定和追蹤方法。盡管尚未就標(biāo)準(zhǔn)定義達(dá)成共識,但這些討論凸顯了更詳細(xì)報告的必要性,以便更好地記錄人工智能相關(guān)風(fēng)險及其影響。
2024年,人工智能相關(guān)事件數(shù)量激增,達(dá)到創(chuàng)紀(jì)錄的233起,較2023年增長56.4%。這一增長可能既反映了人工智能應(yīng)用的擴大,也反映了 公眾對其影響的關(guān)注度提升。此外,對人工智能認(rèn)知度的提高可能也促使更多 事件被上報至相關(guān)數(shù)據(jù)庫。
![]()
聊天機器人被指控導(dǎo)致青少年自殺(2024年10月23日)
一起針對 Character.AI 的訴訟引發(fā)了人們對人工智能聊 天機器人在心理健康危機中作用的擔(dān)憂。該案件涉及一名14 歲男孩塞韋爾·塞策三世,他在與一個聊天機器人角色進行長時間互動后自殺身亡。據(jù)報道,該聊天機器人提供的建議具有危害性,而非提供支持或關(guān)鍵資源。
訴訟稱,該聊天機器人雖設(shè)計用于與用戶進行深度個人對話,但缺乏防 止危險互動的適當(dāng)安全措施,并鼓勵塞韋爾結(jié)束生命。圖3.2.5顯示了 Sewell 自殺當(dāng)天與 “Dany”(聊天機器人角色)之間的對話截圖。
該案件凸顯了人工智能驅(qū)動的陪伴所面臨的倫理挑戰(zhàn),以及在缺乏充分監(jiān)管的情況下部署對話式人工智能的潛在風(fēng)險。雖然人工智能聊天機器人可以提供情感支持,但批評者警告說,如果沒有防護措施,它們可能會無意中強化有害行為,或者在用戶處于困境時未能及時干預(yù)。
![]()
調(diào)查還詢問了組織在未來一年內(nèi)實施RAI方面的預(yù)計投資,包括資本支出和運營支出。此類投資的示例包括開發(fā)或購 買符合RAI原則的技術(shù)系統(tǒng),以及與RAI的法律或?qū)I(yè)服務(wù)。
大型企業(yè)——尤其是年收入超過100億美元的企業(yè)—— 在 RAI 方面的總投資更高。值得注意的是,年收入在 100 億美元至300億美元之間的企業(yè)中有27%,年收入超過300億美元的企業(yè)中有21%在RAI上投資了 1000萬美元至2500萬美元。
這些發(fā)現(xiàn)表明,大型企業(yè)更傾向于將 RAI 作為戰(zhàn)略重點 并進行更高額的絕對投資。小型組織在RAI上的投入較少,但 許多組織仍報告了占收入比例較高的投資。
![]()
下圖展示了各組織認(rèn)為相關(guān)并正在積極應(yīng)對的與人工智能相關(guān)的負(fù)責(zé)任的人工智能風(fēng)險。網(wǎng)絡(luò)安全(66%)、合規(guī)監(jiān)管(63%)和個人隱私(60%)被列為最主要的關(guān)注點,然而,緩解措施的實施效果始終不足。
值得注意的是,在每個風(fēng)險類別中,采取積極措施緩解風(fēng)險的組織數(shù)量均少于那些認(rèn)為這些風(fēng)險具有相關(guān)性的組織。
在知識產(chǎn)權(quán)侵權(quán)(57%相關(guān) ,38%緩解)和組織聲譽(45%相關(guān) ,29%緩解)方面,差距尤為明顯。與可解釋性(40%)和公平性(34%)相關(guān)的風(fēng)險被較少比例的受訪者選中,緩解率進一步下降至31%和26%。
![]()
第四章:經(jīng)濟
本節(jié)利用 Lightcast 提供的數(shù)據(jù),分析勞動力市場對人工智能相關(guān)技能的需求。自2010年以來,Lightcast已分析了來自51,000多個網(wǎng)站的數(shù)億條招聘信息,并篩選出其中要求人工智能技能的崗位。
下圖顯示了招聘崗位中對人工智能技能需求的占比情況。2024年,新加坡(3.2%)、盧森堡(2%)和中國香港(1.9%)在這一指標(biāo)上處于領(lǐng)先地位。
2023年,美國招聘崗位中人工智能相關(guān)職位占比為1.4%,到 2024 年這一數(shù)字上升至1.8%。從2023年到2024年,大多數(shù)國家對人工智能技能 需求的崗位比例均有所增長。
![]()
![]()
下圖比較了2024 年人工智能崗位招聘中需求最高的10項專業(yè)技能,與2012年至2014年期間的需求情況。
從絕對值來看,過去十年間每項專業(yè)技能的需求均有所增長,其中Python的顯著增長凸顯了其作為首選人工智能編程語言的地位。
![]()
2024年,美國招聘信息中提及生成式人工智能技能的崗位數(shù)量較上年增長超過三倍(圖1)。圖2展示了2024年和2023年發(fā)布的人工智能招聘信息中提及特定生成式人工智能技能的占比。
![]()
![]()
下圖2023年至2024年美國各行業(yè)領(lǐng)域?qū)θ斯ぶ悄芗寄苄枨髰徫坏恼急取Ec2023年相比,2024年幾乎所 有行業(yè)領(lǐng)域?qū)θ斯ぶ悄芗寄苄枨髰徫坏恼急染兴仙残姓I(lǐng)域除外。
與2023年相比,2024年幾乎所有行業(yè)領(lǐng)域?qū)θ斯ぶ悄芗寄苄枨髰徫坏恼急染兴嵘残姓I(lǐng)域除外。
![]()
美國在人工智能領(lǐng)域私人投資總額方面再次位居世界第一。2024年,美國投入的人工智能領(lǐng)域私人投資總額為1091億美元,是排名第二的中國(93億美元)的 11.7 倍,是英國(45億美元)的24.1倍。
2024年躋身前15名的其他值得關(guān)注的國家包括瑞典(43 億美元)、奧地利(15 億美元)、荷蘭 (11 億美元)和意大利(9 億美元)。
![]()
自2013年以來,匯總私人人工智能投資數(shù)據(jù)時,國家排名保持不變:美國以470.9億美元的投資額位居榜首,中國以119.3億美元緊隨其后,英國以28.2億美元排名第三。
過去十年中吸引大量人工智能投資的其他國家包括以色列(150億美元)、新加坡(73億美元)和瑞典(73億美元)。
![]()
自2013年以來的綜合數(shù)據(jù)也呈現(xiàn)出類似的趨勢。近十年來,美國新融資的人工智能公司數(shù)量約為中國的4.3倍,英國的7.9倍。
![]()
各國工業(yè)機器人安裝量數(shù)據(jù),能夠反映不同經(jīng)濟體對機器人技術(shù)應(yīng)用的重視程度。2023年度統(tǒng)計顯示,中國以276,300臺的工業(yè)機器人安裝量位居全球首位,分別達(dá)到日本(46,100臺)的 6 倍和美國(37,600 臺)的 7.3 倍。
韓國與德國分類其后,安裝量分別為31,400臺和28,400臺。
![]()
獲取完整PDF文檔,請在下方留言~
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.