人工智能(AI)正勢不可擋地席卷整個計算領域。盡管目前全球僅約七分之一的數據中心具備承載AI工作負載的能力,但到2030年,這一比例預計將接近70%1。AI正從超大規模數據中心遷移至企業級數據中心,并進一步部署至網絡邊緣——邊緣AI應用預計在2030年底將創造近665億美元的價值2。數據是這一全新計算時代的驅動力。海量數據必須高速傳輸至需求迫切且快速擴展的AI計算基礎設施中。
然而,海量內容庫正在讓傳統存儲架構不堪重負,其固有的架構劣勢也徹底顯現。數據中心內存(DRAM 及專用高帶寬內存HBM)在密度、存儲容量與可擴展性方面,逐漸難以應對大型AI模型日益增長的需求。與此同時,超大規模計算廠商正面對DRAM與HBM攀升的生產成本、提升的設計復雜度及增加的能耗。在企業級數據中心與邊緣AI應用場景中,這一挑戰更為嚴峻 —— 受限于更小的物理空間,此類場景難以承受持續上漲的內存成本與功耗。
同時,AI推理也帶來了一些亟待解決的問題。作為當下主流的AI工作負載,AI推理在數據管理方面的要求與AI訓練截然不同:推理需要存儲規模持續擴大的AI模型,而基于HBM與DRAM的內存方案已難以滿足這些新需求,其在容量與成本可擴展性上存在明顯短板。面對這些顯著差異的內存特性,市場亟需一種專為AI推理優化的內存技術。
為何DRAM與HBM無法滿足AI推理工作負載需求?
要理解為何僅DRAM與HBM并不適合AI的長期部署,可參考以下弊端3。這些問題起初只是細微隱患,但若不加以解決,將隨時間推移不斷擴大,最終動搖以AI為核心的下一代存儲架構根基。
密度瓶頸:DRAM容量擴展已陷入停滯,而支撐AI推理所需的容量需求卻持續攀升。3
與AI推理不匹配:DRAM在低時延、隨機訪問方面的優勢,對AI推理而言并不適用。AI推理的訪問模式具備確定性,借助數據預取等技術對時延有更高的包容度。3
面向AI推理優化的內存架構特性
規模達1,200億美元的DRAM產業?正面臨上述深層矛盾。鑒于超大規模服務商在AI基礎設施領域的支出有望在2030年底達到6.7萬億美元?,該產業迫切希望穩固自身在數據中心領域的既有地位。
如果現在正是徹底重新打造一款貼合應用需求的全新存儲解決方案的時機,而非讓應用去適配現有存儲,結果會如何?一款為AI優化的存儲級內存應具備以下特性:
- 更大規模且可擴展的內存容量,專為推理工作負載配置
- 更高的內存密度(GB/mm2)
- 高帶寬,滿足AI推理需求
- 更低的系統級功耗
- 高性價比指標(美元/ TB)
高帶寬閃存意指AI數據中心
高帶寬閃存(HBF?)是一款顛覆性的新型內存架構,專為支持推動新一代AI計算而設計。HBF滿足了高級計算及數據密集型應用對容量、能耗、吞吐量及可擴展性的核心要求。相較于HBM,HBF在保持同等帶寬的前提下,提供了更高的容量與存儲密度,更貼合AI推理的發展趨勢。作為一種持久性存儲介質,HBF在斷電時仍能保留數據,且具備熱穩定性,可支持高溫運行環境?。
![]()
為實現這些優勢,HBF通過優化高帶寬特性與推理內存屬性,對NAND閃存進行了高效重構。采用外圍電路直接鍵合到存儲陣列(CBA)晶圓技術,進一步提升了能效與帶寬。
HBF重塑面向AI應用的NAND閃存
相較于傳統NAND閃存,HBF通過并行架構、先進邏輯縮放工藝與定制化堆疊技術,實現更低時延與超高的讀取帶寬,讓大語言模型以接近DRAM的速度流式讀取數據?。
HBF還支持大型KV緩存,可高效處理冗長復雜的用戶提示詞,以及客戶專屬與領域專屬數據,助力提升AI推理準確率。
以內存為中心的AI延伸至企業級場景與網絡邊緣
由于受密度、成本與功耗限制,HBM通常無法用于邊緣與移動環境,而HBF可憑借更大存儲容量,實現處理更復雜AI推理任務的價值。這為智能手機等邊緣設備打開了應用空間,幫助其能夠實時決策并執行各類復雜任務。憑借持久性存儲的特性,HBF支持從歷史查詢中無縫調取過往上下文,以解決新問題。
HBF的優勢可同樣延伸至企業級計算場景。這類場景的用戶規模遠小于超大規模數據中心,而依托HBM的大型GPU集群成本過高。通過采用搭載HBF的加速方案,小型企業有望對大型預訓練模型進行調優,以支持領域專屬應用需求。
![]()
優化的存儲解決方案突破AI計算增長的阻礙
在我們身邊,數據中心與邊緣AI設備正自主運行,支撐從“晚餐食譜”查詢到“突破性科學發現”的各類任務。網站托管、企業數據管理等常規任務,正逐步讓位于依托機器學習、深度學習與數據分析來生成實用洞察的智能工作負載。
如今的數據中心與邊緣存儲亟需重新規劃,以支撐大規模推理模型執行預測與生成任務。相較于HBM,HBF在具備顯著容量優勢的同時,可提供AI推理應用所需的高吞吐量?。作為可擴展的全新系統級存儲技術,HBF有助于減少性能瓶頸,加快現代數據中心與邊緣網絡中AI應用的洞察生成速度。
參考文獻
1 B. Srivathsan 、M. Sorel 、 P. Sachdeva,聯合 A. Bhan 、 H. Batra 、 R. Sharma 、 R. Gupta 以及 S. Choudhary,麥肯錫咨詢公司,《AI 算力:擴容數據中心以滿足日益增長的需求》(2024 年 10 月)
2 Grand View Research,《邊緣 AI 市場規模、份額及趨勢分析報告 —— 按組件(硬件、軟件、服務)、終端行業(消費電子、智慧城市、汽車)、地區及細分領域預測,2025—2030》
3 S. Legtchenko 、I. Stefanovici 、R. Black 、A. Rowstron 、J. Liu 、P. Costa 、B. Canakci 、D. Narayanan 、X. Wu,微軟研究院,《受控保留內存:面向 AI 時代的全新內存品類》,康奈爾大學(2025 年 1 月)
4FortuneBusinessInsights,《DRAM 市場規模、份額及行業分析……》(2026 年 2 月)
5 J. Noffsinger、M. Patel、P. Sachdeva、聯合A. Bhan、H. Chang以及M. Goodpaster,麥肯錫咨詢公司,《計算成本:一場7 萬億美元規模的數據中心擴張競賽》(2025 年 4 月)
6 HBF 技術資料頁,閃迪,《閃迪發布面向 AI 的未來存儲架構:高帶寬閃存(HBF)》(2025 年 7 月)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.