![]()
國(guó)家數(shù)據(jù)局?jǐn)?shù)據(jù)顯示,從2024年到2026年,中國(guó)日均Token調(diào)用量從1000億飆升至140萬(wàn)億(截至2026年3月),兩年增長(zhǎng)超過(guò)千倍,而在這組數(shù)據(jù)的背后,體現(xiàn)了AI正在從實(shí)驗(yàn)室里的模型訓(xùn)練,全面進(jìn)入生產(chǎn)生活中的應(yīng)用落地。
過(guò)去以“數(shù)據(jù)保存”為核心使命的存儲(chǔ)設(shè)備,如今被賦予了“數(shù)據(jù)賦能”的全新職責(zé)——它不再是被動(dòng)承載數(shù)據(jù)的“容器”,而是主動(dòng)參與數(shù)據(jù)處理、支撐AI高效運(yùn)轉(zhuǎn)的“核心樞紐”。
對(duì)于存儲(chǔ)行業(yè)來(lái)說(shuō),這個(gè)拐點(diǎn)帶來(lái)的不是溫和的增量增長(zhǎng),而是一場(chǎng)全面重構(gòu)。在這場(chǎng)重構(gòu)的背后,不再是讓數(shù)據(jù)走向AI,而是讓AI走向數(shù)據(jù)。
存儲(chǔ)架構(gòu)迎來(lái)“基因重組”
“原來(lái)的企業(yè)存儲(chǔ)是做數(shù)據(jù)保護(hù),現(xiàn)在AI存儲(chǔ)的第一目標(biāo)是效率提升——如何充分滿(mǎn)足GPU對(duì)于數(shù)據(jù)的需求,而不讓它空轉(zhuǎn)”,浪潮信息存儲(chǔ)產(chǎn)品部副總經(jīng)理郭海峰用這樣一句話(huà)概括了存儲(chǔ)使命的根本性變化。
這不僅是產(chǎn)品定位的調(diào)整,而是整個(gè)技術(shù)架構(gòu)的“基因重組”。郭海峰指出,傳統(tǒng)企業(yè)級(jí)存儲(chǔ)是“通算架構(gòu)”——以CPU為核心,數(shù)據(jù)需要由CPU進(jìn)行路徑解析、從內(nèi)核態(tài)進(jìn)行復(fù)制和轉(zhuǎn)發(fā),再傳給GPU進(jìn)行計(jì)算。這種架構(gòu)在服務(wù)關(guān)系型數(shù)據(jù)庫(kù)和傳統(tǒng)應(yīng)用時(shí)運(yùn)轉(zhuǎn)良好,但當(dāng)它面對(duì)智算時(shí)代的GPU集群時(shí),效率極為低下:如果存儲(chǔ)成為瓶頸,昂貴的GPU就會(huì)空轉(zhuǎn)。
數(shù)據(jù)可以說(shuō)明問(wèn)題的嚴(yán)重性。IBM大中華區(qū)存儲(chǔ)事業(yè)部總經(jīng)理吳磊告訴筆者,如今GPU部署動(dòng)輒百卡、千卡、萬(wàn)卡規(guī)模,投資以?xún)|甚至十億計(jì),“1%的閑置就意味著上億元的浪費(fèi)”。無(wú)獨(dú)有偶,郭海峰同樣曾公開(kāi)表示,存儲(chǔ)和網(wǎng)絡(luò)在整個(gè)智算系統(tǒng)中可能只占5%-10%的成本,但如果GPU空轉(zhuǎn),這5%-10%的成本就會(huì)毀掉其余90%以上的投資回報(bào)。
為了滿(mǎn)足當(dāng)前企業(yè)對(duì)于算力利用率的需求,存儲(chǔ)也迎來(lái)了“基因重組”的新階段。目前來(lái)看,從軟件和硬件兩個(gè)層面切入,都可以?xún)?yōu)化整體存儲(chǔ)架構(gòu)。這個(gè)過(guò)程中,浪潮信息與IBM就是很好的兩個(gè)方面的代表。比如,浪潮信息在其新發(fā)布的A9000系列產(chǎn)品中就采用了“全鏈路免鎖零拷貝的用戶(hù)態(tài)AI原生并行架構(gòu)”,將數(shù)據(jù)傳輸路徑從內(nèi)核態(tài)切換到用戶(hù)態(tài)協(xié)議棧,實(shí)現(xiàn)端到端的免拷貝,將延遲從傳統(tǒng)的毫秒級(jí)降至微秒級(jí),單節(jié)點(diǎn)帶寬達(dá)到160GB/s(行業(yè)主流水平為60GB/s至80GB/s)。
在軟件層面的架構(gòu)變革背后,暗含著一條更深層的技術(shù)主線(xiàn),那就是KV Cache。在AI推理場(chǎng)景中,為了加速模型響應(yīng)、避免重復(fù)計(jì)算,系統(tǒng)需要將鍵值對(duì)緩存保留在高速存儲(chǔ)中。但隨著上下文窗口的急劇擴(kuò)大,KV Cache的規(guī)模已經(jīng)遠(yuǎn)遠(yuǎn)超出了GPU顯存(HBM)和本地DRAM的承載能力。郭海峰向筆者詳細(xì)解釋了這一技術(shù)邏輯:通過(guò)PD分離(Prefill與Decode分離),利用GlobalCast技術(shù)和“雙路徑”設(shè)計(jì),將空閑的帶寬整合利用,顯著縮短首Token產(chǎn)生時(shí)間。浪潮信息公布的數(shù)據(jù)顯示,通過(guò)Agent Memory外置存儲(chǔ)架構(gòu),A9000可將首Token延遲(TTFT)降低97%,Token吞吐量提升超過(guò)20倍。
與之相對(duì),IBM則從另一個(gè)維度切入。IBM推出的Storage Scale并行文件系統(tǒng)在萬(wàn)卡集群中支撐高頻的checkpoint數(shù)據(jù)落盤(pán),確保數(shù)據(jù)能夠在極短時(shí)間內(nèi)寫(xiě)入存儲(chǔ),充分釋放GPU的計(jì)算效率。
除了“軟件”層面的優(yōu)化之外,IBM還在其自研的第五代閃存核心模塊(FlashCore Module 5)的每塊NVMe閃盤(pán)上嵌入一顆專(zhuān)用芯片和高性能處理器,實(shí)現(xiàn)硬件級(jí)的壓縮、去重和加密。吳磊透露,這一設(shè)計(jì)可以將壓縮比做到1:5,并且因?yàn)閴嚎s在盤(pán)上完成,不會(huì)對(duì)存儲(chǔ)控制器的性能造成影響。
種種技術(shù)的變化都揭示了AI時(shí)代存儲(chǔ)架構(gòu)的另一個(gè)重要方向:存儲(chǔ)不再只是數(shù)據(jù)的被動(dòng)容器,而是具備感知和計(jì)算能力的主動(dòng)節(jié)點(diǎn)。
漲價(jià)是暫時(shí)的,效率優(yōu)化才是關(guān)鍵
當(dāng)存儲(chǔ)節(jié)點(diǎn)不再是被動(dòng)容器,而是進(jìn)化為承載KV Cache、主動(dòng)參與計(jì)算卸載的智能樞紐之時(shí),業(yè)界對(duì)高帶寬、低延遲存儲(chǔ)介質(zhì)的依賴(lài)便呈指數(shù)級(jí)攀升。這種由架構(gòu)變革催生的龐大缺口,直接投射在了上游供應(yīng)鏈的產(chǎn)量?jī)A斜與價(jià)格博弈之上。
據(jù)多方數(shù)據(jù)顯示,2026年第一季度DRAM內(nèi)存合約價(jià)漲幅達(dá)90%-95%,NAND Flash閃存合約價(jià)漲幅達(dá)55%-60%。這輪漲價(jià)潮的直接推手是AI——大模型訓(xùn)練和推理需求井噴,DRAM和NAND原廠將大量產(chǎn)能從消費(fèi)級(jí)產(chǎn)品轉(zhuǎn)向高利潤(rùn)的企業(yè)級(jí)AI產(chǎn)品,TrendForce預(yù)測(cè),2026年第二季度NAND閃存合約價(jià)將繼續(xù)大幅跳升70%至75%。
但吳磊與郭海峰不約而同地認(rèn)為,存儲(chǔ)漲價(jià)是一時(shí)的,真正需要關(guān)注的是效率優(yōu)化。郭海峰提到,有的企業(yè)將存儲(chǔ)遷移到高帶寬方案后,GPU利用率提升了15%——“用不到整個(gè)項(xiàng)目10%的錢(qián)采購(gòu)存儲(chǔ),把卡的利用率提升了15%”。吳磊則算了一筆更直觀的賬:通過(guò)FCM的1:5壓縮技術(shù),用戶(hù)在漲價(jià)后開(kāi)啟壓縮功能,實(shí)際可用容量的單位成本甚至比漲價(jià)前更低。
然而成本優(yōu)化遠(yuǎn)不只是一個(gè)壓縮比的問(wèn)題。存儲(chǔ)行業(yè)正在經(jīng)歷的,是對(duì)“數(shù)據(jù)應(yīng)該放在哪里”這一根本問(wèn)題的重新思考。傳統(tǒng)企業(yè)級(jí)存儲(chǔ)中,“熱、溫、冷”數(shù)據(jù)分層管理已經(jīng)是成熟理念,但AI時(shí)代的分層邏輯遠(yuǎn)比過(guò)去復(fù)雜。
這時(shí)候,五層存儲(chǔ)體系也就應(yīng)運(yùn)而生了,其出現(xiàn)是AI給存儲(chǔ)行業(yè)帶來(lái)的最直觀的結(jié)構(gòu)性變化。按照業(yè)界通行的分類(lèi):第一層是HBM(高帶寬內(nèi)存),第二層是本地DRAM,第三層是本地SSD,第四層是傳統(tǒng)企業(yè)級(jí)外置存儲(chǔ)。而在第三層和第四層之間,現(xiàn)在出現(xiàn)了一個(gè)“3.5層”——這是一個(gè)專(zhuān)門(mén)服務(wù)于推理場(chǎng)景的外置緩存層。
為什么需要3.5層?郭海峰向筆者解釋道:“3.5層是為了效率,放棄一定的可靠性,數(shù)據(jù)比是1:1,大不了數(shù)據(jù)丟了重新算,但不能犧牲效率。”這與第四層傳統(tǒng)存儲(chǔ)“數(shù)據(jù)保護(hù)優(yōu)先”的理念形成了鮮明對(duì)比。無(wú)獨(dú)有偶,吳磊也給出了類(lèi)似的判斷:“全用HBM當(dāng)然最好,但HBM太貴了。”在經(jīng)濟(jì)學(xué)約束下,分層是必然選擇。
而在五層存儲(chǔ)體系分層的影響下,“磁帶存儲(chǔ)”這個(gè)“古老”的存儲(chǔ)技術(shù)又一次成為了企業(yè)性?xún)r(jià)比之選。據(jù)吳磊介紹,過(guò)去幾年多家大廠已部署EB級(jí)甚至10EB級(jí)的磁帶庫(kù),包括百度智能云在底層的冷數(shù)據(jù)存儲(chǔ)。LTO聯(lián)盟由IBM、HPE和Quantum聯(lián)合推動(dòng),LTO-10已實(shí)現(xiàn)40TB原始容量,2.5:1壓縮比下可達(dá)100TB,未來(lái)LTO-11可達(dá)70TB、LTO-12可達(dá)110TB。吳磊提供了一個(gè)實(shí)用視角:磁帶機(jī)械臂從最遠(yuǎn)端抓取數(shù)據(jù)大約需要一分五十多秒,但如果一個(gè)數(shù)據(jù)三個(gè)月甚至六個(gè)月才訪問(wèn)一次,兩分鐘的等待完全可以接受。
讓AI走向數(shù)據(jù)
這一輪存儲(chǔ)行業(yè)的變革不僅僅是五層存儲(chǔ)體系所能完整體現(xiàn)的,而是映射出了一個(gè)更為深層的變化,傳統(tǒng)的“讓數(shù)據(jù)走向AI”模式已經(jīng)不能滿(mǎn)足當(dāng)前用戶(hù)的需求,讓AI走向數(shù)據(jù)將取而代之。
在傳統(tǒng)數(shù)據(jù)使用模式中,AI應(yīng)用是“索取方”:應(yīng)用發(fā)起請(qǐng)求,存儲(chǔ)響應(yīng)。這種模式在小規(guī)模、低頻次場(chǎng)景下可行,但面對(duì)EB級(jí)數(shù)據(jù)、百萬(wàn)并發(fā)請(qǐng)求時(shí),完全不可持續(xù)。更致命的問(wèn)題是數(shù)據(jù)一致性的崩塌。吳磊用一段生動(dòng)的比喻描述了這一困境:“我們每個(gè)人可能好幾個(gè)TB的照片、視頻,企業(yè)是幾百個(gè)TB、幾百個(gè)PB,甚至EB級(jí)的時(shí)候,哪一個(gè)副本數(shù)據(jù)說(shuō)出來(lái)的是真話(huà),哪個(gè)副本數(shù)據(jù)說(shuō)出來(lái)的是假話(huà)?”
面對(duì)此,IBM給出的解決方案是內(nèi)容感知存儲(chǔ)(Content-Aware Storage,CAS),結(jié)合單一數(shù)據(jù)副本和即時(shí)感知數(shù)據(jù)變化的機(jī)制。其核心理念是:數(shù)據(jù)發(fā)生了變化,模型能夠即時(shí)感知,而不是通過(guò)繁瑣的副本生產(chǎn)和傳輸來(lái)同步。吳磊強(qiáng)調(diào):“過(guò)去部分廠商出于銷(xiāo)售目的建議客戶(hù)擴(kuò)容升級(jí)。存儲(chǔ)管理員疲于應(yīng)對(duì)報(bào)告和遷移。現(xiàn)在有了AI智能體,可以把所有數(shù)據(jù)分析完,一次性做出決策,甚至可以做到跨洲的數(shù)據(jù)遷移。”
這意味著存儲(chǔ)的角色從被動(dòng)的數(shù)據(jù)倉(cāng)庫(kù)轉(zhuǎn)變?yōu)橹鲃?dòng)的數(shù)據(jù)編排平臺(tái)。而這個(gè)解題思路似乎已經(jīng)行業(yè)的一個(gè)共識(shí)。IBM提出的內(nèi)容感知存儲(chǔ)核心理念與浪潮信息提出的“AI Data Platform”概念有著許多相似之處。郭海峰告訴筆者,“AI Data Platform”概念強(qiáng)調(diào)的是數(shù)據(jù)不是靜態(tài)的“湖”,而是“一條不斷流淌的河流,不斷有數(shù)據(jù)進(jìn)來(lái),不斷去處理、清洗、打標(biāo)和再優(yōu)化,重新訓(xùn)練模型”。這種動(dòng)態(tài)的數(shù)據(jù)管理邏輯,與傳統(tǒng)的“存下來(lái)以后再說(shuō)”的思路有著本質(zhì)區(qū)別。
從產(chǎn)業(yè)視角看,“讓AI走向數(shù)據(jù)”正在催生新的產(chǎn)業(yè)協(xié)同模式。浪潮信息利用全棧能力(從底層算力到上層平臺(tái))為合作伙伴提供基礎(chǔ)設(shè)施,郭海峰將其形容為“搭臺(tái)唱戲”——浪潮信息搭臺(tái),伙伴唱AI這場(chǎng)戲。IBM則宣布與英偉達(dá)進(jìn)一步擴(kuò)大合作,在GTC 2026上展示了深度集成方案:Storage Scale System 6000可提供10PB高性能存儲(chǔ),用于支撐GPU原生分析引擎,IBM同時(shí)計(jì)劃于2026年第二季度初在IBM Cloud上提供英偉達(dá)Blackwell Ultra GPU。
但這一切的最終落點(diǎn)仍然是人。吳磊在溝通會(huì)上反復(fù)強(qiáng)調(diào):“AI是一個(gè)工具,不能代替人,它沒(méi)有情感,它沒(méi)有辦法做決定,最終做決定的是人類(lèi)。”無(wú)論是浪潮信息讓GPU“不空轉(zhuǎn)”,還是IBM用AI智能體讓存儲(chǔ)管理員管理數(shù)十個(gè)同構(gòu)或異構(gòu)節(jié)點(diǎn),終極目標(biāo)都是將人從繁瑣的運(yùn)維中解放出來(lái),將注意力投向創(chuàng)新。
IBM商業(yè)價(jià)值研究院的調(diào)研顯示,76%的CEO對(duì)自己企業(yè)的IT架構(gòu)“非常自信”,但43%的CIO感到焦慮。這種認(rèn)知落差恰恰說(shuō)明,AI時(shí)代的數(shù)據(jù)基礎(chǔ)設(shè)施挑戰(zhàn),遠(yuǎn)比表面看到的更復(fù)雜。“讓存儲(chǔ)融入平時(shí)的業(yè)務(wù)中,而不是讓業(yè)務(wù)等存儲(chǔ)”——金鑫這句總結(jié),或許是這個(gè)時(shí)代對(duì)存儲(chǔ)行業(yè)最樸素也最關(guān)鍵的要求。
回望過(guò)去兩年,存儲(chǔ)行業(yè)經(jīng)歷了從波瀾不驚到驚濤駭浪的轉(zhuǎn)變。當(dāng)全球AI總支出逼近萬(wàn)億美元量級(jí),當(dāng)Token成本的每一次下降都直接影響大模型的經(jīng)濟(jì)可行性,存儲(chǔ)不再只是技術(shù)的終點(diǎn),而正在成為AI價(jià)值鏈條中不可或缺的一環(huán)。
(文|Leo張ToB雜談,作者|張申宇,編輯丨楊林)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.