網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

存儲(chǔ)漲價(jià)之后，如何讓AI走向數(shù)據(jù)？丨ToB產(chǎn)業(yè)觀察

2026-05-06 10:16:52　來(lái)源: 鈦媒體APP

北京舉報(bào)

分享至

國(guó)家數(shù)據(jù)局?jǐn)?shù)據(jù)顯示，從2024年到2026年，中國(guó)日均Token調(diào)用量從1000億飆升至140萬(wàn)億（截至2026年3月），兩年增長(zhǎng)超過(guò)千倍，而在這組數(shù)據(jù)的背后，體現(xiàn)了AI正在從實(shí)驗(yàn)室里的模型訓(xùn)練，全面進(jìn)入生產(chǎn)生活中的應(yīng)用落地。

過(guò)去以“數(shù)據(jù)保存”為核心使命的存儲(chǔ)設(shè)備，如今被賦予了“數(shù)據(jù)賦能”的全新職責(zé)——它不再是被動(dòng)承載數(shù)據(jù)的“容器”，而是主動(dòng)參與數(shù)據(jù)處理、支撐AI高效運(yùn)轉(zhuǎn)的“核心樞紐”。

對(duì)于存儲(chǔ)行業(yè)來(lái)說(shuō)，這個(gè)拐點(diǎn)帶來(lái)的不是溫和的增量增長(zhǎng)，而是一場(chǎng)全面重構(gòu)。在這場(chǎng)重構(gòu)的背后，不再是讓數(shù)據(jù)走向AI，而是讓AI走向數(shù)據(jù)。

存儲(chǔ)架構(gòu)迎來(lái)“基因重組”

“原來(lái)的企業(yè)存儲(chǔ)是做數(shù)據(jù)保護(hù)，現(xiàn)在AI存儲(chǔ)的第一目標(biāo)是效率提升——如何充分滿(mǎn)足GPU對(duì)于數(shù)據(jù)的需求，而不讓它空轉(zhuǎn)”，浪潮信息存儲(chǔ)產(chǎn)品部副總經(jīng)理郭海峰用這樣一句話(huà)概括了存儲(chǔ)使命的根本性變化。

這不僅是產(chǎn)品定位的調(diào)整，而是整個(gè)技術(shù)架構(gòu)的“基因重組”。郭海峰指出，傳統(tǒng)企業(yè)級(jí)存儲(chǔ)是“通算架構(gòu)”——以CPU為核心，數(shù)據(jù)需要由CPU進(jìn)行路徑解析、從內(nèi)核態(tài)進(jìn)行復(fù)制和轉(zhuǎn)發(fā)，再傳給GPU進(jìn)行計(jì)算。這種架構(gòu)在服務(wù)關(guān)系型數(shù)據(jù)庫(kù)和傳統(tǒng)應(yīng)用時(shí)運(yùn)轉(zhuǎn)良好，但當(dāng)它面對(duì)智算時(shí)代的GPU集群時(shí)，效率極為低下：如果存儲(chǔ)成為瓶頸，昂貴的GPU就會(huì)空轉(zhuǎn)。

數(shù)據(jù)可以說(shuō)明問(wèn)題的嚴(yán)重性。IBM大中華區(qū)存儲(chǔ)事業(yè)部總經(jīng)理吳磊告訴筆者，如今GPU部署動(dòng)輒百卡、千卡、萬(wàn)卡規(guī)模，投資以?xún)|甚至十億計(jì)，“1%的閑置就意味著上億元的浪費(fèi)”。無(wú)獨(dú)有偶，郭海峰同樣曾公開(kāi)表示，存儲(chǔ)和網(wǎng)絡(luò)在整個(gè)智算系統(tǒng)中可能只占5%-10%的成本，但如果GPU空轉(zhuǎn)，這5%-10%的成本就會(huì)毀掉其余90%以上的投資回報(bào)。

為了滿(mǎn)足當(dāng)前企業(yè)對(duì)于算力利用率的需求，存儲(chǔ)也迎來(lái)了“基因重組”的新階段。目前來(lái)看，從軟件和硬件兩個(gè)層面切入，都可以?xún)?yōu)化整體存儲(chǔ)架構(gòu)。這個(gè)過(guò)程中，浪潮信息與IBM就是很好的兩個(gè)方面的代表。比如，浪潮信息在其新發(fā)布的A9000系列產(chǎn)品中就采用了“全鏈路免鎖零拷貝的用戶(hù)態(tài)AI原生并行架構(gòu)”，將數(shù)據(jù)傳輸路徑從內(nèi)核態(tài)切換到用戶(hù)態(tài)協(xié)議棧，實(shí)現(xiàn)端到端的免拷貝，將延遲從傳統(tǒng)的毫秒級(jí)降至微秒級(jí)，單節(jié)點(diǎn)帶寬達(dá)到160GB/s（行業(yè)主流水平為60GB/s至80GB/s）。

在軟件層面的架構(gòu)變革背后，暗含著一條更深層的技術(shù)主線(xiàn)，那就是KV Cache。在AI推理場(chǎng)景中，為了加速模型響應(yīng)、避免重復(fù)計(jì)算，系統(tǒng)需要將鍵值對(duì)緩存保留在高速存儲(chǔ)中。但隨著上下文窗口的急劇擴(kuò)大，KV Cache的規(guī)模已經(jīng)遠(yuǎn)遠(yuǎn)超出了GPU顯存（HBM）和本地DRAM的承載能力。郭海峰向筆者詳細(xì)解釋了這一技術(shù)邏輯：通過(guò)PD分離（Prefill與Decode分離），利用GlobalCast技術(shù)和“雙路徑”設(shè)計(jì)，將空閑的帶寬整合利用，顯著縮短首Token產(chǎn)生時(shí)間。浪潮信息公布的數(shù)據(jù)顯示，通過(guò)Agent Memory外置存儲(chǔ)架構(gòu)，A9000可將首Token延遲（TTFT）降低97%，Token吞吐量提升超過(guò)20倍。

與之相對(duì)，IBM則從另一個(gè)維度切入。IBM推出的Storage Scale并行文件系統(tǒng)在萬(wàn)卡集群中支撐高頻的checkpoint數(shù)據(jù)落盤(pán)，確保數(shù)據(jù)能夠在極短時(shí)間內(nèi)寫(xiě)入存儲(chǔ)，充分釋放GPU的計(jì)算效率。

除了“軟件”層面的優(yōu)化之外，IBM還在其自研的第五代閃存核心模塊（FlashCore Module 5）的每塊NVMe閃盤(pán)上嵌入一顆專(zhuān)用芯片和高性能處理器，實(shí)現(xiàn)硬件級(jí)的壓縮、去重和加密。吳磊透露，這一設(shè)計(jì)可以將壓縮比做到1:5，并且因?yàn)閴嚎s在盤(pán)上完成，不會(huì)對(duì)存儲(chǔ)控制器的性能造成影響。

種種技術(shù)的變化都揭示了AI時(shí)代存儲(chǔ)架構(gòu)的另一個(gè)重要方向：存儲(chǔ)不再只是數(shù)據(jù)的被動(dòng)容器，而是具備感知和計(jì)算能力的主動(dòng)節(jié)點(diǎn)。

漲價(jià)是暫時(shí)的，效率優(yōu)化才是關(guān)鍵

當(dāng)存儲(chǔ)節(jié)點(diǎn)不再是被動(dòng)容器，而是進(jìn)化為承載KV Cache、主動(dòng)參與計(jì)算卸載的智能樞紐之時(shí)，業(yè)界對(duì)高帶寬、低延遲存儲(chǔ)介質(zhì)的依賴(lài)便呈指數(shù)級(jí)攀升。這種由架構(gòu)變革催生的龐大缺口，直接投射在了上游供應(yīng)鏈的產(chǎn)量?jī)A斜與價(jià)格博弈之上。

據(jù)多方數(shù)據(jù)顯示，2026年第一季度DRAM內(nèi)存合約價(jià)漲幅達(dá)90%-95%，NAND Flash閃存合約價(jià)漲幅達(dá)55%-60%。這輪漲價(jià)潮的直接推手是AI——大模型訓(xùn)練和推理需求井噴，DRAM和NAND原廠將大量產(chǎn)能從消費(fèi)級(jí)產(chǎn)品轉(zhuǎn)向高利潤(rùn)的企業(yè)級(jí)AI產(chǎn)品，TrendForce預(yù)測(cè)，2026年第二季度NAND閃存合約價(jià)將繼續(xù)大幅跳升70%至75%。

但吳磊與郭海峰不約而同地認(rèn)為，存儲(chǔ)漲價(jià)是一時(shí)的，真正需要關(guān)注的是效率優(yōu)化。郭海峰提到，有的企業(yè)將存儲(chǔ)遷移到高帶寬方案后，GPU利用率提升了15%——“用不到整個(gè)項(xiàng)目10%的錢(qián)采購(gòu)存儲(chǔ)，把卡的利用率提升了15%”。吳磊則算了一筆更直觀的賬：通過(guò)FCM的1:5壓縮技術(shù)，用戶(hù)在漲價(jià)后開(kāi)啟壓縮功能，實(shí)際可用容量的單位成本甚至比漲價(jià)前更低。

然而成本優(yōu)化遠(yuǎn)不只是一個(gè)壓縮比的問(wèn)題。存儲(chǔ)行業(yè)正在經(jīng)歷的，是對(duì)“數(shù)據(jù)應(yīng)該放在哪里”這一根本問(wèn)題的重新思考。傳統(tǒng)企業(yè)級(jí)存儲(chǔ)中，“熱、溫、冷”數(shù)據(jù)分層管理已經(jīng)是成熟理念，但AI時(shí)代的分層邏輯遠(yuǎn)比過(guò)去復(fù)雜。

這時(shí)候，五層存儲(chǔ)體系也就應(yīng)運(yùn)而生了，其出現(xiàn)是AI給存儲(chǔ)行業(yè)帶來(lái)的最直觀的結(jié)構(gòu)性變化。按照業(yè)界通行的分類(lèi)：第一層是HBM（高帶寬內(nèi)存），第二層是本地DRAM，第三層是本地SSD，第四層是傳統(tǒng)企業(yè)級(jí)外置存儲(chǔ)。而在第三層和第四層之間，現(xiàn)在出現(xiàn)了一個(gè)“3.5層”——這是一個(gè)專(zhuān)門(mén)服務(wù)于推理場(chǎng)景的外置緩存層。

為什么需要3.5層？郭海峰向筆者解釋道：“3.5層是為了效率，放棄一定的可靠性，數(shù)據(jù)比是1:1，大不了數(shù)據(jù)丟了重新算，但不能犧牲效率。”這與第四層傳統(tǒng)存儲(chǔ)“數(shù)據(jù)保護(hù)優(yōu)先”的理念形成了鮮明對(duì)比。無(wú)獨(dú)有偶，吳磊也給出了類(lèi)似的判斷：“全用HBM當(dāng)然最好，但HBM太貴了。”在經(jīng)濟(jì)學(xué)約束下，分層是必然選擇。

而在五層存儲(chǔ)體系分層的影響下，“磁帶存儲(chǔ)”這個(gè)“古老”的存儲(chǔ)技術(shù)又一次成為了企業(yè)性?xún)r(jià)比之選。據(jù)吳磊介紹，過(guò)去幾年多家大廠已部署EB級(jí)甚至10EB級(jí)的磁帶庫(kù)，包括百度智能云在底層的冷數(shù)據(jù)存儲(chǔ)。LTO聯(lián)盟由IBM、HPE和Quantum聯(lián)合推動(dòng)，LTO-10已實(shí)現(xiàn)40TB原始容量，2.5:1壓縮比下可達(dá)100TB，未來(lái)LTO-11可達(dá)70TB、LTO-12可達(dá)110TB。吳磊提供了一個(gè)實(shí)用視角：磁帶機(jī)械臂從最遠(yuǎn)端抓取數(shù)據(jù)大約需要一分五十多秒，但如果一個(gè)數(shù)據(jù)三個(gè)月甚至六個(gè)月才訪問(wèn)一次，兩分鐘的等待完全可以接受。

讓AI走向數(shù)據(jù)

這一輪存儲(chǔ)行業(yè)的變革不僅僅是五層存儲(chǔ)體系所能完整體現(xiàn)的，而是映射出了一個(gè)更為深層的變化，傳統(tǒng)的“讓數(shù)據(jù)走向AI”模式已經(jīng)不能滿(mǎn)足當(dāng)前用戶(hù)的需求，讓AI走向數(shù)據(jù)將取而代之。

在傳統(tǒng)數(shù)據(jù)使用模式中，AI應(yīng)用是“索取方”：應(yīng)用發(fā)起請(qǐng)求，存儲(chǔ)響應(yīng)。這種模式在小規(guī)模、低頻次場(chǎng)景下可行，但面對(duì)EB級(jí)數(shù)據(jù)、百萬(wàn)并發(fā)請(qǐng)求時(shí)，完全不可持續(xù)。更致命的問(wèn)題是數(shù)據(jù)一致性的崩塌。吳磊用一段生動(dòng)的比喻描述了這一困境：“我們每個(gè)人可能好幾個(gè)TB的照片、視頻，企業(yè)是幾百個(gè)TB、幾百個(gè)PB，甚至EB級(jí)的時(shí)候，哪一個(gè)副本數(shù)據(jù)說(shuō)出來(lái)的是真話(huà)，哪個(gè)副本數(shù)據(jù)說(shuō)出來(lái)的是假話(huà)？”

面對(duì)此，IBM給出的解決方案是內(nèi)容感知存儲(chǔ)（Content-Aware Storage，CAS），結(jié)合單一數(shù)據(jù)副本和即時(shí)感知數(shù)據(jù)變化的機(jī)制。其核心理念是：數(shù)據(jù)發(fā)生了變化，模型能夠即時(shí)感知，而不是通過(guò)繁瑣的副本生產(chǎn)和傳輸來(lái)同步。吳磊強(qiáng)調(diào)：“過(guò)去部分廠商出于銷(xiāo)售目的建議客戶(hù)擴(kuò)容升級(jí)。存儲(chǔ)管理員疲于應(yīng)對(duì)報(bào)告和遷移。現(xiàn)在有了AI智能體，可以把所有數(shù)據(jù)分析完，一次性做出決策，甚至可以做到跨洲的數(shù)據(jù)遷移。”

這意味著存儲(chǔ)的角色從被動(dòng)的數(shù)據(jù)倉(cāng)庫(kù)轉(zhuǎn)變?yōu)橹鲃?dòng)的數(shù)據(jù)編排平臺(tái)。而這個(gè)解題思路似乎已經(jīng)行業(yè)的一個(gè)共識(shí)。IBM提出的內(nèi)容感知存儲(chǔ)核心理念與浪潮信息提出的“AI Data Platform”概念有著許多相似之處。郭海峰告訴筆者，“AI Data Platform”概念強(qiáng)調(diào)的是數(shù)據(jù)不是靜態(tài)的“湖”，而是“一條不斷流淌的河流，不斷有數(shù)據(jù)進(jìn)來(lái)，不斷去處理、清洗、打標(biāo)和再優(yōu)化，重新訓(xùn)練模型”。這種動(dòng)態(tài)的數(shù)據(jù)管理邏輯，與傳統(tǒng)的“存下來(lái)以后再說(shuō)”的思路有著本質(zhì)區(qū)別。

從產(chǎn)業(yè)視角看，“讓AI走向數(shù)據(jù)”正在催生新的產(chǎn)業(yè)協(xié)同模式。浪潮信息利用全棧能力（從底層算力到上層平臺(tái)）為合作伙伴提供基礎(chǔ)設(shè)施，郭海峰將其形容為“搭臺(tái)唱戲”——浪潮信息搭臺(tái)，伙伴唱AI這場(chǎng)戲。IBM則宣布與英偉達(dá)進(jìn)一步擴(kuò)大合作，在GTC 2026上展示了深度集成方案：Storage Scale System 6000可提供10PB高性能存儲(chǔ)，用于支撐GPU原生分析引擎，IBM同時(shí)計(jì)劃于2026年第二季度初在IBM Cloud上提供英偉達(dá)Blackwell Ultra GPU。

但這一切的最終落點(diǎn)仍然是人。吳磊在溝通會(huì)上反復(fù)強(qiáng)調(diào)：“AI是一個(gè)工具，不能代替人，它沒(méi)有情感，它沒(méi)有辦法做決定，最終做決定的是人類(lèi)。”無(wú)論是浪潮信息讓GPU“不空轉(zhuǎn)”，還是IBM用AI智能體讓存儲(chǔ)管理員管理數(shù)十個(gè)同構(gòu)或異構(gòu)節(jié)點(diǎn)，終極目標(biāo)都是將人從繁瑣的運(yùn)維中解放出來(lái)，將注意力投向創(chuàng)新。

IBM商業(yè)價(jià)值研究院的調(diào)研顯示，76%的CEO對(duì)自己企業(yè)的IT架構(gòu)“非常自信”，但43%的CIO感到焦慮。這種認(rèn)知落差恰恰說(shuō)明，AI時(shí)代的數(shù)據(jù)基礎(chǔ)設(shè)施挑戰(zhàn)，遠(yuǎn)比表面看到的更復(fù)雜。“讓存儲(chǔ)融入平時(shí)的業(yè)務(wù)中，而不是讓業(yè)務(wù)等存儲(chǔ)”——金鑫這句總結(jié)，或許是這個(gè)時(shí)代對(duì)存儲(chǔ)行業(yè)最樸素也最關(guān)鍵的要求。

回望過(guò)去兩年，存儲(chǔ)行業(yè)經(jīng)歷了從波瀾不驚到驚濤駭浪的轉(zhuǎn)變。當(dāng)全球AI總支出逼近萬(wàn)億美元量級(jí)，當(dāng)Token成本的每一次下降都直接影響大模型的經(jīng)濟(jì)可行性，存儲(chǔ)不再只是技術(shù)的終點(diǎn)，而正在成為AI價(jià)值鏈條中不可或缺的一環(huán)。

（文｜Leo張ToB雜談，作者｜張申宇，編輯丨楊林）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.