《科創板日報》5月29日訊(記者 黃心怡)從生成式人工智能到智能體的爆發,正在AI底層基礎設施領域催生一場深刻變革——其核心是從傳統GPU硬件轉向可量化、可交易的智能“貨幣”Token。隨著Token調用量指數級增長,一個圍繞“Token經濟學”的時代正在拉開序幕,中國的算力市場和國產芯片產業正站在這一歷史轉折點上,迎來前所未有的機遇與挑戰。
根據國家數據局披露的數據,2024年初我國日均Token調用量約1000億,2025年底躍升至100萬億,2026年3月進一步突破140萬億,兩年間增長超過1000倍。
《科創板日報》記者從云計算服務商優刻得獲悉,今年以來其平臺上的Token調用量呈現井噴式增長,客戶規模快速擴張。一個直觀指標是:在同一月份內,月末單日Token總消費金額可達月初首日的1.5至2倍。這已非線性增長,而是典型的指數級加速信號——意味著越來越多的企業正將AI能力嵌入真實業務場景,從“測試調用”走向“常態化生產”。
這一現象并非孤例。國內AI Infra服務商硅基流動平臺上的Token生成量、開發者活躍度以及企業客戶數,均在今年加速攀升,延續了爆發式增長態勢。截至目前,硅基流動的公有云及私有云MaaS平臺,日均Token生成量已達數萬億量級,服務超過1000萬用戶和1萬家企業客戶,覆蓋政企、互聯網、金融、能源、交通、文娛等各行各業。
硅基流動相關負責人認為,推動Token需求持續高漲的動力來自三個方面:首先,頭部大模型公司為保持競爭力,訓練與推理算力的采購量仍在飆漲,模型參數擴大和多模態能力引入使得算力消耗呈指數級上升。其次,垂直行業模型公司進入規模化投入期,利用自身行業數據持續訓練和迭代,形成長期、穩定的需求。最后,AI Agent的興起正在引爆新一輪算力消耗,Agent在執行多步驟任務、調用工具和進行復雜推理時,單次任務的Token消耗量遠高于傳統對話場景。
這種需求狂飆,已讓算力供給方感到供不應求的壓力。在阿里巴巴的業績交流會上,CEO吳泳銘直言:“目前服務器沒有一張卡是空著的,客戶的需求無法完全滿足,排隊的還很多。”
魔形智能相關負責人陸嘉駿向《科創板日報》記者提到,從客戶反饋來看,他們也在催促增加算力資源、擴大供應量,“這是一個增速非常快的增量市場,長期處于供不應求的狀態”。
![]()
聯想集團董事長兼CEO楊元慶則點明了需求的變化趨勢。他在業績會上指出,AI基礎設施正經歷爆發式增長,當下約有70%-80%的AI基礎設施(以GPU服務器為主)被用于模型訓練,僅有20%-30%用于推理。但他預測:“未來這個比例很可能會反過來,70%用于推理,30%用于訓練。”他強調,這并不意味著訓練所需算力會減少,恰恰相反,訓練需求依然會持續增長。這也意味著大型云服務廠商已難以滿足全部算力需求,一批新興的云服務商(Neocloud)正在以更快的速度崛起。
▍Token經濟學崛起 重構算力行業商業模式
Token消耗量的狂飆,正倒逼整個產業鏈重新思考價值交換的底層邏輯。過去,算力市場遵循的是“硬件資源租賃”模式;而今,一種更靈活、更貼合應用層的“Token服務”模式正在崛起。這便是“Token經濟學”的核心——將底層算力封裝為可計量、可定價、可結算的智能服務。
然而,這并非一場簡單的“新老交替”。優刻得相關負責人認為,Token計費與算力租賃將在未來相當長一段時間內階段性共存。長期來看,AI服務全面轉向按實際Token用量計費是大勢所趨;但當前及未來相當長一段時間內,裸金屬服務器與云服務器租賃模式不僅不會消亡,反而在特定場景下仍擁有可觀的市場空間與成長潛力。
他表示,原因在于,AI創新并非只有“調用API”一條路徑。對于許多立志構建核心壁壘的AI初創公司而言,擁有自有模型能力是區別于競爭對手的關鍵,簡單調用通用API難以形成差異化的“護城河”。此外,數據安全與合規也是剛性約束,金融機構、醫療機構或大型制造企業的核心數據必須“不出域”,因此更傾向于在租賃的獨占性算力設備上完成自有模型的訓練、微調和推理部署。在這些場景下,裸金屬租賃帶來的獨占性、可控性與性能確定性,是MaaS按量計費模式暫時無法完全替代的。
優刻得相關負責人認為,短期內的確會形成“分流效應”:初創企業和傳統企業的創新團隊為快速驗證想法、降低前期成本,會優先選擇按Token計費的MaaS服務,在一定程度上抑制裸金屬租賃的增量需求。然而,這種沖擊是階段性的。當企業完成技術驗證、業務體量達到一定規模后,為確保市場競爭力、數據主權與模型自主權,它們將轉向構建專屬的AI能力。屆時,算力租賃需求將再次釋放,并從“通用算力租賃”升級為“面向專屬模型的智算租賃”。Token計費降低了創新門檻,吸引更多企業成為AI的“嘗試者”;而這些“嘗試者”終將成長為“重度用戶”,為算力租賃市場帶來更堅實、更長尾的增量需求。
![]()
更深層次看,Token經濟正在推動整個行業價值鏈和商業模式的重構。知名咨詢機構CIC灼識董事總經理董曉雅認為,這一變化主要體現在兩個層面。首先,算力的計價邏輯正從“資源時長”轉向“服務消耗”,客戶不再關心租用了多少GPU,而是關心消耗了多少Token、響應是否穩定、成本是否可控。其次,行業競爭核心將從“誰擁有更多算力”轉向“誰能夠更高效地生產Token”。未來,決定廠商盈利能力的將是單位Token成本的控制能力,涵蓋服務器利用率、緩存命中率、推理框架效率等一系列復雜技術棧。
在此背景下,算力租賃廠商的角色也將發生根本性轉變。董曉雅指出,廠商需要從傳統的“硬件出租商”進化為“AI基礎設施服務商”,必須具備模型部署、推理優化、API服務、SLA保障乃至行業場景適配等綜合能力,商業模式也將隨之演變為“基礎租金+用量計費+效果分成”的混合模式。
這種轉變的直接結果,便是“Token工廠”及“Token運營商”的興起。硅基流動的業務負責人形象地指出,從“賣算力”到“賣Token”,對行業的影響巨大。它不僅讓算力服務商擺脫了低水平的資源租賃競爭,更通過與AI Infra廠商合作,將任何算力中心一鍵轉化為能生產高價值Token的“工廠”。而對于中小開發者和創業公司而言,按Token計費極大地降低了試錯成本。
魔形智能相關負責人陸嘉駿也認為,這有望讓更多AI應用創新創業成為可能,大大降低創業門檻,從而開拓出更多潛在的應用市場。“創業公司只需要確定底層的大模型來開發產品,再找token工廠供應token,調用時只需通過API和幾行Python代碼,就能穩定獲得這些模型的能力,把精力聚焦在產品研發上。這就好比以前設計家用電器需要自己配發電機、倒汽油、發電,而現在只需安心設計電器,插頭是標準的,用戶插上就能用。”這種開發范式,將點燃AI應用創新的燎原之火。
▍Token荒與國產算力的重要窗口期
盡管“Token工廠”的模式令人振奮,但現實是:面對指數級增長的需求,算力供給,尤其是高性價比的Token供給,正處于嚴重短缺狀態。
面對如此巨大的市場缺口,國產算力迎來了重要窗口期。多家大模型及行業模型公司已將部分推理能力遷移至國產芯片平臺,一些技術能力較強的企業甚至已基于國產芯片構建了完整的智算集群,并開始對外提供Token化的模型服務。
然而,機遇與挑戰總是并存。硅基流動的業務負責人表示,國產算力距離全面替代英偉達生態仍有差距,挑戰主要體現在三個維度:軟件生態支撐豐富度不足,導致開發者遷移成本高企;CUDA兼容性仍是痛點,國產芯片多采用“兼容CUDA”或“自研編程框架”兩條路線,但前者往往無法做到100%兼容,后者則需要客戶投入額外遷移成本;卡間互聯能力存在代差,PCIe協議在帶寬和延遲上相比NVLink仍有顯著差距,影響大規模集群的訓練效率。
魔形智能陸嘉駿一針見血地指出:“嚴格來說,不是算力供不應求,而是Token供不應求。”他解釋道,按照當前的市場Token價格,一個純商業化的項目如果使用國產芯片來運行,基本上都是虧損的,而高昂的Token生產成本,主要受制于目前國產芯片的性能。
這一觀點得到了來自大模型廠商的印證。DeepSeek在發布其V4預覽版時就坦言,受限于高端算力,其服務吞吐有限,預計要到下半年新一代昇騰芯片批量上市后,價格才會有大幅下調的空間。陸嘉駿將此視為一個信號:“也許從今年下半年到明年,這些國產卡就能跨過盈虧平衡點,從而獲得更大規模的應用。”
CIC灼識董事總經理董曉雅則從市場發展的角度進行了總結。她認為,當前算力市場的供需矛盾,本質上是有效算力供給能力仍然有限,市場真正稀缺的不是賬面上的算力規模,而是“可用、易用、可規模化交付”的有效算力。因此,未來的行業競爭,將從單一芯片性能的比拼,轉向芯片供給、服務器集成、超節點架構、網絡互聯、存儲、推理框架、模型適配、異構調度及應用生態等多環節的協同能力競爭。具備系統級整合能力與場景落地能力的廠商,更有機會在新一輪AI基礎設施重構過程中建立長期競爭優勢。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.