<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      下一個智能服務風口:Token工廠行業模式解析

      0
      分享至


      核心觀點:

      • Token工廠的提出,引發了學術界和產業界極大的關注。當前,對AI基礎設施的討論仍沿用“數據中心”“算力中心”這樣的傳統概念。但是這些概念是無法精準的描述token工廠的。事實上,token工廠正在成為AI世界的基礎貨幣。但圍繞它的生產、定價、交易、消耗等內容都處于初期階段,尚未成型。

      • Token的生產是token工廠的核心目標,不再是泛泛的計算或存儲,而是聚焦于AI模型推理與訓練所產生Token。

      • Token工廠的運營成本中,電力占比可達50-70%,其次是芯片折舊、液冷散熱、網絡互聯和運維人力。與功耗產出對應,單位Token成本與單位功耗產出成反比——功耗產出越高,單位Token成本越低。

      • 現實層面看,token工廠的能源策略對于電力能源的要求極高,傳統研究視角將算力和電力視為獨立的兩個問題,但是token工廠的運行模式,兩者必須作為一個耦合系統來研究。電力系統如何配合與供應成為了當前的關注點。


      (1)行業定義概念界定

      Token工廠(token factory)是指大規模、高效率、低成本生產token為核心目標,通過算—電—熱—網深度協同的技術架構,電力、芯片、數據等輸入要素轉化為標準化智能服務輸出(token)的新型基礎設施

      Token的生產是token工廠的核心目標,不再是泛泛的計算或存儲,而是聚焦于AI模型推理與訓練所產生Token。它更強調工業化的規模經濟效應,實現高效率、低成本的生產模式。將計算、電力、散熱、網絡視為一個有機整體進行優化,而非割裂的子系統。對于Token工廠來說,電力、芯片和數據才是他的原材料,產出可計量、可定價、具有交易屬性的Token則是它的產出物,也就是為客戶提供標準化的智能服務(Token)。

      相較于傳統的數據中心、算力中心,Token工廠的核心是“生產token”這個工業化過程,而不僅僅是提供計算資源。

      具體區別如下:

      表格1 Token工廠與傳統數據中心、算力中心的對比


      數據來源:公開資料,融中研究

      (2)市場規模及競爭格局

      1)行業市場規模

      Token工廠目前還沒有官方統計口徑,這一概念是英偉達在2026年的GTC大會上正式提出的。因此,融中研究根據Token消耗量、AI推理市場、AI數據中心市場等不同口徑來進行市場規模推測。

      消耗端:根據國家數據局披露的數據,中國日均Token調用量從2024年初的1000億增長到2026年3月的140萬億,兩年增長超過1000倍。

      產業端:2026年3月,阿里云、百度智能云、騰訊云等相繼上調AI算力相關產品價格,部分模型Token計費漲幅超過400%。英偉達預測2026-2027年全球AI算力采購訂單積壓規模將突破1萬億美元。阿里宣布未來三年投入超千億元用于云和AI硬件基礎設施建設。

      2)競爭格局

      作為2026年3月英偉達GTC大會上正式提出的新概念,token工廠的競爭格局正在快速形成中。英偉達CEO黃仁勛在GTC 2026大會上明確指出,AI競爭的核心已從模型訓練轉向Token生產效率(即推理)。衡量標準不再是“峰值算力”,而是“每瓦token吞吐量”和“每百萬token成本”。

      從全球來看,中美走向兩條側重不同的發展道路。美國側重于前沿突破,驅動力來自資本與頂尖研發的良性循環。目前,英偉達Vera Rubin平臺七顆芯片全部投產,從3nm走向1.6nm,從地面延伸至太空,從GPU擴展至LPU。

      中國則更重視向深處扎根,驅動力來自國家戰略和產業升級的現實需求。應用空間廣闊,工業場景和商業鏈路完整,要優先解決算力如何真正用起來。

      Token工廠概念的提出,使得AI行業內的企業更加清晰了自己的行業定位,同時也開始了進一步的行業布局。英偉達的角色不再是單純的芯片供應商,而是token工廠的全棧方案提供商。芯片層的競爭正在從單性能芯片轉向系統解決方案。從云服務和模型層來看,調用量排名前十中,中國模型占據四席并包攬前三名:MiniMax M2.5、階躍星辰Step 3.5 Flash、DeepSeek V3.2,Kimi K2.5位列第九,中國模型的核心競爭力在于極致性價比——Token價格僅為國外競品的1/6至1/10。

      (3)產業鏈圖譜

      Token工廠產業鏈的傳導邏輯是:下游應用爆發,大模型、AI智能體等的大規模應用,使得Token需求激增,從而導致算力開始漲價,上游硬件開始擴產。

      表格2 Token工廠產業鏈梳理


      數據來源:公開資料,融中研究

      注:電力供應環節因企業較為分散(如核電、綠電、電網調度等),且此前未列出具體代表企業,故暫未納入表格。如有需要,可補充國家電網、南方電網、中廣核等。

      (4)影響與意義

      Token工廠的出現,標志著AI產業從“模型競賽”轉向“生產競賽”,價值錨點從模型智能水平轉移至Token的生產效率與成本。模型正從稀缺品變為大宗商品,競爭焦點變為“誰生產Token更快、更便宜、更穩定”,AI由此從實驗室經濟走向工廠經濟。同時,能源與算力深度耦合,“算電協同”成為新范式:電力從成本項升級為戰略資源,占比高達50-70%,Token工廠通過柔性負載調度、自建微電網甚至捆綁核電,將算力從“云”變為與地理、能源、電網綁定的重資產,徹底改寫了數據中心選址與運營邏輯。

      全球競爭格局正被重塑,Token成為新型戰略商品。中國憑借極致性價比,在Token調用量上已反超美國,形成“Token出海”這一智能服務出口模式,中美分化出自主可控與前沿技術兩條路徑。經濟模式上,Token演變為可計價、可交易的“智能貨幣”,黃仁勛提出五級定價模型,商業模式從“賣資源”(按卡時)升級為“賣產品”(按Token),2026年集體漲價潮宣告賣方市場來臨。垂直整合與重資產化成為巨頭戰略,Token工廠使AI真正成為千行百業的生產力工具,開啟了智能的工業化大生產時代。


      (1)生產核心:芯片與集群

      1)芯片

      從“單芯片性能競賽”轉向“全棧系統級協同”。芯片不再是孤立元件,而是與互聯、存儲、網絡深度綁定的平臺化解決方案。

      表格3 關鍵玩家與策略


      數據來源:融中研究

      2)集群

      當集群從千卡邁向萬卡/十萬卡,芯片間通信效率成為整體算力利用率的關鍵瓶頸。供電、散熱、網絡拓撲、與電網協同共同決定系統上限。

      表格4 集群架構分層


      數據來源:融中研究

      (2)生產流程

      1)輸入階段

      Token工廠的輸入主要包括三類核心資源:電力、數據、算力基礎設施。

      表格5 Token工廠的輸入


      數據來源:融中研究

      輸入環節的競爭已從“單純堆砌算力”升級為“算-電-熱-網”四位一體的資源整合能力。誰能以更低成本獲得穩定電力和高質量數據,誰就占據Token生產的成本優勢。

      2)加工階段

      加工環節是將輸入轉化為Token的核心過程,分為訓練和推理兩大階段,目前重心正從訓練向推理遷移。

      表格6 Token的加工環節


      數據來源:融中研究

      最新架構趨勢:

      Prefill-Decode分離:英偉達將推理拆分為預填充(GPU負責)和解碼(Groq LPU負責),延遲降至0.1毫秒以下,性能提升35倍。

      MoE(混合專家模型):僅激活部分參數,大幅降低推理成本。DeepSeek等模型已廣泛應用。

      投機解碼:用小模型快速生成候選Token,大模型并行驗證,顯著提升推理速度。

      加工環節正從“通用計算”走向“場景化分工”。不同模型架構、不同任務類型需要定制化的計算流水線,單一芯片難以包攬全局。

      3)輸出階段

      輸出環節是將加工產生的Token封裝為可交付、可計價的標準化產品,并通過API或應用層送達用戶。

      表格7 Token的輸出環節


      數據來源:融中研究

      輸出環節的本質是將無形的“智能”轉化為可交易的商品。Token作為標準化計量單位,使AI服務能夠像水電一樣按需付費,極大地降低了應用門檻。

      (3)核心生產效率指標

      Token工廠的核心生產效率指標是衡量其競爭力的關鍵標尺。與傳統數據中心看重資源利用率(如CPU利用率、存儲利用率)不同,Token工廠的價值產出完全圍繞“Token”展開——評價標準已從“擁有多少芯片”轉變為“每瓦能耗能產出多少高質量Token”。

      1)單位功耗產出

      核心指標定義:Tokens per second per watt(每秒每瓦產出的Token數),或更宏觀的Tokens per second per megawatt(每兆瓦每秒產出的Token數)。這一指標直接反映了Token工廠將電力轉化為智能產品的核心生產效率。

      背景與意義:AI數據中心的能耗正以驚人的速度攀升,供電能力、散熱可持續性、網絡拓撲效率乃至與公共電網的協同能力,開始共同決定整個系統的上限。因此,“每瓦Token產出效率(Token per Watt)”正取代傳統的峰值算力與單卡性能,成為新的核心KPI。這意味著評價對象已經從“芯片”轉向“系統”——供電、冷卻、網絡、調度乃至建筑交付周期,都會被納入同一個經濟模型進行統一優化。

      提升單位功耗產出的核心路徑已從芯片優化擴展到“算-電-熱-網”四位一體的協同優化。英偉達在GTC 2026上推出了Vera Rubin DSX AI Factory參考設計,其核心目標就是實現“每瓦最大Token產出”。該參考設計覆蓋計算、網絡與存儲,并配套開放、模塊化、可組合的軟件棧,將集群硬件與供電、冷卻系統聯動起來,從而在整體層面獲取更高的Token per watt。

      2)單位成本產出

      核心指標定義:Cost per million tokens(每百萬Token的成本),以及Token吞吐量帶來的每GPU每秒Token數(TPS per GPU)所對應的總擁有成本(TCO)。它直接決定了Token工廠的盈利能力和市場競爭力。

      成本構成:Token工廠的運營成本中,電力占比可達50-70%,其次是芯片折舊、液冷散熱、網絡互聯和運維人力。與功耗產出對應,單位Token成本與單位功耗產出成反比——功耗產出越高,單位Token成本越低。

      表格8 定價體系:Token作為“智能貨幣”


      數據來源:融中研究

      單位成本產出是Token工廠的“利潤核心”。在固定功耗下,誰的每瓦Token產出更高,誰的Token成本就更低,誰就能獲得更高的利潤空間。分級定價體系將Token從技術術語轉變為可計價、可交易的商品,使AI服務能夠像水電一樣按需付費,極大地降低了應用門檻。

      3)時間效率

      核心指標定義:Token吞吐量(Tokens per second,TPS)、首Token延遲(Time To First Token,TTFT)、每Token生成時間(Time Per Output Token,TPOT)。這些指標直接決定了用戶體驗和AI系統的可用性。

      吞吐量基準(Tokens per Second)

      吞吐量是Token工廠在單位時間內能夠生成的Token總數,決定了系統能同時服務多少用戶請求。

      AMD MLPerf突破:2026年4月,AMD在MLPerf Inference v6.0基準測試中首次突破每秒100萬Token的吞吐量里程碑,在Llama 2 70B和GPT-OSS-120B等模型上均達到百萬級Token/秒的性能。AMD MI355X單GPU在Llama 2 70B上實現100,282 Token/秒,是上一代MI325X的3.1倍。

      英偉達Blackwell Ultra:GB300 NVL72的最大單GPU吞吐量達到226.2 Token/秒,比上一代GB200有顯著提升。GB300在延遲敏感型工作負載上的性能提升約1.4-1.5倍,延遲改善約1.58倍。

      極致案例:字節跳動豆包的日均Token消耗量已達120萬億Token,折合每秒并發處理約13.9億Token。這已不是實驗室壓力測試,而是真實生產環境的持續負載,代表了Token工廠吞吐能力的極限邊界。

      延遲指標(TTFT與TPOT)

      首Token延遲(TTFT):從用戶發送請求到收到第一個Token的時間。對于交互式應用(如聊天機器人),這是最關鍵的體驗指標。Lambda等廠商通過Smart Expert Routing技術將TTFT的P99延遲降低了31%。

      Prefill-Decode分離:英偉達將推理拆分為預填充(Prefill,GPU負責)和解碼(Decode,Groq LPU負責),通過分工協作將延遲降至0.1毫秒以下,推理性能提升35倍。

      表格9 三大指標的聯動關系


      數據來源:融中研究


      (1)成本結構

      表格10 Token工廠成本結構


      數據來源:融中研究

      電力成本是Token工廠最大的單項支出,占比過半且持續上升。控制Token成本的核心在于提升“每瓦Token產出效率”,而非單純壓降電價。自建微電網、捆綁核電、液冷普及是主要降本手段。

      (2)收入模式(定價方式)

      表格11 Token工廠收入模式


      數據來源:融中研究

      Token已成為可計價的“智能貨幣”,收入模式從單一按量計費走向分層定價。頭部云廠商通過漲價(2026年3月漲幅30%-400%)掌握了定價權,市場進入賣方市場。未來收入增長依賴智能體驅動的Token消耗量指數級上升。

      (3)商業模式

      表格12 Token工廠商業模式


      數據來源:融中研究

      Token工廠推動商業模式從“賣資源”向“賣智能”升級,垂直整合成為巨頭首選。英偉達從芯片商轉型為“AI工廠架構師”,阿里、字節則打通從生產到應用的全鏈條。未來可能出現專業化的Token生產商與交易平臺,進一步細化分工。

      Token工廠的經濟本質是將電力、芯片、數據轉化為可交易的智能商品。成本端以電力為核心瓶頸,收入端依賴Token分層定價與消耗量增長,商業模式正從資源出租走向智能產品交付。三者協同決定了Token工廠的盈利能力和競爭壁壘。


      (1)電力供應側

      電力供給側的挑戰:從“成本項”到“產能瓶頸”的質變

      Token工廠的電力需求已從傳統數據中心的數十兆瓦躍升至數百兆瓦乃至吉瓦級,電力不再是可替代的運營成本,而是決定Token總產量的“硬天花板”。更嚴峻的是,AI芯片對電壓波動極度敏感,而風光綠電的間歇性與Token工廠7×24小時連續生產的要求形成根本矛盾。部分地區電網容量已耗盡,新建Token工廠面臨“有GPU、無供電”的尷尬。黃仁勛直言:“數據中心受電力限制,1GW工廠永遠不會變成2GW。”電力供給側正成為制約AI產業擴張的最短木板。

      (2)解決方案:算電協同

      算電協同的解決方案:從“被動用電”到“柔性共生”

      破解電力瓶頸的關鍵在于讓Token工廠與電力系統深度協同,而非單向依賴。一方面,工廠作為“柔性負載”,可根據電網電價和綠電波動動態調整算力分配——電價低時全力訓練模型,電價高時僅維持推理服務;另一方面,頭部企業正自建微電網,捆綁核電(微軟重啟三哩島)、地熱(谷歌)等穩定清潔能源,甚至部署小型模塊化反應堆(SMR)實現“離網運行”。液冷普及和余熱回收進一步提升了能源利用效率,使Token工廠從“電老虎”轉型為電網的“調峰伙伴”。

      (3)未來趨勢

      Token工廠未來的發展趨勢:從“算力堆砌”到“系統效率”的終極競爭

      未來Token工廠的競爭將圍繞三大趨勢展開:一是推理主導,隨著AI智能體爆發,推理算力占比將超60%,低延遲、高吞吐的推理專用芯片(如LPU)和Prefill-Decode分離架構成為新焦點;二是能效為王,每瓦Token產出(Token per Watt)取代峰值算力成為核心KPI,液冷、CPO互聯、算電協同等系統級優化決定生死;三是垂直整合與分化并存,巨頭自建全鏈條Token工廠(如阿里ATH),而中小玩家轉向專業化分工(算力租賃、Token交易平臺)。最終,Token將像水電一樣成為普惠智能服務,其生產成本無限逼近物理極限——電力轉化效率。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      尺度拉滿,Netflix把A片之王搬上了熒幕

      尺度拉滿,Netflix把A片之王搬上了熒幕

      來看美劇
      2026-05-06 16:54:02
      尷尬!俞敏洪與陳行甲的公開互動爭議升級,堪稱董宇輝事件的復刻

      尷尬!俞敏洪與陳行甲的公開互動爭議升級,堪稱董宇輝事件的復刻

      火山詩話
      2026-05-09 06:34:45
      女上司看到我辭呈后,神色錯愕:我不是給你發了420萬年終獎勵嗎

      女上司看到我辭呈后,神色錯愕:我不是給你發了420萬年終獎勵嗎

      云端小院
      2026-05-09 07:35:01
      加州州長決定參選總統,并怒斥特朗普:“把美國的未來賣給中國”

      加州州長決定參選總統,并怒斥特朗普:“把美國的未來賣給中國”

      雨諾翛翛
      2026-05-09 08:37:07
      上海老破小掛牌量大跳水....

      上海老破小掛牌量大跳水....

      林子說事
      2026-05-09 02:10:11
      虧損3900萬的服裝廠靠吳宜澤一夜逆襲,金利來借此實現盈利轉機?

      虧損3900萬的服裝廠靠吳宜澤一夜逆襲,金利來借此實現盈利轉機?

      戶外釣魚哥阿旱
      2026-05-08 13:35:15
      湖人107-125慘敗雷霆,0-2落后!誰是輸球罪魁禍首?數據不會說謊

      湖人107-125慘敗雷霆,0-2落后!誰是輸球罪魁禍首?數據不會說謊

      籃球掃地僧
      2026-05-08 13:02:06
      被美國人斷言,將從地圖消失的中國縣城,正被近4萬中國姑娘救活

      被美國人斷言,將從地圖消失的中國縣城,正被近4萬中國姑娘救活

      像夢一場a
      2026-05-09 07:27:35
      意媒丨表現糟糕的他本賽季沒機會了

      意媒丨表現糟糕的他本賽季沒機會了

      米蘭圈
      2026-05-09 09:12:29
      特朗普訪華陣容大縮水!僅十幾家美企隨行,釋放關鍵信號

      特朗普訪華陣容大縮水!僅十幾家美企隨行,釋放關鍵信號

      縱擁千千晚星
      2026-05-08 22:07:16
      曝王暖暖凌晨被送往醫院搶救!全身浮腫、滿臉脹紅,昏迷原因曝光

      曝王暖暖凌晨被送往醫院搶救!全身浮腫、滿臉脹紅,昏迷原因曝光

      動物奇奇怪怪
      2026-05-08 17:16:36
      6月1日正式施行!全國工地用工新規,明確60歲以上農民上崗標準

      6月1日正式施行!全國工地用工新規,明確60歲以上農民上崗標準

      丁丁鯉史紀
      2026-05-08 14:50:31
      倫敦世乒賽名場面,裁判破例行紳士禮,孫穎莎憑實力獲最高禮遇

      倫敦世乒賽名場面,裁判破例行紳士禮,孫穎莎憑實力獲最高禮遇

      往史過眼云煙
      2026-05-09 10:25:34
      內訌后加速換帥!皇馬高層終于醒悟,穆里尼奧將回歸,姆巴佩笑了

      內訌后加速換帥!皇馬高層終于醒悟,穆里尼奧將回歸,姆巴佩笑了

      祥談體育
      2026-05-08 16:51:26
      別再亂插電視HDMI接口了1、2、3不是隨便用,插錯萬元電視也白費

      別再亂插電視HDMI接口了1、2、3不是隨便用,插錯萬元電視也白費

      輝哥說動漫
      2026-05-08 13:13:02
      松下突然冒出一臺神秘新機?DC-L10疑似要來了!

      松下突然冒出一臺神秘新機?DC-L10疑似要來了!

      相機Beta
      2026-05-07 20:03:17
      美國公布大量UFO照片

      美國公布大量UFO照片

      新浪財經
      2026-05-09 09:13:30
      山東女子榴蓮僅退款被拘10日,商家上門致全家社死

      山東女子榴蓮僅退款被拘10日,商家上門致全家社死

      別甾虛僞
      2026-05-09 05:28:11
      美媒終于意識到,中國人不期待特朗普訪華,已不把美國放在眼里

      美媒終于意識到,中國人不期待特朗普訪華,已不把美國放在眼里

      靚仔情感
      2026-05-09 01:38:15
      普通家庭存款到這個數,已經是天花板級別,之前不信,現卻很肯定

      普通家庭存款到這個數,已經是天花板級別,之前不信,現卻很肯定

      天天熱點見聞
      2026-05-09 09:56:18
      2026-05-09 10:55:00
      融資中國 incentive-icons
      融資中國
      股權投資與產業投資媒體平臺
      7444文章數 21337關注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協議

      頭條要聞

      "4只皮皮蝦1035元"當事人注銷賬號 隔壁海鮮店發聲

      頭條要聞

      "4只皮皮蝦1035元"當事人注銷賬號 隔壁海鮮店發聲

      體育要聞

      他把首勝讓給隊友,然后用一年時間還清賬單

      娛樂要聞

      張藝謀《印象劉三姐》全裸鏡頭引爭議

      財經要聞

      白宮:特朗普計劃5月14日至15日訪問中國

      汽車要聞

      全系智能泊車 鉑智3X年款升級限時權益價9.48萬起

      態度原創

      家居
      健康
      親子
      房產
      公開課

      家居要聞

      流動的尺度 打破家的形式主義

      干細胞能讓人“返老還童”嗎

      親子要聞

      3歲娃頭纏紗布守母,百萬人點贊,我卻倍感心寒

      房產要聞

      豪擲6.8億拿地!何猷君大手筆投資三亞!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日本一区二区在线播放观看| 亚洲 成人 无码 在线观看| 狼友福利网站| 99视频偷窥在线精品国自产拍| 一区二区三区不卡国产| 非产精品二区| 熟女在线国产| 亚洲人成电影网站 久久影视| AVwww.333.rain.无码一区二区| 岛国中文字幕一区二区| 少妇又爽又刺激视频| 一本久久88色| 久久99国产伦精品免费| 亚洲蜜臀av乱码久久| 2022国产精品福利在线观看| 1769国内精品视频在线播放| 成人午夜免费无码视频在线观看| 亚州成人| avav免费入口| 亚洲色无码专区一区| 亚洲av成人三区国产精品| 久久久久欧美精品| 国产精品手机在线观看你懂的| 一区二区三区四区五区黄色| 亚洲一区二区三区激情在线 | 国产精品 自在自线| av一区二区三区| 麻豆蜜桃视频| 熟女在线播放| 久久精品一偷一偷国产| 风韵丰满熟妇啪啪区老熟熟女| 国产亚洲精品综合-黄色永久免费-成人AV| 尤物国产精品福利在线网| 亚洲国产成人久久综合电影| 色综亚洲国产VV在线观看| 亚洲中文字幕无码中字| 99久久婷婷国产综合精品青草五月 | 欧美精品99久久久| 亚洲国产成人一区二区三区| 欧美成人午夜在线观看视频| 大屁股国产白浆一二区|