<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      重新思考 AI TCO:為何每 Token 成本才是唯一重要的指標

      0
      分享至


      作者 | 冬梅

      傳統(tǒng)數(shù)據(jù)中心過去主要用于數(shù)據(jù)的存儲、檢索與處理。但在生成式 AI 與代理式 AI 時代,這些設(shè)施已演變?yōu)?AI Token 工廠。隨著 AI 推理成為其核心工作負載,它們的主要產(chǎn)出已轉(zhuǎn)變?yōu)橐?Token 形式制造的智能。

      這一轉(zhuǎn)變也需要對包括總體擁有成本(TCO)在內(nèi)的 AI 基礎(chǔ)設(shè)施的經(jīng)濟效益評估的方式相應(yīng)地進行調(diào)整。然而,在評估 AI 基礎(chǔ)設(shè)施時,企業(yè)仍過于關(guān)注芯片峰值規(guī)格、計算成本,或每美元所能獲得的浮點運算性能,即每美元 FLOPS。

      關(guān)鍵區(qū)別在于:

      • 算力成本是企業(yè)為 AI 基礎(chǔ)設(shè)施所支付的費用,無論是從云服務(wù)提供商租用,還是在本地自建部署。

      • 每美元 FLOPS 衡量的是企業(yè)每投入一美元所獲得的原始算力,但原始算力并不等同于現(xiàn)實世界中的 Token 產(chǎn)出。

      • 每 Token 成本指的是企業(yè)生成并交付每一個 Token 的綜合成本,通常以每百萬 Token 成本來表示。

      前兩者僅是投入指標。但當業(yè)務(wù)圍繞產(chǎn)出運轉(zhuǎn)時,只針對投入優(yōu)化,本質(zhì)上是一種根本性的錯配。

      每 Token 成本決定了企業(yè)能否實現(xiàn) AI 的規(guī)模化盈利。它是唯一能夠直接綜合反映硬件性能、軟件優(yōu)化、生態(tài)系統(tǒng)支持以及實際利用率的 TCO 指標,而 NVIDIA 在這一指標上實現(xiàn)了行業(yè)最低的每 Token 成本。

      能夠降低每 Token 成本的因素有哪些?

      要理解如何優(yōu)化每 Token 成本,首先需要了解用于計算“每百萬 Token 成本”的計算公式。


      在這個公式中,許多評估 AI 基礎(chǔ)設(shè)施的企業(yè)往往只關(guān)注分子項,即每 GPU 每小時成本。對于云部署而言,這對應(yīng)支付給云服務(wù)提供商的小時費用;而對于本地部署,則是通過攤銷自有基礎(chǔ)設(shè)施得到的等效小時成本。然而,降低每 Token 成本的關(guān)鍵在于分母,即最大化實際交付的 Token 產(chǎn)出。

      這個分母傳遞了兩層商業(yè)含義:

      • 最小化每 Token 成本:當 Token 產(chǎn)出增加被代入公式時,將降低每 Token 成本,從而提升每一次交互服務(wù)的利潤空間。

      • 最大化收入:每秒交付更多 Token,也意味著每兆瓦產(chǎn)出更多的 Token,這將帶來更高的智能供給能力,使 AI 驅(qū)動的產(chǎn)品與服務(wù)能夠在相同基礎(chǔ)設(shè)施投入下創(chuàng)造更高收入。

      因此,如果只關(guān)注分子,就會忽視真正決定分母的因素。可以將其理解為一個“推理冰山”:分子位于水面之上,直觀可見且易于橫向比較;而分母則隱藏在水面之下,那才是決定實際 Token 產(chǎn)出的關(guān)鍵因素。對 AI 基礎(chǔ)設(shè)施的準確評估,應(yīng)從探究水面之下的部分開始。


      表層問題:

      • 每 GPU 小時的成本是多少?

      • 峰值 PetaFLOPS 性能和高帶寬內(nèi)存容量是多少?

      • 每美元可獲得多少 FLOPS?

      深度成本分析:

      • 每百萬 Token 的成本是多少?尤其是針對大規(guī)模混合專家(MoE)推理模型(當前部署最廣泛的一類 AI 模型),其每百萬 Token 成本是多少?*

      • 每兆瓦可交付多少 Token 產(chǎn)出?尤其是對本地部署而言,由于在土地、電力與基礎(chǔ)設(shè)施上的資本投入較大,最大化每兆瓦所產(chǎn)生的智能產(chǎn)出至關(guān)重要。*

      • 縱向擴展(scale-up)互連是否能夠支撐 MoE 模型所需的“all-to-all”通信模式?

      • 是否支持 FP4 精度?推理棧是否能夠在保持高精度的同時充分利用 FP4?*

      • 推理運行時是否支持 投機解碼或多 Token 預測,以提升用戶交互體驗?

      • 服務(wù)層是否支持 解耦服務(wù)、KV 感知路由、KV 緩存卸載* 以及其他優(yōu)化?

      • 平臺是否支持代理式 AI 的獨特工作負載需求,包括超低延遲、高吞吐以及長輸入序列長度等?

      • 平臺是否支持從訓練、后訓練到大規(guī)模推理的完整生命周期,并覆蓋所有模型架構(gòu),從而實現(xiàn)基礎(chǔ)設(shè)施可互換性與高利用率?

      這些算法、硬件與軟件化中的每一項優(yōu)化都必須有效并且是可以相互集成的,否則分母項將無法成立。一塊看似“更便宜”的 GPU,如果其每秒 Token 產(chǎn)出數(shù)量明顯更低,反而會導致更高的每 Token 成本。能夠做到全棧真正優(yōu)化的 AI 基礎(chǔ)設(shè)施,才能夠確保每項優(yōu)化都相互增強,從而持續(xù)提升整體效率。

      為什么每 Token 成本比每美元 FLOPS 更重要?

      以下 DeepSeek-R1 AI 模型的數(shù)據(jù)展示了理論指標與實際商業(yè)結(jié)果之間的差異。

      僅從算力成本來看,NVIDIA Blackwell 平臺的成本似乎約為 NVIDIA Hopper 的 2 倍,但算力成本并不能說明這項投入究竟能帶來多少實際產(chǎn)出。如果僅以每美元 FLOPS 進行分析,相較于 NVIDIA Hopper 架構(gòu),NVIDIA Blackwell 僅有約 2 倍優(yōu)勢。然而,實際結(jié)果卻呈現(xiàn)出數(shù)量級差異:Blackwell 每瓦的 Token 產(chǎn)出量是 Hopper 的 50 倍以上,每百萬 Token 的成本降低至其 1/35 左右。


      注:數(shù)據(jù)來源于 NVIDIA 分析報道及 SemiAnalysis InferenceX v2 基準測試。

      這一懸殊差異表明,相較于上一代 Hopper,NVIDIA Blackwell 在商業(yè)價值上實現(xiàn)了巨大的躍遷,其提升幅度遠超系統(tǒng)成本的增加。

      如何選擇合適的 AI 基礎(chǔ)設(shè)施?

      僅憑算力成本或每美元理論 FLOPS 來比較 AI 基礎(chǔ)設(shè)施,不僅是不充分的,也無法真實反映推理經(jīng)濟學。正如數(shù)據(jù)所展示的,要準確評估 AI 基礎(chǔ)設(shè)施的營收潛力與盈利能力,需將衡量維度從輸入指標轉(zhuǎn)向每 Token 成本和實際 Token 產(chǎn)出量。

      NVIDIA 通過在計算、網(wǎng)絡(luò)、內(nèi)存、存儲、軟件以及合作伙伴技術(shù)上的 極致協(xié)同設(shè)計,實現(xiàn)了業(yè)內(nèi)最低的 Token 成本與最高的 Token 吞吐量。此外,諸如 vLLM、SGLang、NVIDIA TensorRT-LLM 以及 NVIDIA Dynamo 等基于 NVIDIA 平臺構(gòu)建的開源推理軟件的持續(xù)優(yōu)化,意味著在現(xiàn)有 NVIDIA 基礎(chǔ)設(shè)施部署后,Token 產(chǎn)出仍可不斷提升,每 Token 成本會持續(xù)下降。

      一些云服務(wù)提供商與 NVIDIA 云合作伙伴,已在規(guī)模化部署中充分體現(xiàn)這一優(yōu)勢。包括 CoreWeave、Nebius、Nscale 與 Together AI 在內(nèi)的合作伙伴,已部署 NVIDIA Blackwell 基礎(chǔ)設(shè)施,并對其技術(shù)棧進行了優(yōu)化,為企業(yè)提供當前最低的 Token 成本,同時充分發(fā)揮 NVIDIA 在硬件、軟件與生態(tài)系統(tǒng)協(xié)同設(shè)計方面的全部優(yōu)勢,使每一次 AI 交互的處理都建立在這一完整體系之上。

      會議推薦

      世界模型的下一個突破在哪?Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發(fā)體系不重構(gòu),還能撐多久?

      AICon 上海站 2026,4 大核心專題等你來:世界模型與多模態(tài)智能突破、Agent 架構(gòu)與工程化實踐、Agent 安全與可信治理、企業(yè)級研發(fā)體系重構(gòu)。14 個專題全面開放征稿。

      誠摯邀請你登臺分享實戰(zhàn)經(jīng)驗。AICon 2026,期待與你同行。

      今日薦文


      你也「在看」嗎?

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      破防!阿森納奪冠夜現(xiàn)悲情一幕,3 人陪跑無獎牌

      破防!阿森納奪冠夜現(xiàn)悲情一幕,3 人陪跑無獎牌

      一隅非生
      2026-05-20 07:06:11
      吉利新車官宣:5月19日,正式上市!

      吉利新車官宣:5月19日,正式上市!

      科技堡壘
      2026-05-19 09:50:17
      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實情

      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實情

      健康科普365
      2026-05-09 21:05:04
      廣州常住人口首破1900萬背后:白云番禺領(lǐng)漲,三區(qū)負增長

      廣州常住人口首破1900萬背后:白云番禺領(lǐng)漲,三區(qū)負增長

      南方都市報
      2026-05-19 16:50:51
      一聲槍響,全球震動!特朗普高調(diào)宣布:斬首成功,我們擊斃了他!

      一聲槍響,全球震動!特朗普高調(diào)宣布:斬首成功,我們擊斃了他!

      鐵血江湖人
      2026-05-20 02:58:29
      京東官宣今年618從5月30日晚8點開始,未來有望實現(xiàn)包裹全流程無人配送直達用戶手中

      京東官宣今年618從5月30日晚8點開始,未來有望實現(xiàn)包裹全流程無人配送直達用戶手中

      極目新聞
      2026-05-18 16:25:23
      侵犯公民人身自由國家賠償金,最新標準公布

      侵犯公民人身自由國家賠償金,最新標準公布

      南方都市報
      2026-05-19 14:45:00
      特斯拉放棄印度建廠

      特斯拉放棄印度建廠

      新浪財經(jīng)
      2026-05-19 16:29:08
      塔帥擊碎質(zhì)疑 執(zhí)教7年終登頂英超 復制溫格足跡 44歲奪冠緊追穆帥

      塔帥擊碎質(zhì)疑 執(zhí)教7年終登頂英超 復制溫格足跡 44歲奪冠緊追穆帥

      我愛英超
      2026-05-20 05:55:30
      就她了!神舟二十三號三人組預測,港產(chǎn)女載荷專家首秀將打破紀錄

      就她了!神舟二十三號三人組預測,港產(chǎn)女載荷專家首秀將打破紀錄

      日不西沉
      2026-05-20 03:26:27
      《主角》黃正經(jīng)升局長,米蘭嫁人,才懂楚嘉禾示好易青娥多憋屈

      《主角》黃正經(jīng)升局長,米蘭嫁人,才懂楚嘉禾示好易青娥多憋屈

      八斗小先生
      2026-05-19 11:13:46
      母子同床15年?狄鶯終于將寶貝兒子送進了監(jiān)獄!

      母子同床15年?狄鶯終于將寶貝兒子送進了監(jiān)獄!

      新民周刊
      2026-05-18 14:05:28
      圓夢時刻,漢密爾頓轉(zhuǎn)發(fā)球隊海報祝賀阿森納奪冠:COYG!

      圓夢時刻,漢密爾頓轉(zhuǎn)發(fā)球隊海報祝賀阿森納奪冠:COYG!

      懂球帝
      2026-05-20 06:57:10
      1996年16歲的柳巖,在廣州一所中專學校就讀護理專業(yè)期間拍的照片

      1996年16歲的柳巖,在廣州一所中專學校就讀護理專業(yè)期間拍的照片

      戶外阿毽
      2026-05-19 13:00:42
      韓媒:朝鮮女足粗魯無禮!她們和中國隊擊掌問候,卻拒與日韓握手

      韓媒:朝鮮女足粗魯無禮!她們和中國隊擊掌問候,卻拒與日韓握手

      劉哥談體育
      2026-05-19 13:00:15
      烏克蘭打擊莫斯科,魏德爾嚇壞了,她怒斥烏克蘭襲擊俄羅斯本土!

      烏克蘭打擊莫斯科,魏德爾嚇壞了,她怒斥烏克蘭襲擊俄羅斯本土!

      開著車去流浪
      2026-05-20 00:40:17
      年僅54歲!武漢協(xié)和冷松因病醫(yī)治無效去世

      年僅54歲!武漢協(xié)和冷松因病醫(yī)治無效去世

      華醫(yī)網(wǎng)
      2026-05-19 15:21:37
      勇士隊傳聞:內(nèi)部人士承認今夏補強陣容對抗雷霆和馬刺“不現(xiàn)實”

      勇士隊傳聞:內(nèi)部人士承認今夏補強陣容對抗雷霆和馬刺“不現(xiàn)實”

      好火子
      2026-05-20 05:00:02
      西方媒體證實:中國飛弩-16現(xiàn)身俄烏戰(zhàn)場,攔截成功率70%

      西方媒體證實:中國飛弩-16現(xiàn)身俄烏戰(zhàn)場,攔截成功率70%

      流年顛簸
      2026-05-20 02:55:43
      丑人多作怪?被“網(wǎng)暴”多年后傅首爾終于急了,怪不得網(wǎng)友嘴太毒

      丑人多作怪?被“網(wǎng)暴”多年后傅首爾終于急了,怪不得網(wǎng)友嘴太毒

      琴琴有氧運動
      2026-05-19 04:47:56
      2026-05-20 07:40:49
      AI前線 incentive-icons
      AI前線
      面向AI愛好者、開發(fā)者和科學家,提供AI領(lǐng)域技術(shù)資訊。
      1509文章數(shù) 149關(guān)注度
      往期回顧 全部

      科技要聞

      馬斯克敗訴,法院判他起訴OpenAI太晚了

      頭條要聞

      伊朗最新和平方案披露 濃縮鈾只能運往俄羅斯

      頭條要聞

      伊朗最新和平方案披露 濃縮鈾只能運往俄羅斯

      體育要聞

      文班亞馬:沒拿到MVP,就證明自己是MVP

      娛樂要聞

      姚晨刪博難平眾怒,為什么她還能蹦噠

      財經(jīng)要聞

      白酒榜|汾酒營收凈利雙增 口子窖"造富"

      汽車要聞

      煥新極氪009上市41.38萬起 齊家版讓MPV回歸家庭

      態(tài)度原創(chuàng)

      家居
      本地
      房產(chǎn)
      數(shù)碼
      公開課

      家居要聞

      觀山隱秀 心靈沉淀

      本地新聞

      別搜晉江小說了,去看真的晉江

      房產(chǎn)要聞

      7516元/㎡,161套一次全甩!海口住宅最低價出現(xiàn)了!

      數(shù)碼要聞

      谷歌Google TV整合Gemini,提升內(nèi)容發(fā)現(xiàn)、改善瀏覽交互

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 亚洲精品影院| 伊人不卡网| 四虎成人精品在永久在线 | 亚洲中文字幕日产无码| 国产成人高清精品免费软件| 国精品无码一区二区三区左线| 少妇无码一区二区三区免费 | 日韩在线专区| 亚洲成a人片在线观看中| 日本韩国日韩少妇熟女少妇 | 麻豆tv入口在线看| 欧美人妻中文| 福利视频导航网站| 亚洲成在人线在线播放无码| 99riav精品免费视频观看| 国产男女嘿咻视频在线观看| 九九热在线视频观看最新| 亚洲成a人片在线不卡一二三区| 国产福利一区二区精品免费| 羞羞影院午夜男女爽爽免费视频| 亚洲色精品国产一区二区三区| 久久久99久久久国产自输拍| 亚洲成A人片在线观看无码不卡| 国产乱人伦精品| 欧美变态口味重另类一区二区| 国产成人亚洲精品狼色在线| 99日本精品永久免费久久| 久久久久蜜桃精品成人片| 福利一区二区在线播放| 在线无码不卡app| 亚洲AV蜜桃永久无码精品| 中文文字幕文字幕亚洲色| 亚洲成在人线在线播放无码| 91欧美在线久久一区黄瓜| 东京热综合网| 亚洲综合一区二区三区不卡| 成人福利一区二区视频在线| 精品国产乱码久久久软件下载| 日韩天码| 日韩毛片在线视频x| 老男人久久青草av高清|