![]()
![]()
作者:李南南
來(lái)源:羅輯思維(ID:luojisw)
導(dǎo)讀:今天我們從一個(gè)詞說(shuō)起:Token。
3月17日凌晨,在2026年的英偉達(dá)GTC大會(huì)上,黃仁勛照例做了兩個(gè)小時(shí)的長(zhǎng)篇發(fā)言。其中涉及的話題很多,比如,對(duì)未來(lái)市場(chǎng)需求的預(yù)測(cè),黃仁勛認(rèn)為到2027年,英偉達(dá)的訂單需求將達(dá)到1萬(wàn)億美元。再比如,他說(shuō)未來(lái)SaaS已死,智能體的世代將全面來(lái)臨,等等。
但是,在整場(chǎng)演講里,出現(xiàn)頻次最高的,是另外一個(gè)詞,Token。清華大學(xué)的楊斌教授做了個(gè)統(tǒng)計(jì),整場(chǎng)演講,Token這個(gè)詞出現(xiàn)了超過(guò)70次。
01
Token到底是什么?
不只是黃仁勛。
就在GTC開(kāi)幕當(dāng)天,阿里巴巴宣布成立Token事業(yè)群。注意,這是和淘天電商、阿里云平級(jí)的核心事業(yè)群。阿里CEO吳泳銘在內(nèi)部說(shuō):AI Agent極度依賴Token,未來(lái)將進(jìn)入需求大爆炸時(shí)期。
假如你現(xiàn)在看各類(lèi)關(guān)于AI的文章,你會(huì)發(fā)現(xiàn)Token這個(gè)詞的出現(xiàn)頻次極高。黃仁勛甚至還提出了一個(gè)概念,叫Token工廠經(jīng)濟(jì)學(xué),我們可以簡(jiǎn)稱為“Token經(jīng)濟(jì)學(xué)”。
換句話說(shuō),至少在黃仁勛看來(lái),圍繞Token,已經(jīng)延伸出了一整套生產(chǎn)行為,一整套經(jīng)濟(jì)活動(dòng)。
那么,具體來(lái)說(shuō),這套經(jīng)濟(jì)活動(dòng)是什么呢?我們又該怎么理解黃仁勛說(shuō)的Token經(jīng)濟(jì)學(xué)呢?
首先,什么是Token?這點(diǎn)估計(jì)大多數(shù)人都熟悉,它是一個(gè)語(yǔ)言的計(jì)量單位,很多人把它翻譯成“詞元”。也就是AI能理解、處理、輸出的最小信息單元。
比如,你問(wèn)ChatGPT:“今天天氣怎么樣?”這句話會(huì)被切成幾個(gè)Token。“今天”是一個(gè)Token,“天氣”是一個(gè)Token,“怎么樣”可能被切成兩個(gè)Token,問(wèn)號(hào)是一個(gè)Token。
但是注意,Token跟“字符”最主要的區(qū)別之一,在于字符的大小是統(tǒng)一且確定的,1個(gè)漢字就是1個(gè)字符。但Token不一樣,有的模型可能把“今天”當(dāng)成1個(gè)Token,而有的模型會(huì)把它拆成“今”和“天”兩個(gè)Token。所以,同樣一句話,在不同的AI里,對(duì)應(yīng)的Token數(shù)量可能不一樣。
同樣,在AI看來(lái),你給出的所有提示詞都是一堆大小不等的Token。它輸出給你的答案,在它的標(biāo)準(zhǔn)里,也是一堆大小不等的Token。
02
Token為什么重要?
這個(gè)過(guò)程不難理解,估計(jì)多數(shù)人都知道。那么,我們知道Token是什么之后,最關(guān)鍵的問(wèn)題來(lái)了:Token為什么重要?
第一,Token是AI的成本單位。
你用ChatGPT的API,OpenAI怎么收費(fèi)?按Token。輸入多少Token,收多少錢(qián);輸出多少Token,再收多少錢(qián)。
黃仁勛在這次GTC演講中,專門(mén)講了Token的分層定價(jià)。他把Token分成了幾個(gè)檔次:最便宜的是免費(fèi)層,高吞吐但響應(yīng)慢,主要靠廣告變現(xiàn);往上是中級(jí)層,大約每百萬(wàn)Token收3美元;再往上是高級(jí)層,每百萬(wàn)Token收6美元;再往上是高速層,每百萬(wàn)Token 45美元;最貴的是超高速層,每百萬(wàn)Token 150美元。
你看,從3美元到150美元,差了50倍。差別在哪?在響應(yīng)速度,回答質(zhì)量,還有處理的上下文長(zhǎng)度。
比如,同樣是讓AI幫你寫(xiě)一段代碼,消耗同樣多的Token,但你可以選擇不同檔次的處理服務(wù)。便宜的服務(wù),每百萬(wàn)Token收3美元,可能要等幾秒鐘,而且回答質(zhì)量一般;貴的服務(wù),每百萬(wàn)Token收150美元,幾乎實(shí)時(shí)響應(yīng),輸出質(zhì)量也更高。就像快遞,同樣一個(gè)包裹,普通快遞便宜但慢,同城當(dāng)日達(dá)貴但快。
換句話說(shuō),Token的處理正在變成一種分層定價(jià)的服務(wù),就好比,出行的時(shí)候你是選擇綠皮火車(chē)還是飛機(jī)高鐵。
第二,Token是AI的效率單位。
黃仁勛在演講中提到一組數(shù)據(jù):過(guò)去兩年,AI推理計(jì)算量增長(zhǎng)了大約一萬(wàn)倍。一萬(wàn)倍是什么概念?相當(dāng)于每年增長(zhǎng)100倍。這種增速,在人類(lèi)歷史的任何生產(chǎn)資料上,幾乎沒(méi)有先例。
在這個(gè)背景下,黃仁勛說(shuō):數(shù)據(jù)中心正在變成“Token工廠”。什么意思?你看,以前衡量一個(gè)數(shù)據(jù)中心,你看它的存儲(chǔ)容量多大、算力多少。以后衡量一個(gè)AI數(shù)據(jù)中心,核心指標(biāo)是:每秒能生產(chǎn)多少Token?
就像衡量一個(gè)鋼鐵廠,你不問(wèn)它廠房多大,你問(wèn)它年產(chǎn)多少噸鋼。數(shù)據(jù)中心的“噸鋼”,就是Token。
英偉達(dá)最新發(fā)布的芯片架構(gòu),核心賣(mài)點(diǎn)之一就是“Token生產(chǎn)效率”。同樣的電力消耗,新芯片能比上一代多生產(chǎn)好幾倍的Token。
第三,Token正在成為“新貨幣”。
黃仁勛在演講里說(shuō):“未來(lái)科技公司招聘工程師,除了薪資還會(huì)提供Token配額。”你看,現(xiàn)在科技公司的工程師,工作離不開(kāi)AI。寫(xiě)代碼要問(wèn)AI,調(diào)試要問(wèn)AI,測(cè)試要用AI生成數(shù)據(jù),文檔要AI幫忙寫(xiě)。每一次調(diào)用都消耗Token,而Token要花錢(qián)。
如果公司不給你Token,你就沒(méi)法高效工作,效率就會(huì)下降。
所以黃仁勛預(yù)測(cè):Token配額會(huì)成為薪酬的一部分。就像現(xiàn)在公司給你配電腦、配手機(jī)一樣,以后會(huì)給你配Token額度。比如,“月薪5萬(wàn),另加每月1000萬(wàn)Token調(diào)用額度”。事實(shí)上,目前硅谷的一些科技公司,已經(jīng)開(kāi)始給員工分配Token配額了。
這也就意味著,“Token效率”可能成為新時(shí)代的核心能力。同樣是用AI,有人一個(gè)Token都不浪費(fèi),精準(zhǔn)地獲得想要的結(jié)果;有人噼里啪啦打一堆,來(lái)來(lái)回回改半天,還是不滿意。
寫(xiě)提示詞的水平越高,Token的投入產(chǎn)出比就越高。這就是所謂的“Token效率”。未來(lái),會(huì)用AI和不會(huì)用AI的人之間的差距,可能就體現(xiàn)在這里。
而且在黃仁勛看來(lái),未來(lái)公司里,將會(huì)出現(xiàn)大量的AI員工。也就是他說(shuō)的,以后所有SaaS公司都將消失,轉(zhuǎn)變?yōu)锳aaS。
SaaS我們都知道,軟件即服務(wù),這是過(guò)去二十年科技行業(yè)最成熟的商業(yè)模式之一。AaaS呢?Agent as a Service,代理即服務(wù)。SaaS時(shí)代,你買(mǎi)的是工具。軟件是工具,你要自己操作。點(diǎn)這里、填那里、提交之后等結(jié)果。
而AaaS時(shí)代,你買(mǎi)的是員工。Agent是員工,你只需要告訴它你想要什么結(jié)果,它自己去操作、自己去協(xié)調(diào)、自己去完成,最后把結(jié)果交給你。
比如,現(xiàn)在你用CRM軟件,客戶管理系統(tǒng),要自己錄入客戶信息、自己設(shè)置跟進(jìn)提醒、自己寫(xiě)郵件。未來(lái)你可能只需要對(duì)Agent員工說(shuō),幫我跟進(jìn)這個(gè)客戶,促成這筆交易,Agent自己去查資料、寫(xiě)郵件、安排會(huì)議、談判跟進(jìn)。
軟件是工具,Agent是員工。這是本質(zhì)區(qū)別。而這個(gè)Agent員工,不需要你發(fā)錢(qián),它需要你給它足夠多的Token額度。
說(shuō)白了,按照黃仁勛的觀點(diǎn),未來(lái)跟AI有關(guān)的一切操作,本質(zhì)上都涉及Token的消費(fèi)與產(chǎn)出。
03
Token效率,將成為新的核心競(jìng)爭(zhēng)力
而且注意,這個(gè)趨勢(shì)不只是關(guān)系到AI領(lǐng)域,而是關(guān)系到整個(gè)社會(huì)的基礎(chǔ)設(shè)施體系。按照黃仁勛的觀點(diǎn),整個(gè)AI產(chǎn)業(yè)分成五層。
最底層是能源層。AI需要電,需要大量的電。一個(gè)大型AI數(shù)據(jù)中心的耗電量,相當(dāng)于一座中等城市。
往上一層是芯片層。這是英偉達(dá)的主場(chǎng)。AI的“大腦”是GPU,目前全球高端AI芯片市場(chǎng),英偉達(dá)占據(jù)超過(guò)80%的份額。黃仁勛發(fā)布的新一代芯片,核心賣(mài)點(diǎn)就是“能耗比”,同樣的電,能算出更多的Token。
再往上是基礎(chǔ)設(shè)施層。芯片要裝進(jìn)服務(wù)器,服務(wù)器要放進(jìn)數(shù)據(jù)中心。黃仁勛說(shuō),數(shù)據(jù)中心正在從“存儲(chǔ)倉(cāng)庫(kù)”變成“Token工廠”。以前衡量數(shù)據(jù)中心看存儲(chǔ)容量,以后看每秒能生產(chǎn)多少Token。
再往上是模型層。GPT、Claude、DeepSeek,這些大模型就像“生產(chǎn)線”,把算力轉(zhuǎn)化成AI的輸出。同樣的芯片,跑不同的模型,效率差別很大。這就是為什么模型優(yōu)化這么重要,比如DeepSeek能用更少的算力達(dá)到接近GPT的效果,本質(zhì)上是提高了“Token生產(chǎn)效率”。
最上面是應(yīng)用層。ChatGPT、Copilot、各種AI助手,這是普通人接觸到的部分。每次你跟AI對(duì)話,就是在“消費(fèi)Token”。
你看,這五層蛋糕,從下到上,其實(shí)是一條Token的“生產(chǎn)—消費(fèi)”鏈條。能源變成電,電驅(qū)動(dòng)芯片,芯片支撐數(shù)據(jù)中心,數(shù)據(jù)中心運(yùn)行模型,模型服務(wù)于應(yīng)用,應(yīng)用產(chǎn)出Token給用戶。而相關(guān)的發(fā)電廠、芯片公司、數(shù)據(jù)公司,都是在圍繞Token開(kāi)展經(jīng)濟(jì)活動(dòng)。
順著這個(gè)邏輯,黃仁勛還有一個(gè)判斷,AI會(huì)創(chuàng)造大量就業(yè),而且這些崗位,大部分不需要你懂AI。沒(méi)錯(cuò),AI創(chuàng)造的很多就業(yè),不需要從業(yè)者懂AI。你看,建一個(gè)AI數(shù)據(jù)中心需要什么?需要電工、網(wǎng)絡(luò)布線技術(shù)員、消防安全員。這些都是實(shí)打?qū)嵉乃{(lán)領(lǐng)崗位。
黃仁勛說(shuō),未來(lái)幾年,AI基建領(lǐng)域會(huì)產(chǎn)生大量就業(yè)機(jī)會(huì)。這些崗位不是“被AI替代”的高危崗位,恰恰是AI產(chǎn)業(yè)創(chuàng)造出來(lái)的新崗位。而這一切,都是圍繞AI對(duì)Token的消耗產(chǎn)出,層層傳導(dǎo)而產(chǎn)生的。
以上的所有這些互動(dòng)關(guān)系,就大致構(gòu)成了黃仁勛所說(shuō)的Token經(jīng)濟(jì)學(xué)。
換句話說(shuō),理解Token經(jīng)濟(jì)學(xué)的關(guān)鍵,其實(shí)就是三句話。
第一,AI不是一個(gè)孤立的技術(shù),而是一個(gè)龐大的社會(huì)協(xié)作網(wǎng)絡(luò)。
第二,這個(gè)網(wǎng)絡(luò)上的所有人,工作的最終成果,都是讓AI能更多、更快、更好地接收、處理和產(chǎn)出Token。
第三,未來(lái),一個(gè)人的Token效率,將成為新的核心競(jìng)爭(zhēng)力。
版權(quán)聲明:部分文章推送時(shí)未能與原作者取得聯(lián)系。若涉及版權(quán)問(wèn)題,敬請(qǐng)?jiān)髡呗?lián)系我們。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.