![]()
中國(guó)互聯(lián)網(wǎng)延續(xù)了20年的傳統(tǒng)生存法則——“依賴人力堆疊擴(kuò)張”,正在被一張張新賬單徹底沖破。
50萬元,這是黃禎上一個(gè)月的賬單,用于購(gòu)買Token。
從香港中文大學(xué)休學(xué)后,經(jīng)過多次創(chuàng)業(yè),黃禎去年年底創(chuàng)辦了TORKID。在做這款產(chǎn)品的過程中,他變成了AI工程節(jié)點(diǎn):數(shù)月內(nèi)產(chǎn)出百萬行通過測(cè)試的代碼,月Token消耗超過100億,相當(dāng)于70億~80億個(gè)英文單詞的文本量;2025年7月,他的Claude Code使用量一度進(jìn)入某榜單全球前5。
如果把同等規(guī)模的工程量放進(jìn)一家傳統(tǒng)互聯(lián)網(wǎng)大廠,可能需要一名高階軟件工程師帶著一個(gè)約20人的程序員團(tuán)隊(duì)持續(xù)推進(jìn)。但黃禎創(chuàng)辦的TORKID加上兼職人員只有10余人,其中核心的軟件工程師只有兩人,數(shù)以百萬行計(jì)的代碼并不是由人腦一行行敲出來的,而是Claude Code、Codex等AI coding工具生成。
這意味著,一部分原本應(yīng)該出現(xiàn)在程序員“工資表”里的真金白銀,被悄然轉(zhuǎn)移到被Agent消耗的Token中。
過去20年,中國(guó)互聯(lián)網(wǎng)公司的擴(kuò)張模式高度依賴“人力的擴(kuò)張”。以字節(jié)跳動(dòng)為例,在其業(yè)務(wù)高速向上增長(zhǎng)的周期里,員工規(guī)模在極短時(shí)間內(nèi)躍升,全球員工數(shù)激增數(shù)萬人,增幅超過35%。然而,這種依賴人力堆疊的組織慣性,正在被大模型改變,逼迫企業(yè)重新評(píng)估“人”和“Token”的投入產(chǎn)出比。
當(dāng)Agent開始承擔(dān)原本由程序員完成的純執(zhí)行工作,Token就不可避免地轉(zhuǎn)化為企業(yè)的新賬單。從創(chuàng)業(yè)者到互聯(lián)網(wǎng)大廠,再到云廠商、模型廠商和第三方算力運(yùn)營(yíng)商,都已經(jīng)被卷入這場(chǎng)由模型調(diào)用驅(qū)動(dòng)的成本重構(gòu)之中。Token不再只是模型調(diào)用的計(jì)量單位,它正在變成企業(yè)重新分配技術(shù)預(yù)算、人力成本和工作流入口的新成本表。
01、用Token換時(shí)間
黃禎不愿意簡(jiǎn)單地把這筆錢定義為“買工具的開銷”。
TORKID是一個(gè)只為Agent提供安全、干凈的運(yùn)行和辦公環(huán)境的硬件——電腦。在這套體系中,人類管理者只需要扮演決策者角色:下達(dá)任務(wù)、觀察結(jié)果。至于具體的執(zhí)行,Agent會(huì)在硬件環(huán)境中自主地打開網(wǎng)頁、閱讀文件、調(diào)用各種第三方API工具并推進(jìn)業(yè)務(wù)流程。
如果僅僅盯著財(cái)務(wù)賬面,一個(gè)月50萬元的coding Token消耗,很容易被外界誤讀為這個(gè)初創(chuàng)團(tuán)隊(duì)在瘋狂燒錢。“事實(shí)上,在保證準(zhǔn)確性的前提下,大模型幫我們減少了大量的溝通消耗,極大地提高了效率。”對(duì)于任何一家處于生死存亡期的初創(chuàng)公司而言,時(shí)間比金錢更重要。
“在傳統(tǒng)的組織架構(gòu)里,要把一個(gè)想法變成可落地的商業(yè)產(chǎn)品,流程往往長(zhǎng)得讓人絕望。你需要反復(fù)開會(huì)、對(duì)齊需求、拆解任務(wù),然后再分發(fā)給不同的前端、后端和測(cè)試工程師去推進(jìn)。在這條漫長(zhǎng)的鏈路里,中間只要有一個(gè)人理解偏了方向,或者架構(gòu)師判斷錯(cuò)了一個(gè)技術(shù)細(xì)節(jié),后面迎來的就是災(zāi)難性的整體返工。”黃禎直言,這個(gè)過程消耗非常嚴(yán)重。
大模型出現(xiàn)后,TORKID得以將這套冗長(zhǎng)的流程極度壓縮:白天團(tuán)隊(duì)只需要集中討論兩個(gè)小時(shí),定下框架,然后將已經(jīng)拆解好的任務(wù)直接扔給Claude Code等AI工具去實(shí)現(xiàn),如果模型的執(zhí)行出了偏差,就當(dāng)場(chǎng)修正提示詞,讓模型在幾分鐘內(nèi)推倒重來,繼續(xù)執(zhí)行。
這種高強(qiáng)度的“人機(jī)協(xié)作”,把這家公司的運(yùn)轉(zhuǎn)效率逼到了極限。
![]()
從項(xiàng)目正式立項(xiàng)到完成硬件的全球預(yù)售渠道搭建,TORKID僅僅用了7個(gè)月時(shí)間。“如果沒有AI的支撐,很多復(fù)雜的工程模塊,我們這兩個(gè)全職程序員根本做不出來。如果把管理一個(gè)大型研發(fā)團(tuán)隊(duì)的溝通成本、開會(huì)成本全都折算進(jìn)來,我們現(xiàn)在一天做成的事情,可能相當(dāng)于過去傳統(tǒng)團(tuán)隊(duì)兩到三周的交付。”
黃禎給《財(cái)經(jīng)天下》算過一筆賬:過去半年,TORKID在純Token和AI coding消耗上的累計(jì)投入已經(jīng)達(dá)到100多萬元。但是相較于傳統(tǒng)公司,“人”效比大概為1:5。這意味著,在AI輔助的模式下,他掏出1元買Token,傳統(tǒng)團(tuán)隊(duì)想要達(dá)到同等的研發(fā)進(jìn)度,可能需要在人力成本上砸進(jìn)去5元。
這張Token賬單蘊(yùn)含更為深遠(yuǎn)的意義:它重塑了初創(chuàng)公司的組織模型。對(duì)于初創(chuàng)公司,Token賬單不只是一種消費(fèi),更是一種高效率的“組織杠桿”。
這意味著,未來,或許創(chuàng)業(yè)公司不需要先把每個(gè)崗位補(bǔ)齊,再慢慢推進(jìn)產(chǎn)品,而是先把任務(wù)拆給模型,讓Agent和coding工具承擔(dān)一部分執(zhí)行工作,再?zèng)Q定哪些崗位真的需要出現(xiàn)。
在黃禎的設(shè)想里,TORKID未來會(huì)由三部分組成:底層硬件仍然需要人來操作;中間是核心內(nèi)核研發(fā)團(tuán)隊(duì),圍繞Agent Runtime、推理和Context優(yōu)化展開,規(guī)模會(huì)被控制在很小范圍內(nèi);再往上,是面向不同用戶群體展開的用戶體驗(yàn)和市場(chǎng)團(tuán)隊(duì)。具體執(zhí)行都交Agent。
換句話說,未來,很多公司都不再需要純執(zhí)行崗位,需要的是“管理執(zhí)行一體”的人。
黃禎只是無數(shù)AI原生創(chuàng)業(yè)者中的一個(gè)。全球大模型巨頭Anthropic披露的早期官方數(shù)據(jù)顯示,創(chuàng)業(yè)公司已經(jīng)成為Claude Code最核心的擁躉。在Claude Code的所有日常對(duì)話交互中,來自初創(chuàng)公司相關(guān)工程的調(diào)用占比高達(dá)32.9%,這一數(shù)字遠(yuǎn)遠(yuǎn)超出了創(chuàng)業(yè)公司在常規(guī)Claude.ai網(wǎng)頁端對(duì)話中的占比。
這種變化同樣被投資人捕捉到。真格基金與十字路口Crossing發(fā)起Token Grant時(shí)明確,對(duì)很多AI創(chuàng)業(yè)者來說,最缺的未必是團(tuán)隊(duì)、辦公室或第一筆工資,而是把想法快速做成第一版所需要的模型與算力資源,并宣布為每個(gè)入選項(xiàng)目提供5萬元Token費(fèi)用補(bǔ)貼。
這意味著,投資人已經(jīng)把Token看成一種早期創(chuàng)業(yè)資源。過去投資人看團(tuán)隊(duì)、看產(chǎn)品、看增長(zhǎng),現(xiàn)在對(duì)AI原生項(xiàng)目來說,還要看創(chuàng)始人有沒有足夠的模型調(diào)用能力,能不能持續(xù)試錯(cuò),快速把想法落地。Token消耗量本身未必是唯一指標(biāo),但它正在變成投資人考察創(chuàng)業(yè)公司值不值得被投的一個(gè)重要指標(biāo)。
02、Token不再只是技術(shù)部門的小賬
在更多公司里,Token消耗已經(jīng)從技術(shù)部門的小賬,變成公司的結(jié)構(gòu)性成本。
三年前,很多團(tuán)隊(duì)做AI漫劇,主要用開源模型和云算力。“一張4090的卡,一小時(shí)使用不到兩元,按照員工的使用量,一個(gè)月下來整體五百元以內(nèi)可以搞定。”從事漫劇制作的創(chuàng)業(yè)者李銘對(duì)《財(cái)經(jīng)天下》表示,隨著模型能力不斷更新,閉源模型和開源模型之間的差距被拉大,效果也“肉眼可見”。同時(shí),AI漫劇也越來越卷,用戶對(duì)畫面、邏輯要求越來越高。
成本也發(fā)生了顯著變化。“Seedance出來后,一段3秒視頻生成基本要1元。疊加修改、重試等,AI漫劇每分鐘需約1000—3000元,制作一部精品AI漫劇需要20萬元左右。”李銘表示,AI漫劇成本主要包括算力、人力、版權(quán)等,其中算力成本占比最高,大概30%~50%。
這也是很多AI應(yīng)用公司正在經(jīng)歷的悖論:模型調(diào)用讓產(chǎn)品看起來更智能,但也讓產(chǎn)品交付變得更貴。
AI應(yīng)用公司創(chuàng)始人劉斌對(duì)《財(cái)經(jīng)天下》算過另一筆賬:公司當(dāng)前Token消耗在10億級(jí)別,產(chǎn)品還在內(nèi)測(cè)階段的時(shí)候,場(chǎng)景可控,成本也可控。但用戶數(shù)量上來后,就會(huì)產(chǎn)生大量的消耗,算力賬單會(huì)迅速膨脹。他得出了一個(gè)結(jié)論:不能帶來收益的產(chǎn)品,絕對(duì)買不起算力。
“現(xiàn)在,公司鼓勵(lì)團(tuán)隊(duì)使用Token,但整體支出需要控制在預(yù)算包內(nèi),業(yè)務(wù)部門最終還要用ROI來衡量收益。”一家主要做營(yíng)銷的科技公司的高管陳明對(duì)《財(cái)經(jīng)天下》表示。
同樣,為了節(jié)省Token消耗,每家公司都在精打細(xì)算。一位不愿具名的業(yè)內(nèi)人士給《財(cái)經(jīng)天下》透露了一個(gè)看來近乎荒誕、卻真實(shí)有效的操作:一家金融公司,每月Token消耗已經(jīng)達(dá)到千億量級(jí),業(yè)務(wù)應(yīng)用側(cè)每日穩(wěn)定在億級(jí)消耗。為了節(jié)省Token,這家公司鼓勵(lì)團(tuán)隊(duì)用“文言文”壓縮Token。
“在部分離線場(chǎng)景中,先讓高性能模型輸出文言文,可讓Token消耗減少40%到50%,再用便宜的國(guó)產(chǎn)模型翻譯回白話,整體賬單最多能節(jié)省約70%。”上述人士表示,盡管這樣會(huì)帶來信息損耗,但當(dāng)Token進(jìn)入千億量級(jí),企業(yè)會(huì)像摳電費(fèi)一樣摳Token。
這種變化說明,Token已經(jīng)不再只是技術(shù)部門的資源消耗,開始進(jìn)入業(yè)務(wù)部門的經(jīng)營(yíng)判斷。在一些企業(yè)里,省Token已經(jīng)變成一門新的成本管理技術(shù)。
![]()
這種變化不只發(fā)生在初創(chuàng)團(tuán)隊(duì)身上。2026年4月,Google CEO Sundar Pichai在Cloud Next上透露,谷歌近75%的新增代碼由AI生成,經(jīng)工程師審核確認(rèn)后入庫落地,一項(xiàng)復(fù)雜代碼遷移任務(wù)由工程師與AI Agent協(xié)作落地,完成速度比一年前全人工開發(fā)快6倍。
公開研究也在說明同一個(gè)趨勢(shì)。PwC在2025年發(fā)布的Global AI Jobs Barometer中分析了接近10億條招聘廣告和數(shù)千份企業(yè)財(cái)報(bào)后發(fā)現(xiàn),具備AI技能的員工,相比同崗位但不具備AI技能的人,平均存在56%的工資溢價(jià)。另有數(shù)據(jù)顯示,77%的雇主計(jì)劃對(duì)員工進(jìn)行再培訓(xùn),但同時(shí)也有41%的雇主計(jì)劃因?yàn)锳I自動(dòng)化部分任務(wù)而縮減員工規(guī)模。
中國(guó)發(fā)展高層論壇2026年年會(huì)披露,2024年初,中國(guó)日均Token調(diào)用量約為1000億,2026年3月日均調(diào)用量突破140萬億,兩年增長(zhǎng)超過千倍。
當(dāng)Token從研發(fā)工具進(jìn)入內(nèi)容生產(chǎn)、用戶交付和企業(yè)流程,它就不再只是技術(shù)部門的小賬,而是業(yè)務(wù)負(fù)責(zé)人、技術(shù)負(fù)責(zé)人和財(cái)務(wù)負(fù)責(zé)人都繞不開的一張成本表。它既可能提高效率,也可能吞掉利潤(rùn);既可能替代一部分人力,也可能變成另一筆更難控制的剛性支出。
新的問題已然出現(xiàn):當(dāng)越來越多企業(yè)開始把一部分人力成本轉(zhuǎn)成Token賬單,這張新的“工資表”最后會(huì)由誰收走?一場(chǎng)蓄謀已久、針對(duì)企業(yè)“工作流入口”的圈地大圍獵正式開啟。
03、誰來掌控這張“工資表”?
對(duì)創(chuàng)業(yè)者來說,Token是用來換時(shí)間、換效率的工具;對(duì)企業(yè)來說,它是一筆必須被納入ROI計(jì)算的新成本。但對(duì)云廠商、大模型廠商和互聯(lián)網(wǎng)大廠來說,企業(yè)每一次調(diào)用模型、每一次讓Agent執(zhí)行任務(wù),都是一筆可以持續(xù)收割的賬單。
半年前,阿里云智能集團(tuán)資深副總裁劉偉光對(duì)Token支出在企業(yè)IT預(yù)算中的占比判斷,還只是“可能都不到1%”。到了2026年5月,這個(gè)判斷已經(jīng)發(fā)生巨變:對(duì)AI原生創(chuàng)業(yè)公司來說,Token支出可以占到IT支出的100%;在中國(guó)互聯(lián)網(wǎng)企業(yè)里,這一比例也達(dá)到了15%~20%。
據(jù)36氪報(bào)道,阿里云今年的目標(biāo)是,到年底,在每一個(gè)客戶貢獻(xiàn)的收入中,Token收入占比不低于20%。
這個(gè)目標(biāo)背后,是云廠商對(duì)企業(yè)預(yù)算表的一次重新理解。劉偉光曾坦言,在云計(jì)算時(shí)代,盤點(diǎn)客戶IT預(yù)算時(shí),有一部分錢阿里云始終吃不到:企業(yè)內(nèi)部的軟件開發(fā)和人力外包。但AI Coding出現(xiàn)后,這部分預(yù)算反而成了大模型可以直接命中的地方。
長(zhǎng)期聚焦AI產(chǎn)業(yè)投資的基金經(jīng)理?xiàng)钣掳堰@件事說得更直接:Token時(shí)代,大廠的競(jìng)爭(zhēng)已經(jīng)從模型能力競(jìng)賽,轉(zhuǎn)向“經(jīng)濟(jì)體系構(gòu)建”,組織從分散賽馬轉(zhuǎn)向中樞協(xié)同;商業(yè)模式也要從過去互聯(lián)網(wǎng)式的 “燒錢換流量”轉(zhuǎn)向 “Token計(jì)費(fèi)變現(xiàn)”。
這也是MaaS(模型即服務(wù))突然變得重要的原因。過去,云廠商賣的是服務(wù)器、存儲(chǔ)、帶寬和數(shù)據(jù)庫;現(xiàn)在,它們更希望把模型、API、Agent Runtime、部署服務(wù)和計(jì)費(fèi)系統(tǒng)一起打包進(jìn)客戶的業(yè)務(wù)流程里。
一旦企業(yè)的代碼生成、營(yíng)銷等內(nèi)部運(yùn)營(yíng)流程都接入某個(gè)平臺(tái),Token就會(huì)從一次性投入變成持續(xù)性消耗。為了搶奪這20%的收入,巨頭們最直接的手段依舊是慘烈但高效的價(jià)格戰(zhàn),誰掌控了企業(yè)的模型調(diào)用入口,誰就更接近未來的工作流賬單。
2026年5月,DeepSeek宣布,在2.5折限時(shí)優(yōu)惠結(jié)束后,將DeepSeek-V4-Pro API正式價(jià)格調(diào)整為原價(jià)的四分之一。也就是說,原本階段性的低價(jià),成為長(zhǎng)期官價(jià);小米旗下的MiMo-V2.5系列API隨后跟進(jìn),高調(diào)宣布全面大降價(jià),最高降幅達(dá)99%。此前,阿里、字節(jié)、騰訊等廠商都經(jīng)歷過多輪的價(jià)格拉鋸。
“TORKID和字節(jié)、阿里等廠商都接觸過,除了價(jià)格優(yōu)勢(shì),它們還提供了各種代金券,想讓我使用它們的模型。”黃禎有很直接的體感,但他很清楚,代金券、低價(jià)資源包的吸引力終究有限,他更在乎模型的質(zhì)量與穩(wěn)定性。
互聯(lián)網(wǎng)大廠正在試圖把更多企業(yè)的工作流納入自己的模型和云服務(wù)體系:將不同工作場(chǎng)景下的能力模塊封裝成Agent服務(wù)或工作流方案,再通過模型調(diào)用、Token計(jì)費(fèi)和云資源綁定,爭(zhēng)奪企業(yè)未來的調(diào)用入口和賬單歸屬。同樣,第三方獨(dú)立算力運(yùn)營(yíng)商也在轉(zhuǎn)型。
作為重資產(chǎn)布局的代表,武漢元熙映闕人工智能基礎(chǔ)資源技術(shù)平臺(tái)有限公司(以下簡(jiǎn)稱“元熙”)在湖北、新疆等地布局了3座備案智算中心,規(guī)劃總算力超10000P,手握6000P長(zhǎng)期算力租賃訂單。機(jī)房、GPU、電力、網(wǎng)絡(luò)、液冷,全都是真金白銀的硬投入。
在巨頭把Token價(jià)格“打骨折”的MaaS時(shí)代,企業(yè)買的越來越不是裸算力,而是包裝在工作流里的Token和模型服務(wù)。可以預(yù)見的是,元熙如果只做“房東”賣裸算力,就會(huì)被壓成“誰便宜用誰”的臨時(shí)資源池,失去議價(jià)權(quán)。
“我們也在嘗試分時(shí)租賃,把閑時(shí)算力租給科研機(jī)構(gòu)、高校或中小企業(yè),盡可能提高GPU利用率。”元熙副總裁楊楠對(duì)《財(cái)經(jīng)天下》表示,元熙已開始轉(zhuǎn)型,努力向MaaS、Agent服務(wù)、AI Skill封裝和Token計(jì)費(fèi)靠攏 ,讓產(chǎn)品形態(tài)更為豐富。
“這部分業(yè)務(wù)早期不一定立刻收費(fèi),更像獲客:先讓自己的軟件或調(diào)用入口進(jìn)入客戶系統(tǒng),等客戶側(cè)功能被激活,用戶開始產(chǎn)生AI調(diào)用后,再按照調(diào)用量或Token消耗進(jìn)行分成。” 楊楠表示。
這種轉(zhuǎn)型,也是當(dāng)下AI產(chǎn)業(yè)巨變的一個(gè)縮影。毫無疑問,在這個(gè)擁擠的賽道上,玩家想要留在牌桌上,都必須不遺余力。
(文中李銘、劉斌、陳明均為匿名)
(作者 | 南風(fēng),編輯 | 春野,圖片來源 | 視覺中國(guó),本內(nèi)容轉(zhuǎn)載自財(cái)經(jīng)天下WEEKLY)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.