![]()
文:王智遠(yuǎn) | ID:Z201440
2025年2月,DeepSeek刷屏的那個(gè)春節(jié),梁汝波在全員會(huì)上說了六個(gè)字:跟進(jìn)速度不夠。
一年后的2026年2月,豆包2.0發(fā)布前夕,火山引擎拿下了春晚獨(dú)家AI云合作伙伴的身份。從「缺席者」到「造浪者」,中間剛好隔了一整年,365天。
這一年里,阿里瘋狂發(fā)力,一口氣發(fā)了上百個(gè)模型;騰訊也動(dòng)了大動(dòng)作,重組了AI Infra部;百度更直接,把文心給開源了。
唯獨(dú)字節(jié),出牌頻率反而變得特別低,看著有點(diǎn)反常,但它并沒缺席這場(chǎng)競(jìng)賽,只是把籌碼都押在了大家看不見的地方。
這篇年終復(fù)盤,只想回答一個(gè)問題:字節(jié)看不見的押注,是如何在2026年春節(jié)前,變成一發(fā)不可收拾的?
01
如果說 2023 到 2024 年,字節(jié)大模型走的是「突擊隊(duì)」路子,打快仗、搶熱點(diǎn),快速完成從 0 到 1 的布局,那 2025 年,字節(jié)大模型正式進(jìn)入了「吳永輝時(shí)間」。
這位被寄予厚望的新帥上任后,做的第一件事,就驚到了整個(gè)字節(jié):他直接給Seed團(tuán)隊(duì)取消了季度OKR,甚至連半年考核都給撤了。
要知道,字節(jié)可是出了名的講「字節(jié)范兒」、喊「Always Day One」,在這樣一家公司里,取消考核這事兒,簡(jiǎn)直就是「政治不正確」。
但吳永輝有他自己的道理:
要是方向從一開始就錯(cuò)了,讓大家三個(gè)月交一次答卷,只會(huì)更快把路走死;字節(jié)的DNA是「小步快跑、快速迭代」,可這套邏輯,到了大模型領(lǐng)域,根本不好使。
那時(shí)候的字節(jié)大模型團(tuán)隊(duì),已經(jīng)染上了嚴(yán)重的「大公司病」。
2025年初,AI Lab、Seed團(tuán)隊(duì)、視覺生成團(tuán)隊(duì)、豆包產(chǎn)品技術(shù)部,這四支隊(duì)伍就跟四條平行線似的,各有各的匯報(bào)線,各搞各的研發(fā)節(jié)奏,互不相干。
AI Lab由李航帶隊(duì),主打?qū)W術(shù)研究;Seed團(tuán)隊(duì)歸吳永輝管,重點(diǎn)放在實(shí)際應(yīng)用上;視覺團(tuán)隊(duì)剛從阿里挖來周暢,還在磨合,而豆包的技術(shù)負(fù)責(zé)人朱文佳,更是直接向梁汝波匯報(bào)。
大家互相搶資源、隱性競(jìng)爭(zhēng),甚至出現(xiàn)過同一個(gè)需求,四家團(tuán)隊(duì)各自埋頭做的荒唐事兒。
吳永輝入職后,Seed團(tuán)隊(duì)前后搞了三次組織收斂,一步步把分散的力量擰成一股繩。
2025 年 3月份,AI Lab整體并入Seed,李航開始向吳永輝匯報(bào),原來集團(tuán)級(jí)研究部門的光環(huán)沒了,所有研發(fā)力量,都?xì)w到了同一個(gè)指揮體系下。
到了年中,隨著楊建朝暫休,字節(jié)從阿里挖來周暢接手視覺多模態(tài)團(tuán)隊(duì),文生圖 Seedream、文生視頻 Seedance 等多模態(tài)團(tuán)隊(duì)的管理權(quán)限,同步納入 Seed 整體體系,周暢直接向吳永輝匯報(bào),多模態(tài)研發(fā)與大模型主干能力實(shí)現(xiàn)了同頻調(diào)度。
最關(guān)鍵的一步,在10月份落地,豆包技術(shù)負(fù)責(zé)人朱文佳,直接匯報(bào)對(duì)象從梁汝波改成了吳永輝。
這是字節(jié)為數(shù)不多以「收斂」而非「擴(kuò)張」為核心目的的組織整合。
過去十年,字節(jié)擅長分,抖音分出頭條、飛書、TikTok。但大模型競(jìng)賽的后半程,比的不是誰開的分支多,是誰的主干粗。
為了讓這根「技術(shù)主干」更扎實(shí),吳永輝入職后,一直鼓勵(lì)研究員深耕基礎(chǔ)研究、積極輸出頂會(huì)論文,2025 年上半年,Seed 團(tuán)隊(duì)在國際頂級(jí)學(xué)術(shù)會(huì)議上發(fā)布的論文數(shù)量,比2024 年同期實(shí)現(xiàn)了翻倍增長。
但理想與業(yè)務(wù)現(xiàn)實(shí)之間,終究有需要平衡的鴻溝。
到了三季度,豆包2.0的發(fā)布節(jié)點(diǎn)越來越近,管理層對(duì)發(fā)論文也有了新要求:內(nèi)容必須和正在迭代的核心技術(shù)沒關(guān)系,不能影響產(chǎn)品上線。
2026年1月,梁汝波在全員會(huì)上,把核心關(guān)鍵詞改了,從之前的「探索智能上限」,變成了「勇攀高峰」和「AI模型能力要做到行業(yè)前列」。
從「探索」到「做到」,這七個(gè)字的變化,是2025年字節(jié)組織調(diào)整的全部答案:它不再滿足于做一個(gè)「參與者」,它要做「第一梯隊(duì)」,甚至要做「唯一」。
02
組織收斂的效果好不好,最終還得靠產(chǎn)品來檢驗(yàn),2025年上半年,豆包在用戶心里的形象,特別分裂。
它聊起天來是真厲害,情緒價(jià)值給得足足的,你跟它嘮一宿情感八卦、吐吐槽,它都能接住。
可要是你讓它查機(jī)票、比價(jià)格,或者完成一個(gè)需要多步驟的任務(wù),它大概率只會(huì)給你一段通用攻略,然后,熱情地問你還有什么能幫你的嗎,根本解決不了實(shí)際問題。
「聊天機(jī)器」和「辦事助理」之間,隔著一道實(shí)打?qū)嵉镍櫆稀6止?jié),選了一條最笨、也最扎實(shí)的路來填這個(gè)坑:死磕「聽懂人話」和「把事辦成」這兩件事。
2025年11月,豆包的語音對(duì)話功能,上線了一個(gè)看似不起眼、但實(shí)際特別難的功能:同一個(gè)音色里,能流暢切換粵語、四川話、東北話、陜西話四種方言,還能識(shí)別20種方言。
為了做好這個(gè)體驗(yàn),字節(jié)讓同一批聲優(yōu),用不同的方言錄制一模一樣的語料。這就意味著,錄音成本直接翻了一倍,后期的標(biāo)注工作,復(fù)雜度更是呈指數(shù)級(jí)上升。
有人可能會(huì)問,為啥要費(fèi)這么大勁做方言功能?
答案很簡(jiǎn)單:打基礎(chǔ),做基建。中國有超過10億人說方言,這其中,有大量的中老年用戶,不會(huì)打字、也不熟悉App的操作邏輯,但他們會(huì)對(duì)著手機(jī)說話。
讓AI學(xué)會(huì)方言,是為了讓四川的老人、廣東的阿姨能毫無門檻地用起來。這是字節(jié)在爭(zhēng)奪「下一個(gè)10億用戶」的入場(chǎng)券。
方言降低了開口的門檻,而「Agent(智能體)」則解決動(dòng)手的問題。
字節(jié)在這條坎上的爬升路徑,清晰地寫進(jìn)了2025年的版本日歷里,2025年6月11日,豆包1.6版本發(fā)布,譚待在發(fā)布會(huì)上,演示了一個(gè)讓所有人都眼前一亮的場(chǎng)景:
拍一張購物小票,模型能自動(dòng)整理成Excel表格;你隨口說一句話,模型能自動(dòng)操作瀏覽器,幫你完成酒店預(yù)訂。他把這次升級(jí)的核心,總結(jié)成了三個(gè)字:「行動(dòng)力」。
到了12月,豆包1.8版本發(fā)布,Agent能力又上了一個(gè)臺(tái)階,能調(diào)用十幾個(gè)工具,在多個(gè)電商平臺(tái)之間來回切換,幫你完成耳機(jī)的全網(wǎng)比價(jià),還能選出最優(yōu)選項(xiàng)。
從「能做一件事」到「能做一系列事」,字節(jié)一點(diǎn)點(diǎn)補(bǔ)齊了豆包「辦事能力」的短板。但這也帶來了一個(gè)致命的新問題:成本太高。
Agent執(zhí)行一次任務(wù),消耗的Token數(shù)量,是普通聊天的幾十倍。要是單次調(diào)用的成本降不下來,哪怕Agent再厲害,也只能停留在實(shí)驗(yàn)室里,根本沒法大規(guī)模推廣、給更多人用。
在 2025 年火山引擎春季原動(dòng)力大會(huì)上,譚待曾直言,通過底層技術(shù)的持續(xù)優(yōu)化,大模型推理成本未來還有 99% 的下降空間。
這一判斷,也為字節(jié)后續(xù)的成本戰(zhàn)、技術(shù)債清零,定下了核心基調(diào)。
03
2025 年 11 月,火山引擎發(fā)布官方公告:Doubao-pro-32k、Doubao-vision-pro-32k 等十余款 2024 年發(fā)布的舊版本模型,將逐步停止服務(wù),引導(dǎo)用戶遷移到最新的 Seed 系列模型。
這是字節(jié) 2025 年最激進(jìn)、卻也最容易被外界忽略的關(guān)鍵動(dòng)作。
公告發(fā)布后,客服收到了大量企業(yè)開發(fā)者的反饋,畢竟對(duì)開發(fā)者而言,模型版本切換意味著接口重接、代碼重改、全流程回歸測(cè)試,成本極高。
但字節(jié)硬推了。因?yàn)樽T待算過一筆賬:
智能體時(shí)代已經(jīng)到來,大模型的調(diào)用量只會(huì)迎來指數(shù)級(jí)增長。到那個(gè)時(shí)候,如果還背著 2023 年的老版本、2024 年的 Pro 版、各類客戶特供版等多套技術(shù)架構(gòu),成本窟窿只會(huì)越來越大,根本填不上。
只有把所有模型的內(nèi)核統(tǒng)一起來,才能釋放規(guī)模飛輪的紅利。這不僅是清零之前的技術(shù)債,更是對(duì)商業(yè)模式的一次徹底重構(gòu)。
字節(jié)的成本優(yōu)勢(shì),靠「算力精算」,把每一分錢都花在刀刃上。
大模型服務(wù)的成本困境,根源很簡(jiǎn)單,就是一種浪費(fèi):「快車要等慢車」。用戶的輸入請(qǐng)求,有的短到只有10個(gè)詞,有的長到10萬詞,把這些請(qǐng)求混在一起處理,系統(tǒng)就得按照最慢的那個(gè)來調(diào)度,大量的算力就這么被閑置了,特別可惜。
字節(jié)的解法是「區(qū)間定價(jià)」和「PD分離」。
2025年6月,豆包1.6版本,首次推出了「區(qū)間定價(jià)」:0到32K的輸入?yún)^(qū)間,價(jià)格直接打到0.8元/百萬tokens,綜合成本比1.5版本和DeepSeek R1降低了63%;32K以上的輸入,價(jià)格再逐級(jí)上浮。
這就跟快遞打包一個(gè)道理,要把所有尺寸的包裹混在一起裝,肯定特別浪費(fèi)空間;要是按尺寸分類打包,至少能省下三分之一的紙箱。
更深層的邏輯是「PD分離」,把處理長文本的「預(yù)填充」階段,和生成文本的「解碼」階段拆開,用不同的硬件、不同的策略來處理,效率一下子就提升了好幾倍。
這套邏輯的前提是:所有的優(yōu)化,只能做一遍。
要是同時(shí)維護(hù)好幾套架構(gòu),每做一次優(yōu)化,就得在每套架構(gòu)上都來一遍,邊際成本永遠(yuǎn)降不下來;所以說,「舊模型大下架」,是「降價(jià)99%」的必要前提,也是字節(jié)向全行業(yè)發(fā)起「成本戰(zhàn)爭(zhēng)」的宣戰(zhàn)書。
數(shù)據(jù)證明了這一策略的成功。
2025 年 5 月底,豆包日均 Token 調(diào)用量已達(dá) 16.7 萬億;9月突破30萬億;12月突破50萬億,較2024年同期增長超10倍。IDC報(bào)告顯示,2025年上半年中國公有云大模型服務(wù)市場(chǎng),火山引擎份額達(dá)到49.2%。
當(dāng)同行在2025年下半年被迫跟進(jìn)降價(jià)時(shí),字節(jié)已經(jīng)通過清掉技術(shù)債,獲得了結(jié)構(gòu)性的成本優(yōu)勢(shì);這種優(yōu)勢(shì)一旦建立,很難被單純的價(jià)格戰(zhàn)顛覆。
04
組織收斂了,技術(shù)債清了,成本降下來了,最后一塊拼圖是「節(jié)奏」。
字節(jié)為什么能從2025年春節(jié)的「缺席者」變成2026年春節(jié)的「主角」?在我看來,它終于找到了屬于自己的研發(fā)節(jié)奏,它把春節(jié),變成了自己的iPhone發(fā)布會(huì),每年都要搞個(gè)大動(dòng)作。
這套「春節(jié)錨定法」,是一種「研發(fā)倒逼機(jī)制」:
別的公司都是按財(cái)季規(guī)劃模型發(fā)布,字節(jié)卻是按春節(jié)倒排工期,1月份必須封版,2月份必須上線,前一年夏天,就得把技術(shù)路線定死。
2025 年春節(jié)的被動(dòng),讓字節(jié)意識(shí)到,靠「突擊隊(duì)」模式打游擊、追熱點(diǎn),永遠(yuǎn)只能跟著行業(yè)節(jié)奏走,永遠(yuǎn)無法建立自己的領(lǐng)先優(yōu)勢(shì)。
而 2026 年春節(jié)的全面爆發(fā),正是這套節(jié)奏管理的第一次大考:春晚獨(dú)家 AI 云合作、豆包 2.0、多模態(tài)能力的全面升級(jí),這一系列動(dòng)作,都是吳永輝入職一年來,組織收斂、技術(shù)清債、成本優(yōu)化的集中成果爆發(fā)。
據(jù)行業(yè)媒體披露,2026 年 2 月 14 日,豆包 2.0 將正式發(fā)布。這是字節(jié)大模型遲到的全面進(jìn)攻信號(hào),但這場(chǎng)關(guān)于通用人工智能的戰(zhàn)役,其實(shí)才剛剛開始。
站在 2026 年春節(jié)的節(jié)點(diǎn)回望與前瞻,字節(jié)面前,還有三個(gè)更難、更長遠(yuǎn)的課題需要解決。
第一個(gè),是「閉源模式的持續(xù)性」。
2025年,阿里開源了Qwen3全系列,衍生模型超17萬個(gè),形成了龐大的開源生態(tài);百度開源了文心,甚至連騰訊混元也開始在部分版本上開源。字節(jié)是唯一堅(jiān)持閉源路線的中國大廠。
這套模式能走得通,前提是:
火山引擎的 To B 服務(wù)收入,與豆包的 To C 用戶黏性,能持續(xù)反哺 Seed 團(tuán)隊(duì)的巨額研發(fā)投入,形成「研發(fā) - 落地 - 營收 - 再研發(fā)」的正向循環(huán)。
如果下一階段開源模型能力追平閉源,開發(fā)者還會(huì)不會(huì)為「獨(dú)家調(diào)用權(quán)」付費(fèi)?字節(jié)賭「體驗(yàn)優(yōu)先」,但這是一場(chǎng)孤獨(dú)的豪賭。
其次,是固定節(jié)點(diǎn)錨定的反作用力。
把研發(fā)節(jié)奏錨定在春節(jié)這一個(gè)節(jié)點(diǎn)上,好處是目標(biāo)清晰、全鏈路同頻,代價(jià)是每年核心的重磅發(fā)布,基本只有一次扣扳機(jī)的機(jī)會(huì)。
2025年春節(jié)的缺席是代價(jià),2026年春節(jié)打響也是代價(jià);如果2027年春節(jié)前被對(duì)手刻意狙擊,或者產(chǎn)品不及預(yù)期,代價(jià)將是巨大的。
最后是「巨頭的底牌」。
騰訊在2025年底重組了AI Infra部,由大模型負(fù)責(zé)人姚順雨直接管,手里還握著微信這個(gè)有12億用戶的超級(jí)入口,一旦騰訊決定把大模型全量導(dǎo)入微信,那流量?jī)?yōu)勢(shì),是字節(jié)根本比不了的。
阿里云也沒閑著,2025年9月發(fā)布了萬相2.5,12月又把千問接入了萬相2.6。它在開源生態(tài)上的厚度,還有在云服務(wù)領(lǐng)域的深耕,不是字節(jié)用一年時(shí)間就能追上的。
還有DeepSeek。沒人知道那家創(chuàng)業(yè)公司2026年還能拿出什么黑科技。
一年前梁汝波那句「跟進(jìn)速度不夠」,在 2025 年被字節(jié)整個(gè)大模型團(tuán)隊(duì)反復(fù)咀嚼,成為了全力奔跑的動(dòng)力。
2026年春節(jié),字節(jié)用一場(chǎng)精密的「造浪」證明了它已經(jīng)補(bǔ)上了短板,把一支3000人的突擊隊(duì)改裝成了有節(jié)拍器的正規(guī)軍。
但大模型的競(jìng)賽沒有終點(diǎn)。
本可以做得更好的遺憾,字節(jié)用 365 天成功改寫;但「還可以更好」的追求,是這條賽道上永遠(yuǎn)劃不掉的命題。字節(jié)用365天證明了自己會(huì)追趕、會(huì)切換,它需要下一個(gè)365天,證明自己配得上「長期主義者」這個(gè)稱號(hào)。
春節(jié)總會(huì)再來,字節(jié)作為進(jìn)攻者的戰(zhàn)役,才剛剛拉開序幕;不一定對(duì),個(gè)人觀察。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.