如果少走一半彎路,混元今天或許仍在業界第一梯隊。
作者丨董子博
編輯丨林覺民
2025年,從阿里巴巴離職的語音專家鄢志杰,正面臨一個重要抉擇。
![]()
鄢志杰
一邊是急于在AI領域大展拳腳的京東,其研究院正招兵買馬,尤其從阿里、商湯、百度等企業招攬英才;另一邊是騰訊的AI Lab團隊,俞棟團隊也正在尋找一位值得信賴的語音領域頂尖人才。
當時,早就有意親自管理京東研究院的劉強東求賢若渴,甚至直接與鄢志杰會面,希望將這位通義實驗室語音團隊的前負責人招入麾下,最終卻被鄢志杰婉拒。
鄢志杰婉拒老劉的原因,并非騰訊AI Lab給出的待遇優厚——在他心中,俞棟是自己在微軟時期的同事,這份情誼重逾千鈞。
![]()
俞棟
于是,鄢志杰義無反顧地加入了俞棟的團隊。
天有不測風云,鄢志杰到崗時,俞棟麾下語音團隊已經開始跟混元團隊合作,共同開發對標豆包語音的項目——“混元-O”,此時混元團隊研發任務緊張,語音+視覺理解的團隊已成建制,項目已經在跑起來了。
人員調動,剛入職騰訊的鄢志杰也受到了影響。一說鄢志杰本人被調到混元,無法和俞棟“雙劍合璧”;一說鄢志杰的團隊被調走了一批人,而把鄢和一個三五個人的小團隊留在了 AI Lab。
然而,“混元-O”項目的開發卻并不順利。由于缺乏語音數據,團隊巧婦難為無米之炊,最終的訓練結果自然不及預期。
這也在一定程度上導致了鄢志杰入職僅3個月便離開騰訊,轉而加入京東研究院。
再之后,俞棟也在各種組織變動之下離職。俞棟走后,AI Lab 的三劍客正式全部離開了騰訊,這也為后來AI Lab的撤銷埋下了伏筆。
不難發現,AI 大模型的出現,直接地挑戰著互聯網大廠的組織架構。
當 Transformer 架構一統語言、視覺、聲音等能力,當大量算力不得不向尖端部門集中,當技術的迭代開始以周為單位計算……
面臨歷史的浪潮,騰訊該何去何從?
(騰訊的 AI Lab 往事,雷峰網仍在持續跟進中,歡迎添加作者微信:william_dong,交流爆料。)
01
張正友時代:分工與重整
張潼離開騰訊之際,盧山及一眾騰訊高層都不得不認真反思:
“騰訊對管理科學家的用人方式,是不是出了問題?”
或許是此前給予張潼的發展空間過于有限,使其難以充分施展才華,這才促使他選擇離開,重返自己更為熟悉的學術界。
于是,接下了張潼 AI Lab 主任之位的張正友,也就被總辦賦予了更大的自由和話語權。甚至有消息稱,張正友加入騰訊時,總辦明確不為他和團隊設置硬性的 KPI,好讓科學家們能更自由地研究、發展。
![]()
張正友
而向外看去,2019 年前后,正是 AI 市場的又一個低潮期,資本逃出 AI 深水區、深度學習遇上瓶頸、落地場景受限嚴重等因素,導致市場對 AI 技術的評價開始兩極反轉,而大廠們也轉而關注怎樣把 AI 工程落地,實打實地賺到真金白銀。
張正友所在的 AI Lab,自然也有如此的焦慮。
此后數年,AI Lab 下設了產研中心,大批“工程部門”應運而生。Lab 的人員編制(HC)開始從研究中心向產研中心傾斜,管理層甚至會直接通過產研中心,調配 NLP 團隊的成員,這引發了團隊內部不少人的不滿。
而在張正友的管理下,核心技術骨干主要就是前文提及的 AI Lab 副主任俞棟,以及 AI Lab 原 NLP 中心負責人史樹明、視覺中心劉威等人。
俞棟 2017 年便加入騰訊 AI Lab,和張正友原本是在微軟的老同事,他身處美國西雅圖,在這座美國陰雨天最多的城市之一組建了 AI 實驗室。曾師從俞棟的齊筠這樣評價他:他是一位“傳統”的科學家,能力出眾,行事沉穩,少有權力欲,也鮮少過問其他部門的事務。
而掌管 NLP 中心的史樹明,也是一位特點鮮明的技術領袖。在前員工戴棕的眼中,史性格上和俞棟一樣溫和,同時有著研究者特有的“剛”勁,專注于“把事做成”。哪怕凌晨獨自編寫規則,連續工作 12 小時不停測試,他也非要把成果硬生生“拱”出來,不會一味追求技術層面是否完美。
![]()
史樹明
俞棟、史樹明這樣的中流砥柱,不僅學術影響力不小,接觸的項目也夠多,扛起了騰訊體系內 AI Lab 的這桿大旗。
時間來到 2023 年,ChatGPT 橫空出世。要做大語言模型,站在學術前沿的 AI Lab 與張正友,在當時必然要一馬當先。
混元最早在 2022 年底-2023 年初立項,成立虛擬組織,當時的負責人是張正友,由他調動公司其他團隊共同研發,主要的分工包括:機器學習平臺部負責預訓練、AI Lab 負責強化學習和后訓練,數據平臺部負責評測。當時TEG 的其他團隊也紛紛被調動起來,包括數據標注、安全等等。
機器學習平臺部的王迪,過去最早在 AI 平臺部做過搜索,自姚星離職后就匯報給蔣杰,一段時間以來,主攻方向是廣告場景中的搜廣推,在NLP領域有多年的經驗和積累。
![]()
王迪
與此同時,因其轄內多個部門均與混元團隊有合作,TEG 的蔣杰也多少參與其中。
大模型的研發關乎 TEG 的整體命運。于是,實際分屬張正友與蔣杰的團隊雙管齊下,向著大模型的共同目標,開啟了一場影響深遠的“團隊合作”。
張正友是當時混元的項目組組長,手下是俞棟的西雅圖實驗室,史樹明的深圳 NLP 中心,和制衡著 NLP 中心的產研中心三撥力量。
而在 TEG,王迪率領的機器學習平臺部(機平)、劉煜宏和劉威領銜的數據平臺部(數平),雖然仍然虛線匯報給張正友,但實際仍然是實線匯報給蔣杰。
“對待機平和數平兩個部門,正友過問的頻率相對 AI Lab 低一些,一起開會的次數也少很多。”一位 AI Lab 的前員工蒲佗如是說道。
數據平臺部的劉威是 AI Lab 創始 “三劍客” 之一,與張潼、俞棟同期加入團隊。他最早向張潼匯報,是早期 AI Lab CV 領域的技術大牛。
![]()
劉威
在公司內部,劉威一直以他的性格耿直、仗義執言著稱。
在 AI Lab 早期,張潼曾發全員郵件,要求 AI Lab 不要打無準備之仗,除非有把握能取得前三的成績,否則不要參與外部的比賽。而劉威則直接在全員郵件中回復“昨天我們說好,只要能進前五,就可以參賽”,直直地把矛盾暴露在所有人面前。
張潼走后,仍在 AI Lab 的劉威本是向張正友匯報,但奈何兩人關系一度緊張,便活水到了數平,實際向蔣杰一系匯報,通過 CV 技術幫助騰訊的廣告業務。
盡管對其他人,劉威顯得有些太過直白,但在團隊內,受到劉威照顧的人不少,他的技術實力也廣受認可,大家都親切地喊他一聲“威哥”。
在數據平臺部,劉威的上峰,是騰訊的老員工劉煜宏,早在2005 年加入騰訊。
據悉,劉煜宏懂得在大廠內部處理關系,能力以溝通見長。他的辦公室里常備著一副茶具,進入他辦公室的同學,他都會泡上一杯熱茶,總令他的手下聯想到“潮汕老板的作風”。
![]()
劉煜宏
TEG 的機平、AI Lab 和數平三個部門,就這樣開始了混元第一個版本模型的研發。
王迪的機器學習平臺部負責預訓練、俞棟旗下的 AI Lab 負責后訓練,劉煜宏的數平則負責為模型做評測。
鄂梅回憶,當時的 AI Lab,幾乎三軍用命,領導們也帶頭沖鋒,團隊每天加班到凌晨兩三點,周末無休,每天除了五個小時左右的睡眠,幾乎都在工作,這樣的日子持續了三四個月之久。
在這個過程中,聯合項目組陸續交付了幾個版本的模型,幾乎是每個月都有迭代,但是效果卻不能讓人滿意,加上當時國內百度、阿里巴巴都陸續發布了自研的模型,大家都覺得壓力很大,此時項目組也到了不得不交作業的時候。
這場圍繞混元的競爭,大概在 2023 年的五六月份就初見變化——上峰突然表示,AI Lab 不再負責后訓練,只專注強化學習。而這一切的導火索,則是數平部拿出了一個“號稱比 AI Lab 更好的模型”。
此前,數平一直在廣告場景對模型進行后訓練,因而積累了不少實戰技術和經驗。很快,數平便拿出來了一個新版本的模型,測試后發現效果還不錯,這就是當年 9 月面向公眾推出的混元 1.0 版本。
但在整個流程中,數平卻掌握著評定模型的大權,但又和機平同屬蔣杰一系。
如果說,數平的評分可以做到公平公正,那么在算力和數據上的巨大懸殊,也是 AI Lab 團隊繞不開的一道坎。
算力上,AI Lab 的團隊要進行如此大體量的工作,手里的 GPU 僅有小幾千張,規模甚至比不上一個初創公司,反觀機平的算力家底,甚至能達到 AI Lab 的數倍之多。
在數據上,鄂梅對雷峰網說,AI Lab 的數據獲取屢屢碰壁——拿到 PCG、WXG 的數據自是天方夜譚,只能通過買數據、爬公域數據的方式來支持強化學習。同時,AI Lab 和機平、數平在蒸餾的策略上也有所差別,最終也影響了他們具體的訓練成果。
這之后,AI Lab 的敗勢便難以逆轉,后來即使在強化學習的領域做的不錯,AI Lab 也還是把混元 RLHF 的業務交了出去。
“AI Lab 已經決定退出了,即使繼續做下去,某一天還是要交出去。”鄂梅對雷峰網如是說道。一段時間后,后訓練又從數平遷往了機平,完成了業務的又一次交棒。
有消息稱,在 AI Lab 在混元競賽中宣告失敗的當天,劉威曾只身來到 AI Lab 所在的樓層,挨個向工位上的同學噓寒問暖,自豪與喜悅之情溢于言表。
騰訊內部透露,混元的節奏進展緩慢,算力和數據上的制約也是一個很大的原因,早期不管是AI Lab 還是機平,總的卡數量不足幾千張,跟外界的數萬張比起來,差距非常懸殊。
自此,張正友 AI Lab 一系在混元全線撤退,但即使如此,這也并非他離開 AI Lab 最核心的原因。
(混元的實際開發細節,由于篇幅限制,有不少信息沒有錄入文中,騰訊的 AI 故事還遠沒講完,歡迎添加作者微信:william_dong,獲取更多八卦。)
2023 年到 2024 年,AI Lab 爆發了一場大規模的中層離職潮,技術、工程兩大板塊都有人離開。從分管視覺中心的 T15 技術專家王玨,到醫療中心負責人黃俊洲、分管虛擬人的暴林超,再到語音技術中心的蘇丹與翁超,一眾核心骨干相繼離開了騰訊。
而自知在騰訊難以為繼的史樹明,則是堅持到了最后一刻,等待團隊里大部分想走的同事塵埃落定,才最終選擇與騰訊分手。
離開了騰訊的史樹明,甚至自嘲“太好了,終于可以好好地學一下大模型了”,并自己獨力寫完了一個 VLLM 的推理架構——3.5 比特量化的推理框架 inferflow,還完成了一篇頗具前瞻性的技術報告,之后也覓到了一個好去處,過得自在。
而騰訊 AI Lab 這邊,史樹明一走,NLP 中心沒了員工,也沒了主心骨,組織就也散了。
一個總監離職事小,一個團隊跟著沒了就變成了大事。
于是,在 2024 年 8 月,騰訊召開了一場內部大會,張正友隨后離開 AI Lab,也自然不再負責混元相關事務。
02
蔣杰時代:大調整的全面醞釀
張正友離開 AI Lab 后,把棒交給了蔣杰。此時蔣杰也正是混元的主要負責人,當時組織調整的一大考慮,就是希望團隊之間的拉通和融合更加深入。
然而,AI Lab 已經開始走向下坡路,蔣杰接下的,正是這樣一個攤子。
相比張正友,蔣杰更像姚星——管理軍事化、高壓化,言語并不避諱,剛猛的氣魄和他在公司內部的英文名 Zeus(宙斯)相當契合。而他手下的骨干們,身上也有他從阿里帶來的“領地意識”,即使面對并不擅長、從未接觸過的工作,也敢于接活,充斥著“有戰用我,用我必勝”的樂觀。
![]()
蔣杰
于是,混元在蔣杰治下,迎來了前所未有的組織變革,目標是以 AI 為軸心的“大一統”。
首先,是史樹明離職后的 NLP 中心,與俞棟團隊合并,成為 AGI 中心,仍然分屬 AI Lab 旗下。
然而,AI Lab 終究不是蔣杰的“主戰場”,只是他攻伐下的又一個領地——最大的變化,卻首先發生在劉威身上。
混元一役前后,劉威便快速得以晉升,正以高速逼近騰訊內部技術線的天花板。
然而,出乎外界所有人預料,大廠前途一片光明的劉威,卻在升職不久后火速離職,外出創業 Video Rebirth,專研視頻生成算法。(劉威為何在事業巔峰期急流勇退?內部人士透露了哪些關鍵信息?他的創業項目又藏著怎樣的野心?歡迎添加作者微信:william_dong 深度交流。)
2024 年,正是 OpenAI 通過 Sora 引爆視頻生成技術的風口期,但技術路徑顯然還并不可見。劉威受命開發視頻模型,進展卻不如人意,在總辦也承壓不少。
在這個時候,劉煜宏則在外部,引入了華為的天才少年——鐘釗,來接手騰訊的混元視頻與圖像業務。
![]()
鐘釗
在華為,鐘釗的主要工作是神經架構搜索(NAS),但作為科研的常態,這條技術路徑不久就被證明是一條的“彎路”。到了騰訊,鐘釗在內部對過去的工作幾乎全盤否定,要求把視頻模型的研發從頭來過,技術理念不同,劉威也在同年離職創業。
在騰訊站穩腳跟,鐘釗便開始招攬華為的同袍。而另一方面,面對技術路徑,有傳聞稱,鐘釗不怕“跟進”,讓團隊的應屆生、實習生紛紛找到自己母校實驗室的師哥師姐取經,要來他們的實現方案、數據來源和清洗方法,以此強化混元的多模能力。
不久,鐘釗也將圖像生成團隊兼并進了自己的麾下。
去年Q1,團隊內部就開始進行音畫一致預研,內部有人提出可以將音頻和視頻同步訓練,不僅能增加“音畫同出”的能力,更能讓模型的智能和魯棒性進一步提升了,然而由于內部音畫一致數據缺乏,方案到年底才開始進行。這個技術路徑在今天也被可靈3.0和Seedance2.0所驗證。
鐘釗接管劉威團隊后,原先劉的手下幾乎流失八成。
劉威離職 8 個月之后,從阿里離職的薄列峰(也就是網上風傳的“Linus”)加入了騰訊混元,分管混元的多模態模型部,一攬文生圖、文生視頻、文生 3D 和數字人四大部門。
![]()
薄列峰
在騰訊,羅福對薄列峰的評價不錯,說他對技術細節相當關注,甚至會過問自己 -2 的具體工作,把管理抓得很細。
薄列峰的到任,總算是暫時穩住了混元多模態模型部的結構,讓改變得以緩慢發生。
與此同時,AI Lab 的組織調整卻還在繼續,R1-R4 四個部門興起,并且以合伙人制的方式,打破了原有的體系設置。
其中,R1 的合伙人還是 AI Lab 的副主任俞棟;R2 的合伙人則是 2025 年一月入職,MSRA 視覺計算組前首席研究員胡瀚;R3 的合伙人是在字節曾任Seed大模型視覺基礎研究團隊負責人的馮佳時;R4 的合伙人則是曾經開發了王者“絕悟”的技術負責人,也是公司最年輕的 leader 總監,最年輕的首席專家——葉德珩。
![]()
葉德珩
然而,新變陣的 AI Lab,最終還是出了問題,而且問題出在了素來與世無爭的俞棟身上。
鄢志杰事件之后,俞棟重新梳理了一個 20 人的團隊,準備重新出發。然而一年還沒過去,俞棟又接收到了要把團隊并進多模態模型部的信號。
公平地說,語音工作與混元在多模態領域的布局,在某種程度上的確密不可分。新的技術路線之下,語音工作必須依托于大模型底座,才能取得更好的效果。
但對俞棟而言,這無疑是第二次觸動了他的痛處。
“俞老師本來就是一個技術能力極強的人,”原先在俞棟團隊的常白評價道,“讓他帶一個小團隊突破,他能做出很好的成果——而如果把俞老師推到管理崗承壓,最后結果就不會太好。”
于是,就如先前在中說道的一樣,俞棟幾乎在靜默中悄然離職,不久后,他的語音團隊被正式劃入薄列峰治下,成為了多模態模型部的第五個板塊。
自此,張潼、劉威、俞棟先后離職,AI Lab 的三劍客正式全部離開了騰訊。
而俞棟的離開,難免讓騰訊的總辦想起短短兩年前的史樹明等人——與其放任 AI Lab 成為一具空殼,不如先破后立,重新設計混元的組織架構。
于是 AI Lab 成為了歷史,蔣杰也退出了混元體系。混元的姚順雨時代要來了。
03
姚順雨時代:讓 AI Native 的人領路
和不少 AI Lab 做研究的科學家交流,他們往往會提到一個情況:在實際的研究工作中,他們長期碰不到基模。
一方面原因,是過去根深蒂固的部門墻,阻隔了 AI Lab 和基模團隊之間的通路;而另一方面,基模是與自己無關的工作,AI Lab 也不愿涉入太深,生怕踩了別人領地。
而在宣布 AI Lab 撤銷的全員會上,姚順雨則直言,要打破這面“堅不可摧”的墻。
![]()
姚順雨
事實上,選擇姚順雨,一定是騰訊總辦的深思熟慮——小馬哥和總辦高層在硅谷聊人無數,但最后選擇了這個博士畢業僅兩年的 95 后,必然有他們的道理。
加入騰訊時,姚順雨雖然不在總辦,卻能給總辦“上課”,直接對劉熾平匯報。
在今天的 AI Lab 撤銷后,姚順雨的混元大語言模型部和 AI Infra 部,與 TEG 薄列峰的混元多模態模型部平行,在不同的方向展開工作。
在姚順雨旗下,有多方信源確認,當下有五大板塊,分別是預訓練、后訓練、Baseline Infra、模型評估和 Frontier(前沿)。其中,前沿組則招納了不少原來 AI Lab 的人。
“大家做的事情還是一樣的,只是換個地方而已。” AI Lab 的一位科學家賀瀾說道。
除了王迪以外,胡瀚也在被薄列峰辭去了在多模態模型部的工作后,加入了姚順雨的旗下,專注多模態理解的研究。原先 R3 實驗室的馮佳時仍然還在,研究 GUI Agent 的相應工作。
![]()
馮佳時
而其他的十余個小組中,不乏來自 Seed、DeepSeek、Qwen、Kimi 的大牛以及大量從頂尖院校畢業的應屆生。混元的團隊也正變得越來越年輕,越來越敏捷。盧山曾在內部講話中提及,大模型時代,要讓AI Native的帶來新想法和新思路。
但即使如此,騰訊混元的變革仍在繼續。姚順雨也正在面臨一場大考,想法再大,最后也要用模型說話。
(姚順雨時代的騰訊混元,會變得更好嗎?他的第一場“大考”成績究竟如何?雷峰網正在持續關注中,歡迎添加作者微信:william_dong,獲取更多一手信息。)
終究不愿再談不切實際的美夢,姚順雨的目標,就是在 2026 年中,讓混元做進國內第一梯隊。
04
結語
事后,當常白問及離職的真正原因時,俞棟的反應只有一句淡淡的“體感不好”。
而這句“體感不好”,或許也體現出了不少科學家們在 AI Lab 的處境。
理論上,科學家應該是最好管的一批人。
他們大多自驅,不需要人在后面拿著鞭子趕。給他們一片花園,告訴他們邊界在哪里,他們會自己翻土、播種、澆水、施肥,日復一日,靜待花開。科學研究有自己的規律,急不得,也快不了。
但AI時代的問題在于,商業邏輯和技術演進路線的變化太快了。
過去的科研可以“花大錢辦小事”——投一個實驗室,養一撥人,三五年出一篇頂會論文,企業照樣覺得值。
但今天,時代變了。
AI正在從“多個獨立方向的平行研究”收斂為“一個統一架構的工程化落地”。獨立AI Lab是第一個時代的最優組織形式,但在當前范式下,它的存在反而制造了摩擦——研究和產品之間隔了一層,資源在多個方向上分散,決策鏈條被拉長。
所以AI Lab們的落幕,是一種必然,也是AI朝向更寬廣方向發展的必經之路。
實驗室時代結束了,大模型時代來了,混元的故事才剛剛開始。
(騰訊 AI Lab 往事系列文章仍在繼續推出,雷峰網將持續關注寫作,歡迎添加作者微信:william_dong,交流認知,分享八卦。)
*齊筠、戴棕、蒲佗、嚴蕩、鄂梅、巫宕、羅福、常白、賀瀾等均為化名。
未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!
公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.