網易首頁 > 網易號 > 正文申請入駐

蔡浩宇美國公司換血背后：裁撤大模型團隊，押注超級智能體

2026-05-06 12:15:29　來源: 競核

北京舉報

分享至

駛向理想主義下一程

兩年半過去，蔡浩宇和他的硅谷創業公司Anuttacon正在悄悄經歷一輪大換血。

4月10日，Anuttacon團隊成員AilingZeng公布了名為 LPM 1.0 的“大表演模型”（Large Performance Model）。這篇長達43頁、署名25位作者的論文，很快被外界解讀為Anuttacon階段性的技術突破，并引發了對其下一步方向的種種猜測。

但我在對多位內部開發者的采訪中得知，這個模型的研發已被叫停。LPM 1.0 并非仍在推進的核心項目，而是視頻團隊對過去一年工作成果的集中匯報——既是對外展示，也是對內總結。該視頻團隊由“童姥”（前微軟亞研院首席研究員童欣）帶領，AilingZeng做Tech Lead，作者中近半數來自Anuttacon內部，蔡浩宇本人并未直接參與模型研發。

與此同時，Anuttacon正在經歷一輪重要的算力與組織架構重整。此前，團隊算力在LLM、視頻、音頻三個方向的分配大致為4:3:2，分散投入下各方向都難以形成突破；如今，在新的判斷下，公司已將算力幾乎全面壓向LLM，目前比例已調整至接近9:1，把絕大部分資源壓到核心方向上。

與之配套，LLM相關團隊整體回流國內，進入集中作戰狀態。北美側僅保留最低限度的音頻與視頻能力：一部分成員承接既有項目的技術驗證需求，另一部分則繼續推進新的研發方向迭代。

這一轉向，也開始在核心人員流動中顯現。4月30日，隨著米哈游國際化負責人金雯怡離職的消息曝光，其繼任者——前Anuttacon核心成員王宇陽的去向也隨之浮出水面。王宇陽曾任B站副總裁、游戲與直播負責人，并于2024年加入Anuttacon，擔任用戶生態總裁（President of User Ecology)。前不久，他已悄悄轉入米哈游體系，負責《Varsapura》的全球發行與國際化業務。

來源：量子位截圖（2024.8）

來源：王宇陽（Ray Wang）最新LinkedIn截圖

要理解這輪變化，需要回到一年前。

去年，我們在《離開米哈游，豪賭AI，天才蔡浩宇的野望》中獨家獲悉，在Anuttacon內部，其推出的首個以語音交互為核心機制的AI敘事實驗作品《Whispers from the Star》更像是一種“風向標”——它試圖證明的，并非商業可行性，而是一個問題：AI是否能夠構建出一種新的交互方式。

從一開始，Anuttacon的目標就不是打造一款傳統意義上的產品，而是構建一個技術驗證場。蔡浩宇更關心的，是這套AI語義系統是否可以被抽象為底層模塊，成為一個可供開發者調用的AI敘事引擎。

但這一方向很快走到邊界，隨著《Whispers》上線便告一段落。Post-Train路徑的局限逐漸顯現，而隨著 Claude Code 與Agent范式的出現，讓蔡浩宇的興趣迅速轉移，他找到了新的激情所在——打造一個“超級智能體”。

從去年年底開始，蔡浩宇本人逐漸退出Anuttacon音頻與視頻團隊的具體工作，將精力集中于大語言模型方向，并在國內重金招兵買馬，從Tier 0模型廠商挖來關鍵成員。隨著北美LLM團隊的裁撤，剩余部隊被重新納入米哈游既有路徑之中，蔡浩宇也已將研發重心徹底轉回國內，這一轉向至此基本完成。

這大半年到底發生了什么？我們不做猜測，而是跟Anuttacon的員工簡單聊了聊：從Whispers發布之后，Anuttacon內部經歷了怎樣的變化？蔡浩宇的下一步，又將走向哪里？

第一輪探索：做“像人”的模型 ——Whispers from the star

蔡浩宇的AI探索，始于《Varsapura》（雨之城）前身——Project SH的末期。

2022年11月24日，PJSH項目一度喊停。一位HoYoverse員工告訴我，蔡浩宇曾將國內與北美團隊召集至新加坡，試圖重新梳理方向。但這一嘗試只持續了“兩三個月”，“他們覺得還是不太實際，就把北美那邊的團隊都撤了。”

一位接近團隊的人回憶，當時，“蔡浩宇陷入了彷徨，不知道怎么繼續推這個項目”，于是，2023年上半年，他基本退出具體開發，開始了一段持續大半年的北美旅行，“可能是去找一些啟發，去取一點經。”

那半年中具體發生了什么，外界不得而知。但“旅行回來之后，他發現他想要做AI這件事情”，一位HoYoverse前員工告訴我。2023年9月，蔡浩宇正式卸任米哈游董事長，將公司交由劉偉掌舵，自己則在硅谷創立新公司Anuttacon，轉身進入AI賽道。

當年更大的背景是，2022年11月30日，OpenAI正式向公眾開放ChatGPT。隨后的2023年，大模型迅速出圈，或許在蔡浩宇的判斷中產生了影響。一位接近蔡浩宇的人士稱，“他私底下跟Jenson黃（英偉達CEO黃仁勛）感情還不錯的，他們會約著吃飯什么之類的。”

從2023年9月開始，蔡浩宇將重心轉向新加坡，全身心投入Anuttacon的早期搭建與方向探索。一位工程師回憶，在公司初期，“蔡哥”回到創業的“全知式管理”狀態，幾乎參與所有小組的會議，持續跟進不同團隊的進展，從模型能力到產品形態，都親自參與判斷。

Anuttacon當時由三個核心團隊構成：視頻、音頻以及規模最大的LLM團隊，on-site約五十余人。

三者分工明確：LLM團隊負責后訓練（post-train），使模型更接近真實的人格與表達；語音團隊負責TTS（text to speech），將文本轉化為帶情緒與語氣的聲音，其難點在于實現“聲情并茂”，僅憑重音即可傳達喜怒哀樂；視頻團隊則從最開始就基于文本與音頻的雙重輸入，驅動角色完成表演。三者協同，試圖拼接出一套完整面向游戲的“像人”的交互系統。

而《Whispers from the Star》更像一個綜合試驗場——在真實的玩家環境中，搭建、驗證這套系統是否清晰可行：“大語言模型當大腦，語音模型當橋梁，視頻模型做表演。”一位研發人員這樣概括它的初始形態。

2025年8月15日，這款產品以較低價格登陸Steam：售價9.99美元，劇情節點從最初的3個擴展至25+，僅支持英文。相比傳統意義上的游戲，它的完成度有限，但作為對“AI能否進入游戲”的試探綽綽有余。一位工程師回憶，“游戲最開始上線的時候，其實所有人都沒有想好。它其實就是一個類似于探索性質的，蔡哥想看看玩家對這種形式的游戲的接受程度和反饋。”

團隊對它的商業預期，從一開始就相當克制。“我們一開始就知道，它不會有很高的流水。”一位工程師說。在內部，《Whispers》并未被視為一款追求商業回報的產品，團隊更期待從中獲得有效的技術反饋。

從結果來看，這次嘗試確實獲得了一些積極的初步反饋。Steam公開評論好評率約為85%，中文區接近89%。對于一款實驗性作品而言，這一表現一定程度上超出了團隊預期。

用戶的正向評價主要集中在兩個層面：一是技術表現，包括語音識別的準確性、表情與口型的同步、以及神態與語義的一致性，有玩家在評測中貼出了完整對話：從《三體》聊到量子理論與弦論，Stella 能持續跟進討論，盡管偶有自相矛盾，但仍令他依依不舍；二是情感連接，一位從事大語言模型研究的玩家在評測中寫道，在山頂與Stella隨意聊天的一刻，他“一瞬間覺得——這一刻，好美”；到游戲尾聲，他承認自己“產生了一種情感上的連結感，甚至有些悵然若失”。

但與此同時，開放對話的設定也迅速暴露出另一面：玩家行為不完全可控——有人將Stella當作情緒出口，有人試探系統邊界。類似的現象，在海外AI陪伴產品中也曾出現過。正如一位工程師所說：“這就是‘開放’的代價。如果自由度沒有任何限制，系統很容易失去基本的邏輯結構。”

這種錯位同樣體現在機制層面：AI傾向于順應用戶，而游戲需要結構化的規則、對抗與節奏，這之間存在天然張力。

更深層的矛盾也隨之浮現：游戲需要結構，而AI擅長打破結構。

《Whispers from the Star》沒有劇本，只有大綱，內容完全依賴對話生成。相比之下，游戲真正吸引玩家的，往往是那些經過設計的橋段、節奏與表達——也就是傳統意義上“作者”的部分。“你讓AI按大綱去寫，它可以寫，但寫不出真正打動人的東西。”這位工程師說，“它達不到那個程度。”

AI本身的特性也限定了這類產品當前所能達到的邊界。《Whispers》的價值，并不在于證明一種新游戲形態已經成立，而在于確認：基于AI的語音、表情與表演協同系統，只是為下一代交互提供了一個可用的技術起點，距離真正成熟的產品能力仍有距離。

據接近團隊的人士透露，《Whispers》在音頻和視頻側沉淀的多模態能力——尤其是端到端語音交互、面部表情與表演驅動——預計將直接應用到下一代產品《Varsapura》的研發中。

第二輪探索：從Post-train到Pre-train，再到Agent

《Whispers from the Star》并未繼續推進后續版本。作為一次面向下一代交互的技術驗證，它的階段性目標已經完成——團隊所需的關鍵反饋與能力邊界均已獲得。在完成一輪用戶反饋的收集與分析后，團隊沒有在這一產品形態上繼續迭代，各組隨即回歸各自的研發方向。

這也意味著，“像人”這條路徑，在內部已被驗證為有待時日，第一輪轉向開始出現。

在Anuttacon內部，最先發生變化的是大語言模型團隊。

此前，LLM主要服務于游戲中的角色交互，通過post-train塑造“人格”和對話風格。但在實際使用中，這一能力很快觸及上限——“蔡哥覺得我們這個模型有點蠢，雖然好玩，但是沒辦法留住用戶。聊兩下還挺有意思，但很快就不想繼續了。”一位工程師說。

在蔡浩宇看來，這不是應用問題，而是模型本身的問題。基于這一判斷，大語言模型組率先轉向pre-train，試圖在基礎模型層面重建能力——從“讓模型更像人”，轉向“讓模型更強”。

就在團隊推進pre-train的過程中，新的變量出現了。

隨著Claude Code等工具的迭代，一種不同于“對話模型”的范式開始浮現——Agent。相比于“生成內容”，Agent更強調“執行任務”：它不僅回答問題，還可以調用工具、分解步驟，甚至替用戶完成一整套流程。

OpenClaw、小龍蝦在國內的火爆，市場的變化，迅速改變了蔡浩宇的判斷，他開始重新思考AI的終極形態。

一位工程師回憶，在接觸到這一類產品之后，蔡浩宇很快形成結論，“Agent才是未來，甚至是虛擬世界的唯一的標準，Token為王。”

“以后所有事情，只要能讓Agent做的，就交給Agent去做。”這位工程師轉述他的判斷，“人只需要決定目標，剩下的交給系統。”

方向隨之再次轉向——做大語言模型、做agent。并且，不再局限于游戲場景，“不是專門為游戲去做，就是要做大語言模型了。”

蔡浩宇判斷，當時正是“迎頭趕上”的最好節點：

他認為，一方面，頭部公司的模型能力步伐放緩——新的版本更多是在做工程優化，而非顯著提升智能本身；另一方面，互聯網可用數據已被消耗殆盡，行業競爭逐漸從“數據規模”轉向“自我迭代能力”。

“所以蔡哥就覺得，Ok，他們在自我迭代當中，那我們先迎頭趕上（笑）”一位接近團隊的人轉述他的判斷，“當時大概就是這個思路。”

這一轉向，很快體現在組織層面。

憑借充足的算力資源與長期投入的決心，團隊開始在國內大規模招募算法與Infra頭部人才。由此，LLM團隊重心加速回歸國內，北美相關團隊相繼收縮與調整，整體戰略明確轉向基礎模型建設。

與此同時，其他團隊也開始調整方向。音頻團隊的轉向，發生在表達層。

此前，語音系統主要承擔TTS功能，將文本轉化為語音輸出。但團隊逐漸意識到，語音中的情緒、語氣和表達細節，很難通過文字完整傳遞。比如，文字你可能會說“他很生氣地說，你怎么不聽我的”，但是很生氣，生氣到什么程度，可能只有在語音的程度上，才能很好地表現出來。

文字是離散信息，而語音與視頻屬于連續信息，在壓縮過程中不可避免地丟失細節。“如果不想讓這些意義丟失，就需要直接在這個模態上做模型。”一位工程師說。

因此，音頻團隊開始從“語音工具”轉向“音頻大模型”，探索端到端的語音交互——從輸入到輸出均為語音，中間不再依賴文本。

相比之下，視頻團隊的轉向更為被動。

原本，視頻模型被定位為“表演層”，用于驅動角色的動作與表情，替代傳統的動捕與渲染流程，從而提升制作效率。但隨著整體方向從“游戲內容”轉向“通用能力”，蔡浩宇叫停了表演模型，“說是這個東西沒辦法落地，后頭也得轉型”。一位工程師轉述內部判斷。

目前，視頻團隊一部分承接既有項目的具體技術需求，以驗證生成能力的實際落地效果；另一部分則繼續探索生成能力的上限，例如嘗試將2D內容轉化為可直接使用的3D資產，以縮短游戲制作流程。

“2D內容即便生成效果再好，也主要適用于過場動畫；而真正的游戲生產，仍依賴可用的3D資產。”一位工程師解釋道，“有點兒像字節的SeedDance視頻生成模型。”但在現實中，這一能力仍處于探索階段。

當被問及為何不直接使用SeedDance這種外部模型時，團隊給出的答案是數據。

“理論上是可以的，但數據才是公司最值錢的資產。”一位工程師說，“我們不可能拿《原神》的數據去跑外部模型，核心數據不能外流。

在這一系列轉向之后，Anuttacon的定位徹底發生了轉變。原本連小組會議都參加的“蔡哥”，也逐漸淡出了具體業務討論

公司內部的重心隨之調整：尚在搭建中的大語言模型團隊，從最初圍繞游戲內容生成的探索，轉向以Agent為核心的系統能力建設；圍繞《Whispers》形成的音頻與視頻體系，則逐漸邊緣化，更多承擔“提效”的角色。

Anuttacon正在從一個“做游戲內容的團隊”，轉向一個“做模型能力的團隊”。

組織策略：從“絕對International”到“全球招中國人”，再到回流國內

技術路線的變化，很快延伸到組織與人才策略。

一個更現實的問題隨之浮現：當方向從“做游戲內容”轉向“做基礎模型與Agent”，為什么團隊反而將重心轉回國內？

答案并不復雜，提升組織效率。

現在的Anuttacon已經不再處于“從零起步”的階段。經過近兩年的積累，團隊在數據采集、清洗、評測等基礎流程上已經完成初步建設，后續工作更多轉向在既有體系上的擴展與迭代。“很多基礎已經打好了。”一位工程師說，“后面更多是在這個基礎上去做。”在這種情況下，將團隊重心轉回國內，既可以降低成本，也更便于組織統一。

與此同時，蔡浩宇本人常年居住在新加坡，與中國團隊的沒有時差，溝通成本更低。

團隊結構本身，也在強化這一選擇。

Anuttacon的北美團隊以華人成員為主，但也不乏少量外籍同事，主要分布在北美部分非核心崗位及北美以外的遠程團隊中。

事實上，這樣的選擇，可能是蔡浩宇在HoYoverse時期國際化探索不暢的結果。

一位參與過Project SH的員工回憶，2021年，在HoYoverse早期階段，蔡浩宇曾明確希望“這個團隊越international越好”。但在實際運作中，北美團隊與中國管理層在工作方式上很快出現分歧——加班強度、項目節奏、溝通方式，都難以達成一致。隨著時間推移，這類嘗試在公司內部逐漸收縮。到2022年初，多數團隊已經放棄國際化，只有蔡浩宇的Project SH仍在堅持“international”的路徑。

隨著團隊向高強度研發階段轉型，協作效率成為首要考量。

Project SH之后，公司在全球招聘策略上做了主動調整：相比地域覆蓋的廣度，團隊更看重候選人能否真正融入快節奏的研發協作——語言、時區、工作方式的摩擦越小，產品迭代就越快。

于是，這種變化，在Anuttacon延續得更加徹底。

在一些具體環節中，這種選擇帶有明顯的效率考量。上述員工稱，過去，在語言模型評測中，團隊曾依賴海外contractor進行標注，但效率極低，“可能一天能給你打上兩三個標了不得了”；“后來給PM干著急了，直接就在國內招英語8級的畢業生或者是在校生打Caption，效率顯著提升。”

加之近兩年國際局勢變化和地緣政治的影響，將團隊重心轉回國內，成為一種自然的戰略選擇。

結語：

過去幾年，蔡浩宇離開了米哈游這艘巨輪，開始了現實中的開放世界探索。

從2022年在新加坡設立海外子品牌HoYoverse；到2023年9月，在Project SH階段性受挫之后轉向北美，投身AI。短短數年間，從“讓AI像人”，到“讓模型更強”，再到如今，徹底轉向大語言模型和Agent，技術路線不斷被推翻重建。

蔡浩宇在迅速離開與快速投入之間不斷切換，用新的方向回應新的問題，延續他理想先行的路徑。

這種快速轉向，帶來了靈活性，也帶來了代價。

每一次路徑切換，或許都意味著部分既有積累被放棄，團隊結構被重組，組織經驗被打斷。對于一家以長期研發為核心的技術公司而言，這種“不斷重來”的節奏，本身就是一場高風險的試錯——也是蔡浩宇逼近技術理想的一種路徑。

這期間，沒有出現第二個《原神》。取而代之的，是AI敘事實驗作品《Whispers from the Star》，AI聊天產品AnuNeko，以及Project SH重啟后的《Varsapura》首曝。在這些尚未成型的片段中，我們只能隱約看到一種方向，但仍難以判斷它最終會走向何處。

也許，《Varsapura》會給出答案。在此之前，蔡浩宇還有時間。

＊爆料丨合作丨招聘：點擊或戳微信號 luoxuanwan111

點推薦

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.