![]()
駛向理想主義下一程
兩年半過去,蔡浩宇和他的硅谷創業公司Anuttacon正在悄悄經歷一輪大換血。
4月10日,Anuttacon團隊成員AilingZeng公布了名為 LPM 1.0 的“大表演模型”(Large Performance Model)。這篇長達43頁、署名25位作者的論文,很快被外界解讀為Anuttacon階段性的技術突破,并引發了對其下一步方向的種種猜測。
![]()
但我在對多位內部開發者的采訪中得知,這個模型的研發已被叫停。LPM 1.0 并非仍在推進的核心項目,而是視頻團隊對過去一年工作成果的集中匯報——既是對外展示,也是對內總結。該視頻團隊由“童姥”(前微軟亞研院首席研究員童欣)帶領,AilingZeng做Tech Lead,作者中近半數來自Anuttacon內部,蔡浩宇本人并未直接參與模型研發。
![]()
與此同時,Anuttacon正在經歷一輪重要的算力與組織架構重整。此前,團隊算力在LLM、視頻、音頻三個方向的分配大致為4:3:2,分散投入下各方向都難以形成突破;如今,在新的判斷下,公司已將算力幾乎全面壓向LLM,目前比例已調整至接近9:1,把絕大部分資源壓到核心方向上。
與之配套,LLM相關團隊整體回流國內,進入集中作戰狀態。北美側僅保留最低限度的音頻與視頻能力:一部分成員承接既有項目的技術驗證需求,另一部分則繼續推進新的研發方向迭代。
這一轉向,也開始在核心人員流動中顯現。4月30日,隨著米哈游國際化負責人金雯怡離職的消息曝光,其繼任者——前Anuttacon核心成員王宇陽的去向也隨之浮出水面。王宇陽曾任B站副總裁、游戲與直播負責人,并于2024年加入Anuttacon,擔任用戶生態總裁(President of User Ecology)。前不久,他已悄悄轉入米哈游體系,負責《Varsapura》的全球發行與國際化業務。
![]()
來源:量子位截圖(2024.8)
![]()
來源:王宇陽(Ray Wang)最新LinkedIn截圖
要理解這輪變化,需要回到一年前。
去年,我們在《離開米哈游,豪賭AI,天才蔡浩宇的野望》中獨家獲悉,在Anuttacon內部,其推出的首個以語音交互為核心機制的AI敘事實驗作品《Whispers from the Star》更像是一種“風向標”——它試圖證明的,并非商業可行性,而是一個問題:AI是否能夠構建出一種新的交互方式。
從一開始,Anuttacon的目標就不是打造一款傳統意義上的產品,而是構建一個技術驗證場。蔡浩宇更關心的,是這套AI語義系統是否可以被抽象為底層模塊,成為一個可供開發者調用的AI敘事引擎。
但這一方向很快走到邊界,隨著《Whispers》上線便告一段落。Post-Train路徑的局限逐漸顯現,而隨著 Claude Code 與Agent范式的出現,讓蔡浩宇的興趣迅速轉移,他找到了新的激情所在——打造一個“超級智能體”。
從去年年底開始,蔡浩宇本人逐漸退出Anuttacon音頻與視頻團隊的具體工作,將精力集中于大語言模型方向,并在國內重金招兵買馬,從Tier 0模型廠商挖來關鍵成員。隨著北美LLM團隊的裁撤,剩余部隊被重新納入米哈游既有路徑之中,蔡浩宇也已將研發重心徹底轉回國內,這一轉向至此基本完成。
這大半年到底發生了什么?我們不做猜測,而是跟Anuttacon的員工簡單聊了聊:從Whispers發布之后,Anuttacon內部經歷了怎樣的變化?蔡浩宇的下一步,又將走向哪里?
![]()
第一輪探索:做“像人”的模型 ——Whispers from the star
蔡浩宇的AI探索,始于《Varsapura》(雨之城)前身——Project SH的末期。
2022年11月24日,PJSH項目一度喊停。一位HoYoverse員工告訴我,蔡浩宇曾將國內與北美團隊召集至新加坡,試圖重新梳理方向。但這一嘗試只持續了“兩三個月”,“他們覺得還是不太實際,就把北美那邊的團隊都撤了。”
一位接近團隊的人回憶,當時,“蔡浩宇陷入了彷徨,不知道怎么繼續推這個項目”,于是,2023年上半年,他基本退出具體開發,開始了一段持續大半年的北美旅行,“可能是去找一些啟發,去取一點經。”
那半年中具體發生了什么,外界不得而知。但“旅行回來之后,他發現他想要做AI這件事情”,一位HoYoverse前員工告訴我。2023年9月,蔡浩宇正式卸任米哈游董事長,將公司交由劉偉掌舵,自己則在硅谷創立新公司Anuttacon,轉身進入AI賽道。
![]()
當年更大的背景是,2022年11月30日,OpenAI正式向公眾開放ChatGPT。隨后的2023年,大模型迅速出圈,或許在蔡浩宇的判斷中產生了影響。一位接近蔡浩宇的人士稱,“他私底下跟Jenson黃(英偉達CEO黃仁勛)感情還不錯的,他們會約著吃飯什么之類的。”
從2023年9月開始,蔡浩宇將重心轉向新加坡,全身心投入Anuttacon的早期搭建與方向探索。一位工程師回憶,在公司初期,“蔡哥”回到創業的“全知式管理”狀態,幾乎參與所有小組的會議,持續跟進不同團隊的進展,從模型能力到產品形態,都親自參與判斷。
Anuttacon當時由三個核心團隊構成:視頻、音頻以及規模最大的LLM團隊,on-site約五十余人。
三者分工明確:LLM團隊負責后訓練(post-train),使模型更接近真實的人格與表達;語音團隊負責TTS(text to speech),將文本轉化為帶情緒與語氣的聲音,其難點在于實現“聲情并茂”,僅憑重音即可傳達喜怒哀樂;視頻團隊則從最開始就基于文本與音頻的雙重輸入,驅動角色完成表演。三者協同,試圖拼接出一套完整面向游戲的“像人”的交互系統。
![]()
而《Whispers from the Star》更像一個綜合試驗場——在真實的玩家環境中,搭建、驗證這套系統是否清晰可行:“大語言模型當大腦,語音模型當橋梁,視頻模型做表演。”一位研發人員這樣概括它的初始形態。
![]()
2025年8月15日,這款產品以較低價格登陸Steam:售價9.99美元,劇情節點從最初的3個擴展至25+,僅支持英文。相比傳統意義上的游戲,它的完成度有限,但作為對“AI能否進入游戲”的試探綽綽有余。一位工程師回憶,“游戲最開始上線的時候,其實所有人都沒有想好。它其實就是一個類似于探索性質的,蔡哥想看看玩家對這種形式的游戲的接受程度和反饋。”
![]()
團隊對它的商業預期,從一開始就相當克制。“我們一開始就知道,它不會有很高的流水。”一位工程師說。在內部,《Whispers》并未被視為一款追求商業回報的產品,團隊更期待從中獲得有效的技術反饋。
從結果來看,這次嘗試確實獲得了一些積極的初步反饋。Steam公開評論好評率約為85%,中文區接近89%。對于一款實驗性作品而言,這一表現一定程度上超出了團隊預期。
用戶的正向評價主要集中在兩個層面:一是技術表現,包括語音識別的準確性、表情與口型的同步、以及神態與語義的一致性,有玩家在評測中貼出了完整對話:從《三體》聊到量子理論與弦論,Stella 能持續跟進討論,盡管偶有自相矛盾,但仍令他依依不舍;二是情感連接,一位從事大語言模型研究的玩家在評測中寫道,在山頂與Stella隨意聊天的一刻,他“一瞬間覺得——這一刻,好美”;到游戲尾聲,他承認自己“產生了一種情感上的連結感,甚至有些悵然若失”。
![]()
但與此同時,開放對話的設定也迅速暴露出另一面:玩家行為不完全可控——有人將Stella當作情緒出口,有人試探系統邊界。類似的現象,在海外AI陪伴產品中也曾出現過。正如一位工程師所說:“這就是‘開放’的代價。如果自由度沒有任何限制,系統很容易失去基本的邏輯結構。”
這種錯位同樣體現在機制層面:AI傾向于順應用戶,而游戲需要結構化的規則、對抗與節奏,這之間存在天然張力。
更深層的矛盾也隨之浮現:游戲需要結構,而AI擅長打破結構。
《Whispers from the Star》沒有劇本,只有大綱,內容完全依賴對話生成。相比之下,游戲真正吸引玩家的,往往是那些經過設計的橋段、節奏與表達——也就是傳統意義上“作者”的部分。“你讓AI按大綱去寫,它可以寫,但寫不出真正打動人的東西。”這位工程師說,“它達不到那個程度。”
AI本身的特性也限定了這類產品當前所能達到的邊界。《Whispers》的價值,并不在于證明一種新游戲形態已經成立,而在于確認:基于AI的語音、表情與表演協同系統,只是為下一代交互提供了一個可用的技術起點,距離真正成熟的產品能力仍有距離。
據接近團隊的人士透露,《Whispers》在音頻和視頻側沉淀的多模態能力——尤其是端到端語音交互、面部表情與表演驅動——預計將直接應用到下一代產品《Varsapura》的研發中。
![]()
![]()
第二輪探索:從Post-train到Pre-train,再到Agent
《Whispers from the Star》并未繼續推進后續版本。作為一次面向下一代交互的技術驗證,它的階段性目標已經完成——團隊所需的關鍵反饋與能力邊界均已獲得。在完成一輪用戶反饋的收集與分析后,團隊沒有在這一產品形態上繼續迭代,各組隨即回歸各自的研發方向。
這也意味著,“像人”這條路徑,在內部已被驗證為有待時日,第一輪轉向開始出現。
在Anuttacon內部,最先發生變化的是大語言模型團隊。
此前,LLM主要服務于游戲中的角色交互,通過post-train塑造“人格”和對話風格。但在實際使用中,這一能力很快觸及上限——“蔡哥覺得我們這個模型有點蠢,雖然好玩,但是沒辦法留住用戶。聊兩下還挺有意思,但很快就不想繼續了。”一位工程師說。
在蔡浩宇看來,這不是應用問題,而是模型本身的問題。基于這一判斷,大語言模型組率先轉向pre-train,試圖在基礎模型層面重建能力——從“讓模型更像人”,轉向“讓模型更強”。
就在團隊推進pre-train的過程中,新的變量出現了。
隨著Claude Code等工具的迭代,一種不同于“對話模型”的范式開始浮現——Agent。相比于“生成內容”,Agent更強調“執行任務”:它不僅回答問題,還可以調用工具、分解步驟,甚至替用戶完成一整套流程。
![]()
OpenClaw、小龍蝦在國內的火爆,市場的變化,迅速改變了蔡浩宇的判斷,他開始重新思考AI的終極形態。
一位工程師回憶,在接觸到這一類產品之后,蔡浩宇很快形成結論,“Agent才是未來,甚至是虛擬世界的唯一的標準,Token為王。”
“以后所有事情,只要能讓Agent做的,就交給Agent去做。”這位工程師轉述他的判斷,“人只需要決定目標,剩下的交給系統。”
方向隨之再次轉向——做大語言模型、做agent。并且,不再局限于游戲場景,“不是專門為游戲去做,就是要做大語言模型了。”
蔡浩宇判斷,當時正是“迎頭趕上”的最好節點:
他認為,一方面,頭部公司的模型能力步伐放緩——新的版本更多是在做工程優化,而非顯著提升智能本身;另一方面,互聯網可用數據已被消耗殆盡,行業競爭逐漸從“數據規模”轉向“自我迭代能力”。
“所以蔡哥就覺得,Ok,他們在自我迭代當中,那我們先迎頭趕上(笑)”一位接近團隊的人轉述他的判斷,“當時大概就是這個思路。”
這一轉向,很快體現在組織層面。
憑借充足的算力資源與長期投入的決心,團隊開始在國內大規模招募算法與Infra頭部人才。由此,LLM團隊重心加速回歸國內,北美相關團隊相繼收縮與調整,整體戰略明確轉向基礎模型建設。
與此同時,其他團隊也開始調整方向。音頻團隊的轉向,發生在表達層。
此前,語音系統主要承擔TTS功能,將文本轉化為語音輸出。但團隊逐漸意識到,語音中的情緒、語氣和表達細節,很難通過文字完整傳遞。比如,文字你可能會說“他很生氣地說,你怎么不聽我的”,但是很生氣,生氣到什么程度,可能只有在語音的程度上,才能很好地表現出來。
文字是離散信息,而語音與視頻屬于連續信息,在壓縮過程中不可避免地丟失細節。“如果不想讓這些意義丟失,就需要直接在這個模態上做模型。”一位工程師說。
因此,音頻團隊開始從“語音工具”轉向“音頻大模型”,探索端到端的語音交互——從輸入到輸出均為語音,中間不再依賴文本。
相比之下,視頻團隊的轉向更為被動。
原本,視頻模型被定位為“表演層”,用于驅動角色的動作與表情,替代傳統的動捕與渲染流程,從而提升制作效率。但隨著整體方向從“游戲內容”轉向“通用能力”,蔡浩宇叫停了表演模型,“說是這個東西沒辦法落地,后頭也得轉型”。一位工程師轉述內部判斷。
目前,視頻團隊一部分承接既有項目的具體技術需求,以驗證生成能力的實際落地效果;另一部分則繼續探索生成能力的上限,例如嘗試將2D內容轉化為可直接使用的3D資產,以縮短游戲制作流程。
“2D內容即便生成效果再好,也主要適用于過場動畫;而真正的游戲生產,仍依賴可用的3D資產。”一位工程師解釋道,“有點兒像字節的SeedDance視頻生成模型。”但在現實中,這一能力仍處于探索階段。
![]()
當被問及為何不直接使用SeedDance這種外部模型時,團隊給出的答案是數據。
“理論上是可以的,但數據才是公司最值錢的資產。”一位工程師說,“我們不可能拿《原神》的數據去跑外部模型,核心數據不能外流。
在這一系列轉向之后,Anuttacon的定位徹底發生了轉變。原本連小組會議都參加的“蔡哥”,也逐漸淡出了具體業務討論
公司內部的重心隨之調整:尚在搭建中的大語言模型團隊,從最初圍繞游戲內容生成的探索,轉向以Agent為核心的系統能力建設;圍繞《Whispers》形成的音頻與視頻體系,則逐漸邊緣化,更多承擔“提效”的角色。
Anuttacon正在從一個“做游戲內容的團隊”,轉向一個“做模型能力的團隊”。
組織策略:從“絕對International”到“全球招中國人”,再到回流國內
技術路線的變化,很快延伸到組織與人才策略。
一個更現實的問題隨之浮現:當方向從“做游戲內容”轉向“做基礎模型與Agent”,為什么團隊反而將重心轉回國內?
答案并不復雜,提升組織效率。
現在的Anuttacon已經不再處于“從零起步”的階段。經過近兩年的積累,團隊在數據采集、清洗、評測等基礎流程上已經完成初步建設,后續工作更多轉向在既有體系上的擴展與迭代。“很多基礎已經打好了。”一位工程師說,“后面更多是在這個基礎上去做。”在這種情況下,將團隊重心轉回國內,既可以降低成本,也更便于組織統一。
與此同時,蔡浩宇本人常年居住在新加坡,與中國團隊的沒有時差,溝通成本更低。
團隊結構本身,也在強化這一選擇。
Anuttacon的北美團隊以華人成員為主,但也不乏少量外籍同事,主要分布在北美部分非核心崗位及北美以外的遠程團隊中。
事實上,這樣的選擇,可能是蔡浩宇在HoYoverse時期國際化探索不暢的結果。
一位參與過Project SH的員工回憶,2021年,在HoYoverse早期階段,蔡浩宇曾明確希望“這個團隊越international越好”。但在實際運作中,北美團隊與中國管理層在工作方式上很快出現分歧——加班強度、項目節奏、溝通方式,都難以達成一致。隨著時間推移,這類嘗試在公司內部逐漸收縮。到2022年初,多數團隊已經放棄國際化,只有蔡浩宇的Project SH仍在堅持“international”的路徑。
![]()
隨著團隊向高強度研發階段轉型,協作效率成為首要考量。
Project SH之后,公司在全球招聘策略上做了主動調整:相比地域覆蓋的廣度,團隊更看重候選人能否真正融入快節奏的研發協作——語言、時區、工作方式的摩擦越小,產品迭代就越快。
于是,這種變化,在Anuttacon延續得更加徹底。
在一些具體環節中,這種選擇帶有明顯的效率考量。上述員工稱,過去,在語言模型評測中,團隊曾依賴海外contractor進行標注,但效率極低,“可能一天能給你打上兩三個標了不得了”;“后來給PM干著急了,直接就在國內招英語8級的畢業生或者是在校生打Caption,效率顯著提升。”
加之近兩年國際局勢變化和地緣政治的影響,將團隊重心轉回國內,成為一種自然的戰略選擇。
結語:
過去幾年,蔡浩宇離開了米哈游這艘巨輪,開始了現實中的開放世界探索。
從2022年在新加坡設立海外子品牌HoYoverse;到2023年9月,在Project SH階段性受挫之后轉向北美,投身AI。短短數年間,從“讓AI像人”,到“讓模型更強”,再到如今,徹底轉向大語言模型和Agent,技術路線不斷被推翻重建。
蔡浩宇在迅速離開與快速投入之間不斷切換,用新的方向回應新的問題,延續他理想先行的路徑。
這種快速轉向,帶來了靈活性,也帶來了代價。
每一次路徑切換,或許都意味著部分既有積累被放棄,團隊結構被重組,組織經驗被打斷。對于一家以長期研發為核心的技術公司而言,這種“不斷重來”的節奏,本身就是一場高風險的試錯——也是蔡浩宇逼近技術理想的一種路徑。
這期間,沒有出現第二個《原神》。取而代之的,是AI敘事實驗作品《Whispers from the Star》,AI聊天產品AnuNeko,以及Project SH重啟后的《Varsapura》首曝。在這些尚未成型的片段中,我們只能隱約看到一種方向,但仍難以判斷它最終會走向何處。
也許,《Varsapura》會給出答案。在此之前,蔡浩宇還有時間。
![]()
??
*爆料丨合作丨招聘:點擊或戳微信號 luoxuanwan111![]()
點推薦
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.