4月16日,阿里發布了一款名為Happy Oyster的開放式世界模型產品。同一天,騰訊開源了HY-World 2.0;次日,群核科技在港交所上市,成為"全球空間智能第一股"。世界模型這條賽道,突然擁擠了起來。
Happy Oyster的核心賣點是實時構建與交互。它支持多模態輸入,能音視頻聯合生成,更關鍵的是——生成過程中可以持續接收用戶指令,畫面實時響應、持續演繹。這不是"說一句、等一段"的傳統模式,而是一個松散、概率化的實時系統,用戶在不斷推著它往前走。
![]()
我上手測試了幾個場景。官方示例里,我嘗試直接下達"增加角色數量""添加說話行為"這類直白指令。新增角色沒有憑空出現,而是從畫面邊緣合理進入。畫面風格變化時,物品材質和環境光連帶調整;角色聲音與動作也有初步同步。這不像每次重新生成,更像在維護一個脆弱但確實存在的"當前狀態"。
真正的考驗是語義理解。我要求加入"賽博朋克元素",Happy Oyster沒有簡單疊加濾鏡。霓虹燈出現后,畫面色調被重新校準,不同物品表現出更多反射感——這些細節的同步變化重塑了場景氣氛。它顯然理解"賽博朋克"是什么,才能在原有輸出上修改出貼近《賽博朋克2077》質感的畫面。
傳統游戲引擎靠資源組合與位置擺放構建場景,Happy Oyster已進入隱式語義生成階段。對開發者而言,那些原本靠"搭"和"調"手工完成的環節,正慢慢被"描述"取代。燈光、氛圍、視覺預研這些前置工作里,它已表現出生產級能力——敏捷嘗試創作方向,試錯成本被壓到最小。
更深層的價值在于繞開現有渲染流程。傳統引擎追求在有限算力下把光照算得逼真:BRDF/BSDF材質建模、光源采樣、陰影計算、全局光照、各種屏幕空間近似……本質是用可解釋、可復現的計算,把光影推向"視覺上正確"。
世界模型的解法完全不同。它不是把這條鏈路算得更快,而是直接猜一個合理的結果。渲染管線本身也在發生類似變化:DLSS 3.5的Ray Reconstruction用訓練過的模型補全有限采樣下的光照信息;DLSS 5進一步在材質和光照觀感層面重建畫面。最終畫面早已不是引擎算什么就顯示什么,世界模型正更深入介入這最后環節。
三種方案的根本差別在于約束強弱。傳統渲染是在解方程;神經渲染在弱約束條件下做推斷,仍站在引擎肩膀上,使用幾何、深度、運動向量等信息;世界模型則最激進——用最少約束、最少信息,直接補全到空間、光照、物體齊備的程度。生成從像素層躍升到了世界層。
代價同樣明顯。傳統渲染可解釋、可復現,一道光為何如此照下來,大體知道計算路徑,出了問題能倒查管線。換成模型推斷后,輸出帶有概率性,難以精確約束,同一問題不一定穩定復現,debug成本顯著上升。在可控性問題解決前,生成式渲染更接近強大的視覺表達工具。
更現實的協同模式或許是:傳統引擎繼續負責空間結構、物理規則、游戲邏輯和同步狀態,模型逐步接管高頻視覺細節、材質表現、局部補全和觀感優化。Happy Oyster這類產品會加速這一成熟。
世界需要先被定義,但越來越大比例的畫面會被模型"猜"出來。這個比例增長的速度,可能比我們想象中快得多。
我又嘗試讓Happy Oyster接管更完整的游戲開發——做一段第一人稱游戲demo。輸入一張《天國:拯救2》的截圖,要求生成完整中世紀城鎮,用精確提示詞控制氛圍和視角:陰沉天空下,波西米亞防御小鎮,煙囪青煙,泥濘道路通往高聳城墻內的狹窄石門,瞭望塔、木屋、木制腳手架,色調沉穩質樸,空氣寒冷潮濕,玩家第一人稱騎馬駛向城門。
第一眼效果很驚艷。初始畫面對原始截圖的還原度、氛圍塑造都超出預期。但問題很快浮現:當要求角色移動、場景持續演化時,畫面穩定性開始波動。建筑結構在幾幀后出現微妙變形,光影邏輯偶爾跳躍,"當前狀態"的維護在復雜動態場景下顯得吃力。
這指向世界模型當前的核心瓶頸:狀態一致性。游戲引擎的優勢在于精確的狀態管理——每個物體的位置、物理屬性、與其他對象的關系都被嚴格定義和同步。Happy Oyster的生成式路徑在視覺豐富度上領先,但在需要精確交互、物理反饋、多人同步的場景中,仍需要與引擎深度耦合。
另一個發現是提示詞的敏感度。描述越抽象,發揮空間越大,結果越不穩定;描述越具體,約束越嚴格,越容易觸發模型的"安全模式",生成趨于保守。找到這個平衡點需要反復實驗,目前還沒有成熟的工程化方法論。
游戲工業的需求會反向塑造世界模型的演進方向。當前最可行的落地場景或許是:預研階段的概念驗證、宣傳物料的快速生成、特定風格化的視覺原型。這些場景對精確可控性要求較低,對迭代速度和視覺表現力要求高,恰好匹配Happy Oyster的能力區間。
阿里選擇此時入局,時機耐人尋味。谷歌、英偉達、Meta、李飛飛的World Labs早已布局,騰訊、群核同日動作,說明行業判斷趨于一致——世界模型是從"預測下一個詞"到"預測下一個物理狀態"的關鍵躍遷,是AGI愿景與具身智能之間的認知基礎設施。先發優勢可能體現在數據飛輪和開發者生態上,而非單純的技術代差。
Happy Oyster的命名也透露產品哲學:牡蠣孕育珍珠,需要時間與外部刺激。世界模型的"珍珠"——穩定、可控、可規模化的生成能力——同樣需要在與真實場景的反復摩擦中逐漸成形。一分鐘的奇跡已經可見,持續的幻覺仍是挑戰。游戲開發者的"描述"時代,正在這個張力中緩緩開啟。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.