4 月 27 日,螞蟻集團旗下全模態 AI 助手靈光 App 上線“體驗世界模型”功能。用戶上傳一張圖片,即可在手機端生成一個 60s 的 3D 世界,以第一人稱視角進入其中,像玩游戲一樣在 AI 實時生成的場景中漫游。無需本地部署,無需復雜配置,打開 App 即可體驗。這是世界模型首次以移動端產品的形態,面向普通用戶開放。
支撐這一體驗的核心,是螞蟻靈波科技開源的世界模型 LingBot-World-Fast。該模型在 480P 分辨率下可實現 16 fps 實時生成,端到端交互延遲控制在 1 秒以內,兼具通用性、長時序一致性與?動態場景表現能力。
![]()
除了面向普通用戶的靈光 App 體驗,開發者與研究者也可以基于開源的 LingBot-World-Fast 進行本地部署和二次開發。本地環境下,模型支持無縫的持續生成,用戶可以通過鍵盤、鼠標實時操控視角與移動,也可以通過文本提示(Prompt)隨時改變環境狀態或觸發局部事件,比如調整天氣、切換畫面風格等。
為了實現實時交互,螞蟻靈波 LingBot-World-Fast 提出了專門的后訓練優化方案,模型在生成過程中只聚焦新增畫面內容,不再重復計算已穩定的部分,從而顯著提升實時生成效率,同時盡可能確保畫面質量、時序連貫性與場景一致性。
實時世界模型提供了一個可以進入、操作和即時響應的環境,每一次交互都能即時看到結果,而非等待離線渲染。對于具身智能研發而言,LingBot-World-Fast 可提供多樣化的虛擬訓練環境,幫助機器人在數字世界中進行場景理解、動作學習和任務演練。對于游戲開發和內容創作而言,它有望降低交互式內容原型制作門檻,提升從創意到體驗的轉化效率。
今年 1 月,螞蟻靈波曾開源 LingBot-World-Base 版本,憑借高保真畫質、10 分鐘超長視頻生成和出色的物理一致性,在世界模型方向上引發廣泛關注。
目前,LingBot-World-Fast 模型與代碼已在 Hugging Face和 Model Scope面向社區完整開放。普通用戶可通過靈光 App 直接體驗相關能力,開發者和研究者也可基于開源模型進行本地部署與進一步探索。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.