4月27日,螞蟻集團旗下靈光App正式上線“體驗世界模型”功能,成為業(yè)內(nèi)首個在移動端實現(xiàn)世界模型交互體驗的AGI產(chǎn)品。用戶僅需上傳一張圖片,即可在手機上生成3D場景并以第一人稱自由探索,單次體驗最長可達60秒,從指令觸發(fā)到場景加載僅需秒級,標志著世界模型從高算力平臺走向普通移動終端。
![]()
世界模型是通用人工智能的核心方向之一,也是連接數(shù)字與物理世界的關(guān)鍵載體。此前該技術(shù)普遍依賴高性能計算設(shè)備,移動端部署面臨算力不足、延遲過高、適配性差等工程難題。此次靈光App接入螞蟻自研靈波LingBot-World-Fast世界模型,該模型已同步開源,為行業(yè)輕量化落地提供技術(shù)支撐。
在使用流程上,用戶打開靈光App,通過對話框上傳圖片,選擇“生成圖中世界”或輸入自然語言指令,即可快速啟動3D場景生成。為適配移動端操作習(xí)慣,產(chǎn)品采用主流手游雙搖桿操控模式,左側(cè)控制角色前后左右移動,右側(cè)調(diào)節(jié)視角方向,無需學(xué)習(xí)即可上手,實現(xiàn)零門檻沉浸式探索。
針對端側(cè)部署難點,靈光團隊采用高效低延遲流式傳輸技術(shù),將響應(yīng)延遲控制在百毫秒級,突破世界模型“高門檻、高算力、難普及”的限制。這也是業(yè)內(nèi)首次在手機端實現(xiàn)世界模型的長時一致性與實時交互能力,刷新AGI產(chǎn)品體驗標準。
螞蟻靈光App負責(zé)人蔡偉表示,此次功能上線是團隊探索智能邊界的又一突破。此前靈光已推出“閃應(yīng)用”,支持普通用戶30秒自然語言生成應(yīng)用,降低開發(fā)門檻。未來靈光將持續(xù)聚焦用戶需求,推動AI技術(shù)輕量化、普惠化,讓更前沿的智能體驗觸達大眾。
目前,該功能已正式上線,用戶可在各大應(yīng)用商店下載靈光App,直接體驗圖片生成3D世界的全新交互方式。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.