周三下午,四個(gè)玩家同時(shí)進(jìn)入同一張地圖,彼此射擊、躲藏、追逐。但他們看到的畫面并非來自傳統(tǒng)游戲引擎,而是一個(gè)神經(jīng)網(wǎng)絡(luò)實(shí)時(shí)想象出來的世界。這就是Agora-1,Odyssey團(tuán)隊(duì)今天發(fā)布的首個(gè)多智能體世界模型。
世界模型不是什么新概念。它能生成高保真的虛擬環(huán)境,讓AI在仿真中學(xué)習(xí)。但過去這些模型有個(gè)硬性限制:同一時(shí)間只能容納一個(gè)"參與者"。無論是人類還是AI,都是獨(dú)自在模型生成的世界里探索。Agora-1打破了這個(gè)天花板。
![]()
團(tuán)隊(duì)選擇了一個(gè)出人意料的測(cè)試場(chǎng)景:1997年的經(jīng)典射擊游戲《GoldenEye》。這款在N64上誕生的作品,曾是許多團(tuán)隊(duì)成員的童年記憶。游戲歷來是AI研究的試驗(yàn)場(chǎng)——雅達(dá)利、我的世界、星際爭(zhēng)霸都承載過類似探索。現(xiàn)在輪到這款25年前的間諜題材射擊游戲了。
![]()
Agora-1最多支持四名玩家同時(shí)進(jìn)入同一個(gè)生成世界。系統(tǒng)將他們匹配到共享的死亡競(jìng)賽中,每個(gè)參與者同時(shí)與同一個(gè)世界狀態(tài)交互。你扣下扳機(jī)、躲進(jìn)角落、拾取武器——這些動(dòng)作被模型捕獲,轉(zhuǎn)化為對(duì)世界狀態(tài)的更新,再實(shí)時(shí)渲染成像素流推送到每個(gè)玩家的屏幕上。某種意義上,Agora-1扮演了一個(gè)"學(xué)習(xí)出來的游戲引擎"角色。
從技術(shù)路線看,這并非多智能體世界模型的首次嘗試。Multiverse把多個(gè)玩家的狀態(tài)拼接成"分屏"表示,將多人視為單一世界狀態(tài);Solaris則沿序列維度拼接參與者,用自回歸擴(kuò)散Transformer生成更穩(wěn)定的共享仿真。但后者有個(gè)硬傷:玩家數(shù)量增加時(shí),模型上下文膨脹,無法線性擴(kuò)展。更麻煩的是,當(dāng)玩家彼此脫離視野,這兩種方案都難以維持世界一致性。
![]()
Agora-1走了另一條路:解耦仿真與渲染。它維護(hù)一個(gè)顯式的共享世界狀態(tài),但用不同方式建模動(dòng)態(tài)演化與視覺渲染。這種分離讓模型能從多個(gè)獨(dú)立視角生成同一世界的連貫畫面——多人游戲、機(jī)器人訓(xùn)練、多視角仿真,這些場(chǎng)景因此成為可能。
具體而言,Agora-1學(xué)習(xí)兩個(gè)獨(dú)立功能:一是世界狀態(tài)如何隨時(shí)間演化以響應(yīng)玩家行為;二是如何從任意視角渲染該狀態(tài)。這種架構(gòu)設(shè)計(jì)讓它在擴(kuò)展性和一致性之間找到了新的平衡點(diǎn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.