網易首頁 > 網易號 > 正文申請入駐

AlphaGo之父把AI扔進23年的人造社會：智能體3塊最硬骨頭全在這

2026-05-23 09:08:25　來源: 新智元

北京舉報

分享至

新智元報道

【新智元導讀】從Atari到AlphaGo，從AlphaStar到SIMA，DeepMind用游戲做AI研究已走過十余年，每換一個戰場，研究問題就升一個量級。這一次的戰場是EVE Online：一個跑了23年、從未重置的活宇宙。

DeepMind CEO、AlphaGo之父Demis Hassabis用游戲做AI研究已走過十余年。

這一次，他把AI扔進了跑了23年的「活宇宙」：一款連新手引導都能勸退玩家的太空網游EVE Online。

棋局有終局，EVE沒有。

5月初，DeepMind官宣了與EVE Online建立研究合作，原因很簡單：EVE復雜且有玩家驅動的宇宙，是測試AI記憶、持續學習和長期規劃的完美安全沙盒。

DeepMind聯手EVE，不是為了追求有趣的游戲體驗，或者賦能游戲玩法，而是要啃下當前AI智能體研究里公認最難啃的三塊骨頭，Hassabis把答案押在了一款運營23年的老游戲上。

Fenris Creations（原CCP Games）宣布與DeepMind合作

EVE Online背后的公司，5月6日同一天宣布了四件事：

從母公司Pearl Abyss體系中重新獨立；
更名為Fenris Creations；
完成1.2億美元交易；
Google作為本次獨立的一部分，持有Fenris Creations少數股權，并同步啟動與Google DeepMind的研究合作。

Fenris Creations CEO Hilmar Veigar Pétursson在公告中聲稱：

這次轉型不涉及裁員或重組，團隊、產品、開發計劃保持不變。EVE繼續。

從運營數字看，這家公司是帶著「真實彈藥」來談合作的，而不是賣資產求生。

EVE Online 2025年營收超過7000萬美元，11月創下歷史最高收入紀錄，Q4成為該游戲20年歷史上營收第二高的季度。

Fenris Creations獨立出來，意味著EVE現在有了一個能自主決定研究合作的母公司，不再被一家更大的游戲發行公司的戰略目標綁架。

1997年Fenris出版的桌游產品盒。「Fenris」這個名字比EVE Online還早了6年，更名為Fenris Creations是一次回溯，不是另起爐灶

DeepMind為何會選中EVE？

23年「人造社會」

AI基準測試難以復制

很多人聽到「游戲+AI研究」，第一反應是回想AlphaGo或AlphaStar，EVE和它們都不同。

圍棋和星際爭霸有一個共同特點：一局比賽有開始，有結束，有明確的勝負規則。

AlphaGo的目標是打贏棋局，AlphaStar的目標是打贏一場星際對戰，都是「單局智能」的研究范式，但EVE沒有終局。

EVE Online以「單一共享宇宙」（single-shard / single shared universe）著稱，大量玩家長期在同一個持久世界中競爭、貿易、結盟和戰爭。

玩家在這里建立起了真實的經濟體系、政治聯盟、軍事集團、貿易路線、歷史恩怨和跨年度的戰爭計劃。

有些戰役從籌備到落幕要花掉整整一年。有些聯盟的崛起和覆滅，被后來的玩家當作真實歷史研究。

Hilmar在公告中說：「EVE是少數幾個能在已經像真實世界運轉的環境中探索智能問題的地方。」

Hassabis更是談到，自己從小玩游戲，職業生涯起點是設計AI模擬游戲，AlphaGo、AlphaStar和SIMA的研究都和游戲深度綁定，而EVE是下一階段的選擇：

我很高興能與Fenris Creations合作，在這個由玩家打造、復雜程度無與倫比的宇宙里，安全地探索全新的游戲體驗并推進AI研究。

大多數AI基準測試像是體檢，EVE更像是把AI扔進一個已經持續了23年的「人造社會」。

智能體3塊最硬骨頭

剛好是EVE玩家日常

這次官方明確列出了三個研究方向：長程規劃（long-horizon planning）、記憶（memory）、持續學習（continual learning）。

這三個方向，是當前AI智能體研究領域公認的3塊最難啃的骨頭。

如果你身邊有人玩過十年以上的EVE Online，讓他打開賬號給你看一眼好友列表，你很可能會看到幾十個分組、上百個名字，備注欄里寫著「2018年Delve戰役欠的債」「鵝群聯盟（Goonswarm）內部叛徒，別合作」「這哥們兒是間諜，組織里都知道」。

這不是上下文窗口，而是十年起步的跨會話長程記憶。

記憶這一關，EVE玩家天天都在過，持續學習這一關也一樣。

2014年1月，B-R5RB一戰持續約21小時，參戰角色超過7500個，75艘Titan被毀，損失折合真實貨幣約30萬美元。整場戰役的導火索，是一筆主權賬單未能自動支付。

這一仗打完，整個游戲的艦隊戰術全部改寫。各聯盟之后幾年的艦隊配置、戰術體系，全部圍繞復盤在迭代。每月都在改，每場失敗都被拆成可執行的策略更新。

至于長程規劃，EVE聯盟戰爭的標準時間單位不是小時，是月。一場跨星域戰爭從籌備到打響，造船、運輸、外交、潛伏、反間，幾百號玩家在沒有任何任務調度的情況下自發協作，跨月推進一個共同目標。

這套協作體系是23年里玩家自己長出來的。

當前AI智能體評估里被認為最硬的3塊骨頭，恰好是EVE玩家的日常。

EVE中23年的玩家驅動演化，產生了一個始終在變、始終復雜、沒有捷徑的環境，實驗室里人工合成不了這種復雜度。

DeepMind在2025年11月發布的SIMA 2，已經從「執行指令」進化到「理解目標、推理過程、邊玩邊學」。

從研究問題上看，EVE項目與SIMA 2同屬「游戲作為智能體訓練場」這條路線，不同的是這次場地換成了一個持續運轉23年的真實宇宙。

EVE Online游戲內戰役畫面，這種由玩家自發組織、動輒持續數小時的大規模會戰，是DeepMind選中EVE作為長程規劃與持續學習研究場景的核心原因

DeepMind進的是離線沙盒

不是玩家宇宙

DeepMind這次和Fenris的合作方式，比想象中保守，DeepMind拿到的不是直接接入現役玩家正式服的權限。

DeepMind官方在公告中聲明：初始研究將在離線版本的EVE Online上進行，使用本地服務器，在受控環境里測試和評估模型，不連接EVE Online正式運營服務器。

一方面，離線版意味著DeepMind不會去消費現役玩家的對戰數據，也不會擾動真正的服務器經濟，這避免了任何隱私和合規上的復雜度。

另一方面，離線版EVE仍可保留復雜的規則系統、艦船與經濟機制、星域結構等核心設計。

DeepMind拿到的是一個「被23年玩家壓力測試過」的復雜世界，作為智能體要去活下去的考場。

從Atari到EVE

這條路走向哪里

從DeepMind這十幾年的訓練場選擇往回看，有一條很清晰的進化線。

2013到2015年，Atari是起點。DQN把智能體放進《打磚塊》《太空入侵者》這種關卡明確、規則封閉的游戲。考的是反應和價值估計。

2016到2017年，AlphaGo和AlphaZero。圍棋規則規整、動作空間巨大但封閉。考的是搜索和長鏈推理。

2019年，AlphaStar進了《星際爭霸2》。第一次進入實時、不完美信息、多線博弈的環境。考的是部分可觀察下的實時決策。

2024年，SIMA想做跨多個游戲的通用智能體。考的是遷移泛化。

2025年，SIMA 2升級：不只執行指令，還能和用戶對話、推理目標、在游戲過程中自我改進。

DeepMind 2025年發布的SIMA 2，已從「執行指令」進化到「理解目標、推理過程、邊玩邊學」

每一代環境，都比上一代多了一些「真實世界的樣子」：從規則封閉到規則開放，從完美信息到不完美信息，從單局對抗到跨局遷移。

但此前這些環境大多仍是相對封閉、可切分、可重復評測的任務場，比如Atari是固定規則的街機游戲，AlphaStar面對的是一局一局結束的星際對戰，SIMA則在多個3D虛擬環境中測試跨游戲泛化。

EVE的不同之處在于，它是一個長期運行、玩家驅動、經濟和政治結構持續演化的持久世界。

它是在23年間，經由一群真實玩家在開放規則的世界里自發演化出來的：完整的玩家驅動經濟（ISK價格波動堪比真實金融市場），跨聯盟的政治結構（外交、間諜、停戰協議），從小規模沖突到21小時大戰的整套戰爭生態。

圈內對智能體評估的共識越來越清楚，單點任務跑分早就玩不出什么新花樣了，但長程記憶、跨周規劃、從失敗中學習，一直沒有像樣的評估場。

所以，DeepMind這次的選擇是：與其再造一個合成環境，不如走進一個已經被人類玩家用23年壓力測試過的「人造社會」。

但更大的問題也隨之浮現：

一個能在EVE里持續存在、持續學習、持續規劃的AI智能體，它和在真實世界里自主運作的智能體之間，還差什么？

參考資料：

https://x.com/GoogleDeepMind/status/2052011542707630461

https://www.ccpgames.com/news/2026/studio-behind-eve-online-goes-independent-rebrands-as-fenris-creations-enters-research-partnership-with-google-deepmind

https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/

編輯：元宇

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.