網易首頁 > 網易號 > 正文申請入駐

告別Prompt抽卡和評分通脹：一個讓AI游戲真正「機制化迭代」框架

2026-05-11 10:51:20　來源: 機器之心Pro

河北舉報

分享至

讓大模型寫一個小游戲，已經不新鮮了。它可以很快生成一個 Flappy Bird、一個塔防游戲、一個物理解謎頁面，甚至還能補上按鈕、分數和簡單動畫。但真正的問題是：這些游戲到底有沒有新的玩法？它們是在創造，亦或只是把已有游戲換了一層皮？

如果你讓 GPT 寫一個小游戲，它大概率能在幾分鐘內吐出一堆像模像樣的游戲代碼。但如果你要求它在此基礎上再改一版、再改一版，改到第四代時，事情就開始變得詭異 —— 它可能忘了第一代的核心玩法是什么，可能把好不容易調通的物理引擎又改崩了，也可能只是在視覺層面換了一層皮，卻聲稱自己創造了 "全新的游戲體驗"。

更深層的問題在于評分。當你讓 AI 給自己的作品打分時，它往往會客氣地給出 7 分或 8 分，無論實際質量如何。這種 "打分通脹" 讓迭代優化失去了方向，對 “Creativity” 的把控正是當下大模型所普遍缺乏的的能力，以至于也很難給出高屋建瓴的評價和建議。

CreativeGame關注的正是這個問題。它不是讓 AI 一次性生成一個看起來像游戲的頁面，而是讓 AI 圍繞 “機制” 持續迭代：保留原始游戲最容易理解的核心循環，同時逐步引入新的規則、新的目標和新的玩家行為意義。

來自布里斯托大學、上海交通大學和 Sreal AI 的研究團隊最近公開了一項名為 CreativeGame 的技術報告，試圖從根本上打破這種僵局。他們的思路很清晰：游戲生成不該是一次性的 Prompt 抽卡，而應該是一場有記憶、有計劃、可驗證的機制進化。

報告標題CreativeGame: Toward Mechanic-Aware Creative Game Generation.
報告鏈接：https://arxiv.org/pdf/2604.19926
項目鏈接：https://yiweishi-cn.github.io/CreativeEvolutionGame/index.html

機制優先：先寫 "設計文檔"，再寫代碼

類似于傳統的游戲開發流程，策劃會優先制定一個游戲的核心玩法，再逐步構建游戲其他的數值系統等分支。CreativeGame，強制 AI 在動手寫代碼之前，先完成一份結構化的設計文檔 —— 明確這一輪要保留什么核心機制、新增什么規則、移除什么舊設計、以及如何重組已有元素。這種做法徹底改變了 AI 與游戲的關系。

在傳統的生成流程中，機制往往只是事后的描述標簽，AI 根據 Prompt 自由發揮，生成完了再貼幾個標簽總結自己做了什么。而 CreativeGame 把機制提到了規劃的最前端：檢索全局游戲機制檔案，然后輸出一份明確的機制合約。這份合約會像合同一樣被附加到后續的 Skeleton、Feature、Visual、Refinement 四個代碼生成階段，確保代碼是在履行設計意圖，而不是漫無目的地堆砌。

例如下面這個案例，我們希望 Agent 能自動給出一個有趣的塔防游戲，它會從經典的策略塔防游戲：例如 Zombie vs Plants 中提取設計靈感，并包含了 Bloom (向日葵，Energy 生產者)，Shooter（豌豆射手，75 Energy 消耗，可以對入侵的喪尸發射子彈，消滅敵人）等基本元素：

策略塔防游戲：建造開銷、塔防防御規劃、生存建造抵御入侵，經典的類植物大戰僵尸玩法。

然而，一個完整好玩的游戲，并不是只有簡單的核心玩法，還包括關卡設計、植物圖鑒、各植物之間的配合等。于是 CreativeGame 進行了一定的機制改進和設計，引入了 waves（也就是關卡），路線彎曲（減緩喪尸移速），豌豆可以給向日葵進行充能，使之成為可以發射陽光大炮的高級武器。

策略塔防游戲（進化版）：豐富了 waves（關卡）設計，創新式引入了路線彎曲機制，以及 Shooter 可以給 Gen（Energy 生產者）進行充能，這里 Energy 延伸為 “炮臺充能”。

創意激發：真正讓模型具備創意生成的能力，而不是模仿

當前的大模型在文本、圖像、音樂等領域展現出了驚人的生成能力，但一個核心問題始終存在：它們究竟是在 “創造”，還是僅僅在對訓練數據中的模式進行高維度的重新排列？從表面上看，模型能夠寫出前所未見的故事、設計獨特的視覺風格，甚至提出看似新穎的概念組合，這似乎已經接近人類意義上的創造力。然而，深入分析會發現，大模型的生成過程本質上仍然高度依賴于海量已有數據中的統計規律。它并不像人類那樣擁有真實的體驗、動機、情感沖突和價值判斷，也缺乏 “為什么要創造” 的內在驅動力。

因此，創意激發的關鍵，不是單純擴大模型參數規模或訓練數據量，而是思考如何讓模型擁有更接近 “原創性” 的機制。例如，引入目標驅動的探索能力、長期記憶與反思機制，以及與真實環境持續交互所產生的反饋閉環。只有當模型能夠主動發現問題、形成偏好、修正自身認知，它才可能從 “高級模仿者” 走向真正意義上的 “創造者”。

誠然，這種激發需要良性的反饋，甚至人類的參與。當你讓 GPT 給游戲創意打分時，它往往慷慨給出 7 分或 8 分 —— 不是因為真的新穎，而是因為熟悉感偏見：LLM 天然傾向給 "看起來像那么回事" 的內容高分。如果優化目標完全依賴這種主觀判斷，系統很快就會學會一種危險的生存策略：用華麗的視覺描述和復雜的敘事框架，包裹一個換皮的 Pong。這不是創造，是高概率模仿。評分虛高是 AI 生成領域的頑疾。研究團隊觀察到，GPT 類模型在評估創造力時存在嚴重的分數膨脹，動輒給出 7 分或 8 分，無論輸入質量如何。更危險的是，如果優化目標完全依賴 LLM 判斷，系統會傾向于生成 "聽起來很有創意但玩起來空洞" 的內容。

CreativeGame 的解決方案是提出了 CreativeProxyReward—— 一套以確定性代碼編譯為主的代理獎勵系統，包括：結構機制變化、計劃機制的視線程度、相對全局專家機制庫的新穎性、運行時魯棒性，并輔助性伴隨著 LLM 的主觀創造力評價。

這套系統還設有兩道硬門檻。如果生成的游戲跑不起來，獎勵直接腰斬；如果靜態分析發現游戲循環沒被調用、Canvas 上下文沒獲取、括號不匹配等基礎錯誤，分數也會被打到骨折。這意味著，一個 "創意十足" 但運行就崩的游戲，在 CreativeGame 的價值觀里拿不到高分。基于完備的代碼環境，創意不再是修辭學的把戲，而是可被驗證的結構事實。

以下是一些創意式機制設計的案例：

Game 1 Demo: Fireboy & Watergirl 原本是一個雙角色平臺解謎游戲。Fireboy 可以通過火，但不能碰水；Watergirl 可以通過水，但不能碰火。玩家需要控制兩個角色，按下機關、穿越平臺，并讓他們分別到達對應出口。這個游戲的核心，是雙角色合作、元素限制、機關觸發和平臺跳躍。

CreativeGame 沒有簡單復制 “雙人合作” 這個形式，而是把它重新解釋成 “自己和自己的過去合作”。在 Memory Relay 中，一個角色可以被停放在光環中，為橋梁或機關供能。也就是說，即使角色當前沒有被玩家控制，它仍然是關卡邏輯的一部分。當玩家切換角色時，系統會記錄剛才的移動路徑。這條路徑會變成 replay ghost，在場景里重新跑一遍。如果角色在記錄過程中碰過重力符文，這段幽靈軌跡還會被重力規則重新解釋，從而觸發不同位置的機關。最終，玩家需要協調當前角色、停放的身體和過去的移動軌跡，讓它們共同完成中繼解謎。

Creativity:

Memory Relay 的合作發生在當前操作、停放身體和歷史記憶之間，而不是單純發生在兩個角色之間。

Game 2 Demo: Flappy Bird 的原始玩法非常簡單。

玩家點擊屏幕，小鳥向上飛一下；如果不點擊，小鳥會因為重力下墜。玩家需要控制小鳥穿過一對對管道之間的空隙，碰到管道就失敗。這個游戲的核心，是單按鈕控制、點擊時機、躲避障礙和不斷追求更高分。

CreativeGame 讓飛行擁有節奏、記憶和未來影響。畫面中加入了節拍圓環。玩家如果踩著節拍點擊，就會觸發 Sync，為小鳥充能；如果沒有踩準節拍，則會損失一點能量。能量充滿后，小鳥會進入 Phase 狀態，短暫變成白色，并獲得穿越特殊膜門的能力。于是，節奏不再只是視覺反饋，而變成了解鎖能力的條件。游戲還加入了 Perfect Pass 機制。如果玩家精確從門的中心穿過，系統會自動改寫后續一道門的位置和縫隙寬度，讓未來路線變得更有利。更特別的是死亡回聲機制。玩家失敗前的一段飛行軌跡，會在下一局變成一個白色光球重新出現。當這個回聲經過某道門時，會撐大門的縫隙，幫助玩家繼續前進。

Creativity:

不再是一個簡單的反應式生存游戲，而是被改造成了一個結合節奏、記憶和路線編輯的關卡。玩家當前的精確操作，會改變未來的關卡結構；玩家過去的失敗，也會回來幫助下一次嘗試。

Game 3 Demo: Happy Glass 的原始玩法，是讓玩家畫線引導水流進入杯子。玩家通常需要畫出斜坡、擋板或支撐結構，改變水滴運動路徑，讓杯子成功裝滿。這個游戲的核心，是畫線、重力、水滴物理和空間路徑設計。

在 CreativeGame 生成的 Ritual Ink Cup 中，玩家仍然通過畫線影響水滴，但線條不再只是普通物理形狀。這里的線條變成了 programmable ink。Solid ink 像普通擋板一樣改變水滴方向。Absorb ink 可以吸收水滴，把它們暫時存起來。被吸收的水滴會在延遲后釋放出來，而釋放方向和重力方向可以成為策略的一部分。游戲還加入了 ritual charge。水滴如果先經過儀式區域再進入杯子，會獲得額外價值。于是，目標不再只是 “把水送進杯子”，而是設計一條帶有狀態變化的水流過程。

Creativity:

線條從物理擋板變成了有狀態、有記憶、有釋放邏輯的可編程材料。

Game 4 Demo: Plants vs Zombies 是經典的橫向車道塔防游戲。敵人從右側沿著不同車道進攻，玩家在格子上放置植物防守。植物會自動攻擊，玩家需要管理資源、選擇位置，并抵御一波又一波敵人。這個游戲的核心，是資源管理、單位放置、車道防守和波次壓力。

在 Resonance Garden 中，基礎玩法仍然是放置單位防守車道，但游戲把 “友方子彈” 重新定義成了可以管理的資源。Shooter 會像普通防御塔一樣向前發射子彈。Generator 會生產能量，但它也會擋住友方子彈。在傳統塔防里，擋住自己的攻擊通常意味著布局錯誤。但在這個版本中，被 Generator 擋住的子彈不會浪費，而是被儲存為 charge。當 charge 積累到一定程度后，Generator 可以釋放更強的攻擊。游戲還加入了 lane bend。玩家可以在一波敵人中彎曲某條車道，讓釋放出的能量沿著新的路徑產生折射攻擊。這樣，玩家要思考的不只是 “怎么打中敵人”，還要思考 “什么時候故意攔住自己的攻擊，把它變成未來的爆發”。

Creativity:

Resonance Garden 把攻擊、阻擋、儲能和釋放變成了一個資源循環。

自我進化：讓子代游戲共享同一份 "家譜記憶"

單點生成的另一個致命傷是遺忘。第一代版本里的巧妙設計，有時候到了第四代被洗得一干二凈。CreativeGame 為此設計了一套 Lineage-Aware Memory 架構，把游戲版本組織成譜系樹，同一條進化線上的所有節點共享一個記憶池。這個設計借鑒了 MemRL 的思想，但做了關鍵改良：記憶在譜系內共享，在譜系間隔離。當策劃 Agent 準備生成新版本時，它不僅會查詢全局機制庫，還會讀取這條譜系積累下來的成功經驗與失敗教訓。反思 Agent 會在每一輪結束后，將機制級的差異寫入記憶，而非僅僅保存一段版本摘要。

舉個例子，我們常見的策略塔防游戲 —— 植物大戰僵尸，初始版本設定了 “陽光生產者、豌豆射手攻擊者、以及抵御僵尸入侵” 的核心玩法；進化后的第二代版本，在此基礎上加入 "彎道" 能力，可花費資源改變敵人進攻路線；到了第三代，被阻擋的豌豆不再浪費，而是為向日葵儲存為 "過載充能"，釋放為全 lane 爆發...... 如果沒有這種譜系記憶方式，進化的過程中則有可能丟失或改變核心玩法，使進化失效。

四類游戲的進化圖譜，游戲的進化保留著核心玩法，同時引入創意的新游戲機制以及調整游戲的平衡性。

AI Creativity 正在不斷自我進化

CreativeGame 的探索意義，或許不在于它生成的某一款游戲有多么驚艷，而在于它提出了一種可解釋、可追蹤、可迭代的創作范式。當大多數系統還在讓 LLM"憑感覺生成" 時，CreativeGame 已經在讓 AI 去探索和創作，在結構化、可編譯的機制設計層面，AI 在不斷進行進化，試圖涌現出真正的 Creativity。

這預示著 AI 內容生成領域一個潛在的范式轉向：從追求單次輸出的 "驚艷感"，轉向追求不斷自我進化的 "結構深度" 與 "一致性"。畢竟，真正的游戲設計從來都不是拍腦袋一蹴而就的，而是不斷抽絲剝繭地去思考關于 "保留什么、改變什么、為何改變" 的連續決策。而當 AI 學會把這些決策顯式化、可衡量、可繼承時，它離 "設計師" 這個角色，或許就真的近了一步。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.