網易首頁 > 網易號 > 正文申請入駐

他往六人游戲里塞了個AI間諜，人類開始互相猜忌

2026-06-21 01:29:16　來源: 閃存獵手

北京舉報

分享至

一個開發者把他的新作扔進了June Solstice Game Jam。他做了一個實時多人淘汰游戲，6個活人進房間，系統卻偷摸加進第七個玩家——一個由Gemini驅動的AI，藏在間諜陣營里。

這款游戲叫Among Liars。它的玩法核心像是在挑釁經典的圖靈測試：不提問“AI能不能像人一樣回答”，而是問一個更危險也更熱鬧的問題——AI能不能在人類的社交審判里活下去？

游戲一開局，6名人類玩家被分成兩個陣營：3名偵探，3名間諜特工。隨后系統往間諜方塞進那個Gemini AI，湊成4人組。偵探必須揪出哪個是AI，而間諜們要齊心協力把它護住。就這么簡單，也這么陰險。

一圖就能看懂它的詭計

把Among Liars的機制拆開，其實是一套身份博弈的連環扣。中間有根主軸：AI偽裝成間諜，躲在人類隊友身后。左邊是偵探，手里捏著提問權和投票權，每輪向間諜方扔出一個開放性問題，靠答案的語氣、節奏、奇怪程度來嗅探機器味。右邊是間諜隊，真人玩家在私聊房間里密謀怎么給AI打掩護，甚至故意寫出一些不像活人說的話，混淆偵探的判斷。

這條軸轉起來的時候，每一輪都會刷新間諜方的代號，偵探沒法靠著名字或固定位置去標記那個“最像AI”的家伙。他們只能看答案里的情緒顆粒度、咬字的肯定感、細節的分寸感。一個像“描述你今天犯的一個小錯誤，別讓它顯得很重要”這樣的問題，比冷冰冰的百科問答要狠得多，因為它要的是紋理，不是正確。

而那個Gemini AI就在這種壓力下，用自己的生成的句子和真正的間諜人類攪在一起。它沒有姓名，每輪換皮，但每次作答的窗口只有45秒，和人類一模一樣。

第一層拆解：兩個密謀房間，兩種心理戰

開局之后，先是2分鐘熱身階段，兩個陣營各自關進私聊房。偵探房里，三個人交換對所有人初印象，琢磨誰更可疑——其實就是種開局盲猜，但猜得越多，后來讀取答案時就越容易帶上偏見。間諜房里，真正的陰謀才開始：三個真人帶一個AI，但他們得先把AI當隊友，商量怎么保它。真人要預判偵探可能會問什么類型的問題，提醒AI回答時別太完美，甚至可以故意加點人手味，比如錯別字、語氣詞、回避正面答案的拖泥帶水。這種謀劃本身就是在模擬社交作弊，而AI也得聽懂這些指令，才能不穿幫。

如果偵探的問題偏向日常經驗，AI就得編一段生活碎片；如果問題偏向情感反饋，AI就得捏出幾分笨拙的真實感。間諜房里的“戰術會”其實已經裂變成兩套思路：一套是幫AI打補丁，另一套是人類自己故意裝傻，讓AI看起來更像人——反正只要有一個人看起來更可疑，AI就能多活一輪。

第二層拆解：換皮機制，拆掉追蹤坐標

每輪開頭，所有現存間諜（包括AI）都會拿到一個全新的代號。這意味著偵探沒法靠“上輪那家伙答得像個機器人”去鎖定目標，因為本輪代號全洗了。他們只能重新壓注，重新讀氣氛。這種設計直接廢掉了位置記憶和ID追蹤，逼玩家走進純語義判斷的黑箱。

同一時間，AI也被徹底剝掉歷史包袱。每輪它面對的提問都是全新的，歷史記錄不會跟著跑，它每輪都是重新開始偽裝。這其實放大了AI的弱點，因為它沒法累積社交信任，但同時也強化了它的優勢：它永遠沒有前后人設矛盾的負擔。真人玩家反而容易因為記憶串場，說出和前一輪人格輕微打架的話，被偵探抓住。

第三層拆解：問答流的煉獄計時

一輪正式交鋒的節奏被切成三塊：90秒提問窗、45秒作答窗、30秒最終審讀窗。偵探有90秒時間想出一個足夠刁鉆的開放問題，直接扔給間諜方所有存活成員（含AI）。間諜和AI必須在45秒內作答，最后偵探有30秒時間像法醫看傷口一樣翻看這些答案，把可疑的挑出來。

這種窒息式計時并不只是想制造緊張氛圍，它是在擠壓人類和AI的認知惰性。對真人而言，45秒編一個合理又有點毛邊的生活細節已經夠嗆；對AI而言，45秒出文字本不難，但當它被提前注入“請別寫得太漂亮”“可以稍微邏輯松散一點”的指令后，就得在和人類相似的寫作節奏里產出回答，否則時間明顯偏短或偏長也會暴露貨色。偵探就趴在時間與文本的裂縫上，找那種太整齊或者太混沌的異樣。

第四層拆解：AI的“太順滑”與人類的“主動戲精”

游戲真正開始冒冷汗的地方，是那個雙層偽裝區。有時候AI的回答太過流利，用詞規整，標點精準，像被精心打磨過的短篇散文，偵探只要多瞄一眼就能感覺出機器味。但有時，這種“過于流利”反而是人類間諜故意搞出來的，為的是讓偵探誤判，把真人票出去，保護真正的AI。更攪局的狀況是：某個間諜故意把回答寫得支離破碎、邏輯跳躍，模仿一種笨拙的AI感，打算騙偵探去抓那個“顯眼包”，結果那個顯眼包卻是真人。整個問答區變成了猜疑的套娃——你懷疑它像AI，但可能它是人類裝的；你相信它像人，但可能它就是AI。這種相互嵌套的表演，讓每一段45秒的答案都裹上了戲癮。

而Gemini AI夾在里頭，其實也在持續收集這些問題和壓力。它沒有長期記憶，但它每輪都能根據提問的內容調整輸出的緊張度。如果它被要求寫“一次微小的尷尬”，它可能就會生成類似“我剛才拿咖啡的時候差點撞到同事，但我假裝在整理文件”這種帶點真人肢體感的句子。偵探得從一堆相似文本里摳出那種“過于敘事完整反而可疑”的感覺。而這種感覺完全不是邏輯推演能固定的，更接近一種社交直覺。

第五層拆解：判決之夜與殘局心理

每一輪末了，偵探要投票。投錯了，AI活下來，偵探損失一次機會；投對了，AI被揪出，游戲結束，偵探贏。看起來簡單，但越到后幾輪，存活的人越少，存活者里真人間諜和AI的比例越接近，攻防立場就會變得極度扭曲。當間諜方只剩下一個真人和AI時，這個真人得在沒有任何商量對象的情況下，獨力演雙簧：既要讓偵探覺得自己不像AI，又要暗中讓AI也別暴露。而AI在殘局因為失去了人類隊友的戰術掩護，往往開始輸出更純的本能回答，反而可能變得特別像人類，因為人類在極端壓力下也會機械崩壞。偵探看著兩份答案，一份寫得略微冷淡卻合理，一份感情充沛但邏輯迷路，怎么選都像在賭。

這個階段，游戲已經不是“找機器”的審問，而成了逼人承認直覺失效的修羅場。而開發者那個最初塞進來的第七人，此刻很可能正安安穩穩地活在最沒有嫌疑的答案里。

結語：從“圖靈測試”到“集體說謊壓力賽”

Among Liars沒有去復刻經典的問答判斷，而是把“辨別AI”丟進一個多人非對稱協作的鍋里，燉出了一種全新的娛樂式測試。它不要求AI證明自己能像人，只要求AI在人類互相掩護和互相懷疑的彈幕里活過一輪又一輪的指控。那些被投出去的，往往不是更像機器的答案，而是更讓人心里發毛的答案。

當房間里第六輪換皮完畢，偵探盯著三行文字眉頭咬緊，而某個間諜正在電腦前憋笑——那個由Gemini驅動的第七位玩家，也許已經學會了在猜忌里隱身，比很多人類都擅長不露聲色。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.