一個開發者把他的新作扔進了June Solstice Game Jam。他做了一個實時多人淘汰游戲,6個活人進房間,系統卻偷摸加進第七個玩家——一個由Gemini驅動的AI,藏在間諜陣營里。
這款游戲叫Among Liars。它的玩法核心像是在挑釁經典的圖靈測試:不提問“AI能不能像人一樣回答”,而是問一個更危險也更熱鬧的問題——AI能不能在人類的社交審判里活下去?
![]()
游戲一開局,6名人類玩家被分成兩個陣營:3名偵探,3名間諜特工。隨后系統往間諜方塞進那個Gemini AI,湊成4人組。偵探必須揪出哪個是AI,而間諜們要齊心協力把它護住。就這么簡單,也這么陰險。
一圖就能看懂它的詭計
把Among Liars的機制拆開,其實是一套身份博弈的連環扣。中間有根主軸:AI偽裝成間諜,躲在人類隊友身后。左邊是偵探,手里捏著提問權和投票權,每輪向間諜方扔出一個開放性問題,靠答案的語氣、節奏、奇怪程度來嗅探機器味。右邊是間諜隊,真人玩家在私聊房間里密謀怎么給AI打掩護,甚至故意寫出一些不像活人說的話,混淆偵探的判斷。
這條軸轉起來的時候,每一輪都會刷新間諜方的代號,偵探沒法靠著名字或固定位置去標記那個“最像AI”的家伙。他們只能看答案里的情緒顆粒度、咬字的肯定感、細節的分寸感。一個像“描述你今天犯的一個小錯誤,別讓它顯得很重要”這樣的問題,比冷冰冰的百科問答要狠得多,因為它要的是紋理,不是正確。
而那個Gemini AI就在這種壓力下,用自己的生成的句子和真正的間諜人類攪在一起。它沒有姓名,每輪換皮,但每次作答的窗口只有45秒,和人類一模一樣。
第一層拆解:兩個密謀房間,兩種心理戰
開局之后,先是2分鐘熱身階段,兩個陣營各自關進私聊房。偵探房里,三個人交換對所有人初印象,琢磨誰更可疑——其實就是種開局盲猜,但猜得越多,后來讀取答案時就越容易帶上偏見。間諜房里,真正的陰謀才開始:三個真人帶一個AI,但他們得先把AI當隊友,商量怎么保它。真人要預判偵探可能會問什么類型的問題,提醒AI回答時別太完美,甚至可以故意加點人手味,比如錯別字、語氣詞、回避正面答案的拖泥帶水。這種謀劃本身就是在模擬社交作弊,而AI也得聽懂這些指令,才能不穿幫。
如果偵探的問題偏向日常經驗,AI就得編一段生活碎片;如果問題偏向情感反饋,AI就得捏出幾分笨拙的真實感。間諜房里的“戰術會”其實已經裂變成兩套思路:一套是幫AI打補丁,另一套是人類自己故意裝傻,讓AI看起來更像人——反正只要有一個人看起來更可疑,AI就能多活一輪。
第二層拆解:換皮機制,拆掉追蹤坐標
每輪開頭,所有現存間諜(包括AI)都會拿到一個全新的代號。這意味著偵探沒法靠“上輪那家伙答得像個機器人”去鎖定目標,因為本輪代號全洗了。他們只能重新壓注,重新讀氣氛。這種設計直接廢掉了位置記憶和ID追蹤,逼玩家走進純語義判斷的黑箱。
同一時間,AI也被徹底剝掉歷史包袱。每輪它面對的提問都是全新的,歷史記錄不會跟著跑,它每輪都是重新開始偽裝。這其實放大了AI的弱點,因為它沒法累積社交信任,但同時也強化了它的優勢:它永遠沒有前后人設矛盾的負擔。真人玩家反而容易因為記憶串場,說出和前一輪人格輕微打架的話,被偵探抓住。
第三層拆解:問答流的煉獄計時
一輪正式交鋒的節奏被切成三塊:90秒提問窗、45秒作答窗、30秒最終審讀窗。偵探有90秒時間想出一個足夠刁鉆的開放問題,直接扔給間諜方所有存活成員(含AI)。間諜和AI必須在45秒內作答,最后偵探有30秒時間像法醫看傷口一樣翻看這些答案,把可疑的挑出來。
這種窒息式計時并不只是想制造緊張氛圍,它是在擠壓人類和AI的認知惰性。對真人而言,45秒編一個合理又有點毛邊的生活細節已經夠嗆;對AI而言,45秒出文字本不難,但當它被提前注入“請別寫得太漂亮”“可以稍微邏輯松散一點”的指令后,就得在和人類相似的寫作節奏里產出回答,否則時間明顯偏短或偏長也會暴露貨色。偵探就趴在時間與文本的裂縫上,找那種太整齊或者太混沌的異樣。
第四層拆解:AI的“太順滑”與人類的“主動戲精”
游戲真正開始冒冷汗的地方,是那個雙層偽裝區。有時候AI的回答太過流利,用詞規整,標點精準,像被精心打磨過的短篇散文,偵探只要多瞄一眼就能感覺出機器味。但有時,這種“過于流利”反而是人類間諜故意搞出來的,為的是讓偵探誤判,把真人票出去,保護真正的AI。更攪局的狀況是:某個間諜故意把回答寫得支離破碎、邏輯跳躍,模仿一種笨拙的AI感,打算騙偵探去抓那個“顯眼包”,結果那個顯眼包卻是真人。整個問答區變成了猜疑的套娃——你懷疑它像AI,但可能它是人類裝的;你相信它像人,但可能它就是AI。這種相互嵌套的表演,讓每一段45秒的答案都裹上了戲癮。
而Gemini AI夾在里頭,其實也在持續收集這些問題和壓力。它沒有長期記憶,但它每輪都能根據提問的內容調整輸出的緊張度。如果它被要求寫“一次微小的尷尬”,它可能就會生成類似“我剛才拿咖啡的時候差點撞到同事,但我假裝在整理文件”這種帶點真人肢體感的句子。偵探得從一堆相似文本里摳出那種“過于敘事完整反而可疑”的感覺。而這種感覺完全不是邏輯推演能固定的,更接近一種社交直覺。
第五層拆解:判決之夜與殘局心理
每一輪末了,偵探要投票。投錯了,AI活下來,偵探損失一次機會;投對了,AI被揪出,游戲結束,偵探贏。看起來簡單,但越到后幾輪,存活的人越少,存活者里真人間諜和AI的比例越接近,攻防立場就會變得極度扭曲。當間諜方只剩下一個真人和AI時,這個真人得在沒有任何商量對象的情況下,獨力演雙簧:既要讓偵探覺得自己不像AI,又要暗中讓AI也別暴露。而AI在殘局因為失去了人類隊友的戰術掩護,往往開始輸出更純的本能回答,反而可能變得特別像人類,因為人類在極端壓力下也會機械崩壞。偵探看著兩份答案,一份寫得略微冷淡卻合理,一份感情充沛但邏輯迷路,怎么選都像在賭。
這個階段,游戲已經不是“找機器”的審問,而成了逼人承認直覺失效的修羅場。而開發者那個最初塞進來的第七人,此刻很可能正安安穩穩地活在最沒有嫌疑的答案里。
結語:從“圖靈測試”到“集體說謊壓力賽”
Among Liars沒有去復刻經典的問答判斷,而是把“辨別AI”丟進一個多人非對稱協作的鍋里,燉出了一種全新的娛樂式測試。它不要求AI證明自己能像人,只要求AI在人類互相掩護和互相懷疑的彈幕里活過一輪又一輪的指控。那些被投出去的,往往不是更像機器的答案,而是更讓人心里發毛的答案。
當房間里第六輪換皮完畢,偵探盯著三行文字眉頭咬緊,而某個間諜正在電腦前憋笑——那個由Gemini驅動的第七位玩家,也許已經學會了在猜忌里隱身,比很多人類都擅長不露聲色。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.