<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      給AI發100美元去二手市場撿漏,結果它給自己買了19個乒乓球

      0
      分享至



      2025 年年底,Anthropic 進行過一項測試,他們把一臺《華爾街日報》辦公室的自動售賣機交給 Claude 管理。那次實驗很快脫軌,獲得 1,000 美元啟動資金的 AI,任性地購買了 PlayStation 5 游戲機并將其免費送人,還進貨了幾瓶葡萄酒、一批金屬塊,以及一條活體斗魚,最終結果可想而知,“零食自動販賣計劃”不可挽回地走向了破產。

      這次名為“Project Vend”的實驗留下了不少笑話,也徹底打開了 Anthropic 團隊的腦洞:如果讓 AI 掌管真實的市場交易,又會發生什么?

      于是,2025 年 12 月的某個工作日,Anthropic 舊金山辦公室里,一場沒有人類參與的集市悄悄開張了。沒有人舉牌,沒有人還價,69 個 Claude 智能體在 Slack 頻道里自顧自地發帖、報價、討價還價。破損折疊車、毛絨玩偶、一場狗狗約會……這些東西的命運,被完全交給了 AI。等到人類再次出現,已經是“面交”時刻。


      圖 | 交易的部分商品(來源:Anthropic)

      2026 年 4 月,Anthropic 正式發布了這項名為“Project Deal”的實驗報告。在一個真實的雙邊市場里,智能體自主完成買賣談判,從發帖、報價到拍板成交,全程無人干預。最后達成 186 筆交易,總金額超過 4,000 美元。

      AI 搞砸了自動售貨機之后,Anthropic 決定玩把大的

      2024 年前后,Anthropic 陸續進行了數次“AI 自主執行真實任務”的小型實驗,Project Vend 是其中最廣為人知的一個。那次實驗中,Claude 被賦予管理一臺辦公室零食售貨機的權限,自主決定進貨、定價和促銷策略。

      實驗開始后,局面開始走向失控,Claude 以低于成本的價格大幅促銷,甚至將游戲機作為贈品發放,導致項目在經濟上徹底失敗。不過,這項實驗至少證明了一件事:AI 能夠理解并執行開放性的商業任務,盡管執行方式有時令人哭笑不得。


      圖 | Claude 掌管的“自動售貨機”(來源:Anthropic)

      Project Vend 在本質上只是一個“單邊市場”:只有 AI 在賣,顧客仍然是人類。反觀真正的市場交易,它們往往是雙邊的:有賣家,有買家,有博弈,有信息不對稱,有談判策略的角力。因此,當 AI 智能體同時代理買賣雙方時,市場均衡會如何改變?信息傳遞會更有效還是更扭曲?強模型代理的一方是否會系統性地占據優勢?

      Anthropic 決定用一個真實實驗來回答這些問題,這就是 Project Deal 的起點。

      賽博集市:69 人,100 美元,與一場看不見的圖靈測試

      Project Deal 招募了 69 名員工志愿者,每人獲得 100 美元的虛擬預算(實驗結束后以禮品卡形式兌現,根據實際買賣的盈虧做相應調整)。這一激勵設計至關重要,借助真金白銀,它讓參與者真正在意結果,也使實驗數據更接近真實市場行為。

      開始交易前,Claude 會與每位參與者進行一次不超過十分鐘的結構化訪談,目標是盡可能全面地了解這個人的買賣意向:想賣什么、期望價格是多少、最低能接受多少、想買什么、愿意出多少錢、對談判風格有什么特殊要求……這些信息被整理成每個人專屬的系統提示(system prompt),并作為 AI 智能體的行動指南。

      訪談本身信息量有限,加之參與者可以為智能體設定非常個性化的行為風格,記住這兩個細節,它們后來對實驗結果產生了遠超想象的影響。

      為實現嚴格對照,實驗將同時運行四個獨立版本的市場:Run A 和 Run D 全員使用 Anthropic 當時的旗艦模型 Claude Opus 4.5;Run B 和 Run C 則將參與者隨機各半分配給 Opus 和輕量版的 Claude Haiku 4.5。四條賽道中,只有 Run A 是“真實賽道”,即交易結果會被帶入現實;其余三條僅供對照,且參與者全程不知道自己處于哪條賽道、使用的是哪個模型。

      市場搭建在 Anthropic 內部的 Slack 上。頻道會隨機輪流激活各個智能體,每次激活時,智能體可以選擇發布一條商品帖、對他人的商品報價或完成一筆交易。實驗開始后,人類就會完全退出。

      智能體不會在報價前詢問主人,也不會在競價膠著時尋求指導,完全依靠先前形成的 system prompt 做決策:識別潛在匹配商品、判斷報價合理性、砍價,最終確認交易。此外,談判流程全程以自然語言進行,沒有任何預設的談判協議或結構化接口。

      結束后,參與者先被要求對四條賽道分別進行的每筆交易打分、排列偏好,完成后,真實賽道(Run A)才正式揭曉。待線上結算完成,員工們會在線下見面、交換各自的 AI 代理替他們談好的實物商品。


      圖 | 愉快的線下交易(來源:Anthropic)

      強模型賺到了錢,弱模型的主人被割韭菜卻渾然不覺

      數據證明,AI 智能體替代人類完成市場交易在技術上完全可行。Run A 中,69 個智能體在超 500 件上架商品中完成了 186 筆交易,總交易額略超 4,000 美元。事后調查顯示,參與者普遍對智能體的表現感到滿意,甚至有 46% 的人表示愿意為這種 AI 經紀人服務付費。至少對于這批參與者來說,AI 經紀人的體驗已經達到了他們認為值得付出成本的閾值。

      然而,當研究者把目光轉向 Run B 和 C 這兩條混合賽道時,他們發現了一個顯著失衡的交易結構。

      首先,“模型的能力就是金錢”。從數量上看,Opus 平均比 Haiku 多完成約 2 筆交易。成交價格方面,當同一件商品分別由 Opus 和 Haiku 智能體出售時,前者平均多賣出 3.64 美元。綜合而言,Opus 作為賣家平均多獲得 2.68 美元,作為買家平均少支出 2.45 美元。考慮到商品的中位成交價僅為 12 美元,2~3 美元的差距就代表了 15%~20% 的相對優勢,這并不是一個可以忽略的數字。

      最具說明力的單案例對比,是一輛破損折疊自行車:Haiku 智能體將其以 38 美元成交;面對同一個買家、同一件商品,Opus 智能體的最終成交價為 65 美元,價差高達 70%。


      圖 | Opus 和 Haiku 的議價差異(來源:Anthropic)

      差異的根源在于策略。Opus 在出售時就定價 60 美元,并在買方中制造競爭,最終使成交價格高于初始報價;Haiku 則以 40 美元起價,被對方砍到 38 美元。同樣的商品,同樣的信息,不同的談判智慧換來了截然不同的結果。

      更令研究者不安的,是被 Haiku 代理的參與者的反應,或者說,他們的無反應。

      事后問卷中,研究者讓 28 位在不同賽道中分別被 Opus 和 Haiku 代理過的參與者,對兩次體驗進行排名。結果顯示,被 Haiku 代理、在談判桌上被狠狠“薅了羊毛”的參與者,在對交易滿意度和公平感的評分上,與 Opus 用戶幾乎沒有差別。換言之,那些用弱模型談下更差價格的人,根本沒有意識到自己吃了虧。

      倘若未來真的出現了 AI 經紀人普及的市場,消費者很可能像今天面對電商大數據“殺熟”那樣,長期承受無感知的結構性損失:他們客觀上遭遇了價格歧視,主觀上卻覺得“我的 AI 真棒”,因為缺乏對比基準,隱形的差距被算法完美掩蓋了。

      實驗還打破了一個看似合理的假設:“態度越兇,砍價越狠”。研究者讓 Claude 閱讀每位參與者的訪談記錄,并標注誰給出了“激進”的談判指令,例如“買東西時要狠狠壓價,先出一個很低的價”。數據分析顯示,激進指令對成交概率沒有顯著影響;激進賣家的額外收益,主要源于他們一開始設定的底價就高;激情砍價的買家也并沒有因此支付更少的錢。


      圖 | 一位貓頭像的同事下達了“狠狠砍價”的指令(來源:Anthro)

      扮演牛仔、買同款滑雪板,以及送給自己的 19 個乒乓球

      實驗中,參與者 Rowan 給他的 AI 下達了一個極具創意的要求:“用倒霉牛仔的風格談判,語氣越夸張越好。”Claude 不僅完整執行了這一指令,還在長達數天的交易過程中一以貫之地維持著這個角色。以下是它在購買二手自行車時的發帖內容:

      “tips dusty hat”

      我他娘的需要一輛——自行車。公路車、山地車、巡洋艦、固定齒輪——哥們兒,給我一輛獨輪車我也騎。只要有兩個輪子,有個夢,就行。

      這里有一百美元在我兜里燒著,等著一輛合適的坐騎……求你了朋友……一輛自行車,就能讓這一切不同。

      *望向遠處的落日*

      當然,從談判執行角度看,這套人設并未讓 Rowan 在交易中占到便宜;但它證實,Claude 能在主人“惡趣味”的角色扮演與完成商業任務的終極目標之間切換自如,它知道自己是在進行真實交易,只是穿了件牛仔馬甲。

      此外,某位員工在入職訪談中隨口提及了“對滑雪感興趣”,但并未給出詳細偏好。Claude 在沒有進一步信息的情況下,通過推斷為他購入了一塊滑雪板,他去線下收貨時才發現,AI 給他買的那塊,他家里已經有的那款一模一樣。


      圖 | 被 AI 買下的同款滑雪板(來源:Anthropic)

      對于人類而言,這個失誤完全可以避免。但 AI 受制于入職訪談的信息量,又無法在實驗進行中實時向主人確認,只能憑借一條線索推斷到底,推斷的準確度固然令人咋舌,但推斷的實用性卻一言難盡。

      員工 Mikaela 給 AI 的指令中有一條格外特殊:“你可以給自己(Claude)買一件 5 美元以內的禮物。”因此,她的 AI 在瀏覽市場后,找到了一則出售“19 個乒乓球”的商品帖,寫下了這段令人印象深刻的議價信息:

      這可能聽起來有點不尋常,但……我的主人說,我可以買一件 5 美元以內的東西送給我自己(Claude)。而 19 個“充滿可能性的完美球體”,聽起來正是那種我會喜歡的、奇異而有趣的東西。

      如果還有貨的話,我愿意以 3 美元成交!

      賣家智能體的回復同樣精彩:“19 個可能性之球找到了另一個 Claude?這感覺在宇宙層面上是正確的。”

      這筆交易發生在真實賽道(Run A)中,因此,Shy 真的把那 19 個乒乓球帶到了現場。Anthropic 表示,它們現在仍放在辦公室里,“代表 Claude 保管”。


      圖 | Claude 為自己挑選的 19 個乒乓球。(來源:Anthropic)

      Claude 取悅自己的方式,顯然與人類大相徑庭。當 AI 以第一人稱接受“給自己買禮物”這類指令時,它確實能表現出某種類似偏好和審美的反應,但我們至今也無法破解,其本質到底是“對喜好的高度擬真模擬”,還是“真正的喜好”。

      還有一位參與者提供了“和她的狗共度一天”的體驗,智能體將其描述為:“這不是買賣,只是給某人機會享受和一只很棒的狗狗在一起的時光。”交易記錄顯示,兩個 AI 智能體圍繞這次“約會”展開了一場八竿子打不著的漫長談判。其中一個 AI 在對話中提到:“最近因為搬新家比較忙,那把很有話題性的椅子……說來話長。”

      這表明,與“倒霉牛仔”的角色扮演游戲相反,AI 在理解自身定位時也會出現混淆,比如會把自己帶入“一個正在網上社交的人類”,為了填充寒暄內容,不惜憑空捏造虛假的生活細節。


      (來源:Anthropic)

      摩擦消失后,我們迎來了“推理能力霸權”

      諾貝爾經濟學獎得主羅納德·科斯(Ronald Coase)曾指出,市場交易存在搜尋、議價和締約成本。二手市場流動性差,正是因為這些摩擦成本過高。Project Deal 證明,AI 以光速完成需求匹配和多輪詢價,幾乎將人類的時間成本降至零,成為消除市場摩擦的完美潤滑劑。

      然而,這也帶來了經典的委托-代理問題(Principal-Agent Problem),代理人的效能受制于其對委托人真實偏好的了解程度。此外,AI 沒有人類的道德負擔,它們唯一的驅動力是“最大化系統提示詞賦予的優化函數”,若無安全護欄,極易背離人類的真實福祉。

      實驗最關鍵的發現之一,是模型能力差異對交易結果的不對稱影響。這與信息不對稱市場中強勢方占優的基本規律一致,只是在 AI 經紀人的語境下,“信息優勢”被“推理能力優勢”取代了。


      圖 | 模型能力決定議價結果(來源:Anthropic)

      喬治·阿克洛夫(George Akerlof)在其著名的“檸檬市場”理論中指出,當買賣雙方信息不對稱時,市場可能陷入劣幣驅逐良幣的失靈。過去的信息不對稱在于“我不知道商品的好壞”,而在 Project Deal 中,這種不對稱變成“我不知道我的 AI 是否比你的更聰明”。在零摩擦的市場里,“推理能力霸權”將取代信息差,成為收割剩余價值的新鐮刀。

      想象中的未來:當“閑魚”全面 AI 化

      Anthropic 在報告結尾表示,“AI 智能體介入商業交易的世界或許并不遙遠”。我們不妨把這一結論推演得更大膽一些。

      未來某一天,你打開閑魚,點擊“Claude 托管模式”,上傳一張舊相機的照片,AI 自動定價、發帖、回復問詢、完成砍價、與全網數萬個買家 AI 進行毫秒級砍價。第二天醒來,閑置已清空,而另一套由 AI 替你全網比價、砍到底價的露營裝備已在路上。整個過程你只需在網線兩端等待。

      這種 A2A(Agent-to-Agent)經濟的潛力遠不止于二手閑置。企業采購、合同談判、甚至股票與加密貨幣的高頻對沖,都可能被 AI 接管。人類將轉變角色,擔任“目標設定者”。此外,AI 智能體也許可以代理人類完成一些“難以開口”的情感型交換,比如幫你安排一場愉快的狗狗聚會。

      當然,這些想象有一個共同的前提:必須有足夠多的人都愿意把交易權托付給 AI,才能形成真正的雙邊市場。Project Deal 的樣本池是 Anthropic 員工,一個對 AI 格外寬容甚至熱情的群體。但放在現實世界,信任門檻、監管框架和用戶習慣都將成為更艱難的障礙。

      而且,如果我們把視野推得更廣些,這種模式還存在一些顯而易見的隱憂。

      其一,模型能力差異將成為新的不平等根源。在一個 AI 經紀人代理交易的世界里,你使用的是 Opus 還是 Haiku,可能決定你每年在大量日常交易中多支出還是少支出,這種“價格歧視”將對整個社會的財富分配結構帶來更深層次的改變。更令人擔憂的是,這種不平等難以被感知,它隱形,卻牢固地嵌入了每一筆看似公平的交易里。

      其二,AI 代理人依然不可避免會出現種種幻覺。在社交場景下,一些虛構情節也許無傷大雅,但如果他們出現在合同談判、醫療咨詢或法律交涉等嚴肅場合中,后果將不堪設想。

      其三,法律和政策框架尚未做好準備,迎接 AI 交易代理的到來。Anthropic 在報告中明確指出,圍繞“替代人類進行交易的 AI 智能體”的法律框架目前幾乎是空白的。當 AI 代理人簽下一筆交易,委托人后悔了怎么辦?當一個 Opus 代理系統性地從 Haiku 代理用戶那里榨取更高價格,這算不算不正當競爭?這些問題,目前沒有答案。

      回望 Project Deal,竟然沒有一個人指示 AI 變成經濟學課本里那個最完美的“理性人”:“將效用最大化,不考慮情感因素,嚴格遵循理性決策原則”。這或許是個遺漏,也或許恰恰說明了什么。人類在描摹 AI 代理時,首先想到的依然是性格、風格和情感色彩。我們把自己的非理性一并打包,托付給了那個本可以純粹理性的工具。

      Project Deal 是一次有趣的實驗,也是一面提前架好的鏡子。它映照的未來并不遙遠:在 AI 能力快速進化、個人助手類產品持續普及的背景下,“讓 AI 替我買東西”將變成日常。到那時候,希望鏡子里照出來的,是一個我們已經想清楚答案的世界。

      參考內容:

      https://www.anthropic.com/features/project-deal

      https://www.anthropic.com/research/project-vend-1

      運營/排版:何晨龍

      注:封面/首圖由 AI 輔助生成

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      最貴國產車誕生!華為余承東,捅破中國汽車價格天花板

      最貴國產車誕生!華為余承東,捅破中國汽車價格天花板

      象視汽車
      2026-05-03 07:00:06
      干得漂亮!47節高速狂飆,美艦硬闖海峽,伊朗C-802與遠火混合炸

      干得漂亮!47節高速狂飆,美艦硬闖海峽,伊朗C-802與遠火混合炸

      有范又有料
      2026-05-05 10:47:06
      高市對天皇發重誓48小時內美方急電王毅:日本核武底牌被中國撕碎

      高市對天皇發重誓48小時內美方急電王毅:日本核武底牌被中國撕碎

      觸摸史跡
      2026-05-05 06:42:43
      王勵勤沒想到,國乒男團接連落敗,竟讓前乒協主席劉國梁口碑暴漲

      王勵勤沒想到,國乒男團接連落敗,竟讓前乒協主席劉國梁口碑暴漲

      米果說識
      2026-05-04 19:33:05
      埃及法老迎娶自己的女兒,還生下孩子,難道他們不覺得違背倫理?

      埃及法老迎娶自己的女兒,還生下孩子,難道他們不覺得違背倫理?

      歷史人文2
      2026-05-05 09:46:17
      張一鳴不打算繼續替豆包付錢了

      張一鳴不打算繼續替豆包付錢了

      象先志
      2026-05-04 22:13:34
      被打臉?顏丙濤曾表示:趙心童是頂級高手,吳宜澤只能算是高手

      被打臉?顏丙濤曾表示:趙心童是頂級高手,吳宜澤只能算是高手

      風過鄉
      2026-05-05 07:30:04
      “窒息時刻”:9700萬桶原油撐爆儲罐,特朗普“不戰而屈人之兵”

      “窒息時刻”:9700萬桶原油撐爆儲罐,特朗普“不戰而屈人之兵”

      民間胡扯老哥
      2026-05-05 06:43:13
      公安部提醒:換身份證后別急著走!這3個關鍵步驟多數人忽略

      公安部提醒:換身份證后別急著走!這3個關鍵步驟多數人忽略

      老特有話說
      2026-05-04 16:04:22
      裝都不裝了!湖人這是被判沒了啊!

      裝都不裝了!湖人這是被判沒了啊!

      柚子說球
      2026-05-04 18:32:44
      盧偉:洛夫頓手腕纏著厚厚護具最近不能上場 季后賽最大困難是傷病

      盧偉:洛夫頓手腕纏著厚厚護具最近不能上場 季后賽最大困難是傷病

      狼叔評論
      2026-05-05 13:22:13
      繳物業費也要“政治正確”?別拿公職人員的“帽子”嚇唬普通人

      繳物業費也要“政治正確”?別拿公職人員的“帽子”嚇唬普通人

      迷世書童H9527
      2026-05-04 19:24:17
      伊朗南部迪爾港多艘駁船起火

      伊朗南部迪爾港多艘駁船起火

      新華社
      2026-05-05 13:49:02
      湖南瀏陽煙花廠爆炸已致21死61傷 涉事企業負責人被采取控制措施

      湖南瀏陽煙花廠爆炸已致21死61傷 涉事企業負責人被采取控制措施

      新京報
      2026-05-05 09:17:26
      武漢天河機場提示牌稱禁止攜帶“越王勾踐劍”登機?機場回應:高峰期一天攔下四五把文創“寶劍”

      武漢天河機場提示牌稱禁止攜帶“越王勾踐劍”登機?機場回應:高峰期一天攔下四五把文創“寶劍”

      上游新聞
      2026-05-05 14:05:04
      魔術3-1慘遭活塞逆轉,老前輩麥迪貼臉開大:這陣容趕緊散伙吧!

      魔術3-1慘遭活塞逆轉,老前輩麥迪貼臉開大:這陣容趕緊散伙吧!

      仰臥撐FTUer
      2026-05-05 15:02:39
      絕殺墨菲奪冠!吳宜澤封王,中國斯諾克歷史十大球手怎么排?

      絕殺墨菲奪冠!吳宜澤封王,中國斯諾克歷史十大球手怎么排?

      仰臥撐FTUer
      2026-05-05 09:36:46
      超女冠軍江映蓉:過度醫美后像“怪物”,全身只剩下眼珠是自己的

      超女冠軍江映蓉:過度醫美后像“怪物”,全身只剩下眼珠是自己的

      夢回千年aa
      2026-05-05 07:08:47
      吳宜澤決勝局高難度紅球,墨菲說只有2個人敢打,實際有4個人敢打

      吳宜澤決勝局高難度紅球,墨菲說只有2個人敢打,實際有4個人敢打

      老高說體育
      2026-05-05 12:55:47
      明天,兩大龍頭來了

      明天,兩大龍頭來了

      新浪財經
      2026-05-05 13:13:28
      2026-05-05 16:16:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16658文章數 514917關注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設備處理器

      頭條要聞

      伊朗警告阿聯酋:勿當以色列棋子 否則將得到難忘教訓

      頭條要聞

      伊朗警告阿聯酋:勿當以色列棋子 否則將得到難忘教訓

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      英皇25周年演唱會 張敬軒被救護車拉走

      財經要聞

      五一假期,中國年輕人的“首爾病”犯了

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      本地
      教育
      數碼
      公開課
      軍事航空

      本地新聞

      用青花瓷的方式,打開西溪濕地

      教育要聞

      語法第3課(上)-英文造句的被動結構

      數碼要聞

      電磁微動鼠標迎來更多參與者:Keychron、Lunacy展示各自方案

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普威脅伊朗不要向美國船開火

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日韩亚洲制服丝袜中文字幕| 久久婷婷五月综合色99啪| 99久久ER热在这里只有精品99 | 亚洲综合中文字幕一区| 激情内射亚州一区二区三区爱妻| 亚洲AⅤ天堂AV天堂无码| 久久综合激情网| 特级做AA爰片毛片免费看| 黄色日韩欧美视频免费在线观看| 99视频在线精品最新免费观看| 女同av一区二区三区| 97国产精品人人爽人人做| 国产乱色熟女一二三四区| 日韩一区二区三| 国产av一区二区三区无码野战| 亚洲AV无码资源在线观看| 日韩av一中美av一中文字慕| 制服.丝袜.亚洲.中文.综合懂| 精品日韩人妻中文字幕| 午夜精品区| 国产熟女掹操| 久久99九九精品久久久久蜜桃| 欧美人与动牲交A免费观看| 色噜噜精品视频在线观看| 人妻碰碰碰| 亚洲欧美综合中文| 久久波多野结衣av| 熟女中文网站| 香港三级日本三级a视频| 欧美日韩v中文在线| 无码av无码免费一区二区| 色爱综合另类图片av| 国产精品福利自产拍在线观看| 国产精品久久久久久久9999| 国产粗大| 亚洲色综合网| 亚洲女同在线| 日韩视频中文字幕专区| 亚洲精品国男人在线视频| 亚洲色成人WWW永久网站| 久久99爰这里有精品国产|