<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      6小時,200美元,0人類代碼:Anthropic把AI編程推過了臨界點

      0
      分享至


      新智元報道

      編輯:KingHZ

      【新智元導讀】代碼沒有消失,但它不再是少數人特權。在「創造平權」的AI時代,真正稀缺的不再是編程能力,而是你是否有一個值得讓機器為你燃燒幾百美元算力的好想法。

      真正讓人不安的,不是AI提高生產力,而是AI開始主導「生產關系」。

      Anthropic最危險的進步,不是AI會寫代碼,而AI開始獨自把項目做完。

      一句話需求、6個小時、200美元。


      沒有產品經理、沒有程序員、沒有設計師,甚至全程人類補一行代碼。

      Anthropic把Claude丟進一個任務里:做一套完整的復古游戲編輯器。

      結果,Claude沒有只交出一個像樣的頁面。

      它自己拆需求,自己寫代碼,自己測試,自己返工,最后交出一個真的能跑起來的成品。






      在Anthropic這次實驗里,AI已經不只是生成代碼,而是在逼近交付。

      過去我們聊AI編程,聊的是它寫得快不快。現在問題變成了:它能不能連續工作幾個小時,在第5輪、第10輪修改里不跑偏,最后把東西交出來。

      Anthropic這次給出的答案是:能。

      但前提不是把AI當一個人使,而是把它組織成一個團隊。


      原文鏈接:https://www.anthropic.com/engineering/harness-design-long-running-apps

      AI不是不聰明,而是不穩定

      過去的AI很像一個天賦很高的實習生。

      第一版,沖得很猛。

      第一個頁面,出得很快。

      第一輪代碼,看上去也像那么回事。

      但任務一拉長,它就開始亂:

      邏輯散了,上下文丟了。

      該修的沒修,該測的沒測。

      最麻煩的是,它常常會提前進入一種「看起來做完了」的狀態。

      Anthropic點得很準:問題不一定出在智力上,而是出在長程執行上。

      Anthropic做了一個對照實驗,結果很殘酷。

      單智能體模式下,AI用20分鐘、9美元,也做出了一個「像游戲編輯器」的東西。


      問題是,一上手就露餡——

      交互沒打通;實體沒正常響應;核心玩法直接失靈。



      這說明一件事:

      以前大家總以為AI不行,是因為還不夠聰明。

      現在看,很多時候真正拖AI后腿的,不是智商,而是穩定性

      很多人一說AI記不住,第一反應都是:那就給它更大的上下文窗口。

      聽起來很合, 但Anthropic這次潑了一盆冷水。

      窗口更大,不一定更強。很多時候,只是把混亂一起放大了。

      東西越堆越多,但真正重要的主線,反而越容易被淹掉。這就是所謂的「上下文腐爛」。

      更麻煩的是,模型還容易高估自己。

      Anthropic發現,程序明明一跑就崩,模型卻覺得自己做得不錯。

      于是單智能體會掉進兩個坑:一邊越寫越亂;一邊越亂越覺得自己沒問題。

      這就是為什么,單純靠更大模型、更長窗口、更高token上限,AI并不能獨立完成項目交付。

      為了取得突破,Anthropic Labs成員Prithvi Rajasekaran探索了一些新穎的AI工程方法。


      這些方法在兩個截然不同的領域中均適用:一個由主觀品味定義,另一個則以可驗證的正確性和可用性為準。

      受對抗生成網絡(GANs)的啟發,他設計了一種包含生成器和評估器的多智能體結構。

      沒造「超人」,但Anthropic造了神團隊

      這次最關鍵的變化,不是參數。不是窗口。也不是什么神秘提示詞。

      真正的變化是,Anthropic不再逼一個AI單槍匹馬干完整個項目。

      它開始讓AI分工。

      這套結構很像一個小型產品團隊。

      • Planner,負責想清楚。它先把一句模糊需求,擴成規格,定義產品到底要做什么。

      • Generator,負責動手。它下場寫代碼,搭前后端,接交互,做集成,一輪輪推進。

      • Evaluator,負責挑錯。它不負責體面。它只負責驗收。點頁面、試按鈕、查數據庫、測接口,把問題一個個揪出來,再打回去重做。


      最后一步特別關鍵,因為一邊寫,一邊給自己打分,最后AI很容易說服自己:差不多就行。

      但把兩者拆開,很多本來會被糊弄過去的問題,就過不去了。

      拿那套復古游戲編輯器來說,Planner最初拿到的只有一句話需求。

      但最后擴出來的,是一份包含16個功能、10個沖刺的規格書。

      精靈動畫、音效系統、行為模板、AI精靈生成、關卡設計助手、導出分享,全部被拆進流程里。

      這已經不是「AI寫代碼」了,AI開始學會像團隊一樣做產品。

      真正拉高質量的,是高壓驗收

      今天很多AI產品都有一種共同氣質——看著完整,配色安全,布局規整。

      挑不出大錯,但也沒什么靈魂。這種東西叫AISlop「AI泔水」。說白了,就是「像成品的樣子貨」。

      顯然,Anthropic不滿足于這種結果。

      所以它不只讓Evaluator查bug,還讓它盯四件事:

      設計質量、原創性、工藝感、功能性。

      而且,它還故意把「原創性」和「設計質量」的權重拉高。

      譯成人話就是:別總交最安全的答案,做點真的像作品的東西出來。

      這背后是一個很重要的信號:

      很多人以為AI的創造力來自靈光一現,但很多時候,AI的創造力,恰恰是被高標準一點點逼出來的。

      所以,下一階段真正稀缺的能力,可能不是「誰更會生成」,而是「誰更會評價」。

      你有多會挑錯,決定AI最終能走多遠。

      最可怕的是,AI真能改到第10輪

      這次實驗最讓人不安的,是Claude開始形成很強的閉環感。

      還是看RetroForge,也就是那套復古游戲編輯器。

      同樣一句話需求。

      單智能體版,20分鐘,9美元。很快,也很便宜,但更像一個空殼。


      三智能體版本,6小時,200美元。貴得多,慢得多,但最后結果完全不是一個量級。

      它真的把27條驗收標準,一條一條啃過去了。

      這里面暴露出來的,是實打實的軟件工程問題。比如:

      函數寫了,但事件沒觸發。

      接口有了,但路由順序錯了,參數被錯誤解析。

      這說明它做的,已經不只是拼頁面,開始進入真正的工程地帶。

      另一個例子更夸張。

      Claude用了不到4小時、約124.7美元,做出一個能在瀏覽器里跑的DAW,也就是數字音頻工作站。

      它有排列視圖、有混音器、有傳輸控制、有實時波形預覽。

      還內置了一個AI智能體,可以直接理解自然語言的音樂指令。

      你告訴它節奏、調性、旋律、鼓軌、混響,它能繼續往下做。

      更關鍵的是,Evaluator沒有放過它:


      恰恰是這些被揪出來的問題,證明了這套系統真的形成了閉環:

      不止要做完,還要被打回去改。改到能過驗收,才算結束。

      這才是軟件開發里最難、也最有價值的部分。

      第一版從來不難,難的是第8版、第9版、第10版。

      真正的分水嶺,

      AI第一次反復改到交付

      Anthropic這次最值得行業警惕的,不是讓Claude變成了一個更強的程序員。

      而是讓它第一次表現得像一個真正的產品組織,分工明確,各司其職。

      這就是為什么,這次突破看起來不像「生產力升級」,更像一次「生產關系升級」。

      過去,AI最強的能力是「生成一個答案」。

      現在,它開始逼近另一種更難的能力:

      圍著一個目標,持續工作,持續修正,直到交付。

      這才是真正的臨界點。

      代碼沒有消失,它只是在失去作為少數人特權的地位。

      在這個「創造平權」的時代,你是否真的有一個值得讓機器為你燃燒算力的好主意?

      這才是最值得深思的問題。

      參考資料:

      https://www.anthropic.com/engineering/harness-design-long-running-apps

      https://x.com/AnthropicAI/status/2036481033621623056

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      醫生坦言:只要血脂報告里沒有這2個詞,血管健康就不用太擔憂

      醫生坦言:只要血脂報告里沒有這2個詞,血管健康就不用太擔憂

      健康科普365
      2026-04-07 11:35:05
      廣東隊雙塔打爆龍獅內線,大概率晉級8強,但面對首鋼毫無勝算

      廣東隊雙塔打爆龍獅內線,大概率晉級8強,但面對首鋼毫無勝算

      孤影來客
      2026-05-02 19:46:09
      10萬億?中國或將成為全球,乃至人類歷史上,第一個“電力王國”

      10萬億?中國或將成為全球,乃至人類歷史上,第一個“電力王國”

      別人都叫我阿腈
      2026-05-02 20:11:03
      哇這大體格,目測身高175,身形如此的勻稱,男人心中的完美伴侶

      哇這大體格,目測身高175,身形如此的勻稱,男人心中的完美伴侶

      動物奇奇怪怪
      2026-04-12 03:42:39
      五一檔最慘電影,上映多天票房只有0元,一個觀眾都沒有

      五一檔最慘電影,上映多天票房只有0元,一個觀眾都沒有

      孤城落日
      2026-05-02 17:43:29
      “湖南一姐”黃菲一路領先,20公里被罰下!這場馬拉松爭議不斷!

      “湖南一姐”黃菲一路領先,20公里被罰下!這場馬拉松爭議不斷!

      跑步指南
      2026-05-02 16:06:18
      龍珠地獄級選座!你敢坐哪一個?

      龍珠地獄級選座!你敢坐哪一個?

      動漫心世界
      2026-05-02 17:17:48
      美專家忽然發現,中國早就準備好,一旦沖突,先廢掉美軍最強戰力

      美專家忽然發現,中國早就準備好,一旦沖突,先廢掉美軍最強戰力

      只能離開
      2026-05-02 11:48:33
      “砦”不讀chái,也不讀cǐ,我出過丑,從那不再犯錯了!

      “砦”不讀chái,也不讀cǐ,我出過丑,從那不再犯錯了!

      未央看點
      2026-05-02 19:51:04
      斬殺中年男性的三件套:陽痿、失業和心梗!

      斬殺中年男性的三件套:陽痿、失業和心梗!

      燈錦年
      2026-04-30 10:04:05
      安徽一28歲美女相親,不料,遇車禍右腿被截肢!相親對象竟說:“嫁給我,醫藥費我出”

      安徽一28歲美女相親,不料,遇車禍右腿被截肢!相親對象竟說:“嫁給我,醫藥費我出”

      勵職派
      2026-04-17 12:44:31
      北京經濟技術開發區管委會原一級巡視員沈永剛被查

      北京經濟技術開發區管委會原一級巡視員沈永剛被查

      亦莊新城那些事兒
      2026-05-02 20:14:08
      前蘇聯中將親口揭秘中越戰局:中國出動 56 萬大軍攻勢如潮

      前蘇聯中將親口揭秘中越戰局:中國出動 56 萬大軍攻勢如潮

      磊子講史
      2026-03-16 14:01:54
      萬科回應2000名員工跟投維權事件

      萬科回應2000名員工跟投維權事件

      地產微資訊
      2026-05-01 20:31:01
      李秀成之子遭閹割絕嗣,陳玉成血脈下南洋躲避追殺,百年后為何成馬來西亞首位華人少將?

      李秀成之子遭閹割絕嗣,陳玉成血脈下南洋躲避追殺,百年后為何成馬來西亞首位華人少將?

      史海孤雁
      2026-04-30 16:34:11
      80歲不管存款多少,記得提前給自己準備4樣東西,建議了解

      80歲不管存款多少,記得提前給自己準備4樣東西,建議了解

      小談食刻美食
      2026-04-27 07:57:04
      陜西11歲男童溺亡!主動去的河邊,把文具送給同學,原因讓人心疼

      陜西11歲男童溺亡!主動去的河邊,把文具送給同學,原因讓人心疼

      奇思妙想草葉君
      2026-05-02 15:42:40
      “崩老頭”月入兩三萬?中國精神小妹批量收割,8090后搶著被崩?

      “崩老頭”月入兩三萬?中國精神小妹批量收割,8090后搶著被崩?

      素衣讀史
      2026-04-10 19:59:20
      火箭賽季結束,伊森將會去哪成為關注,休城資質報價800萬美元

      火箭賽季結束,伊森將會去哪成為關注,休城資質報價800萬美元

      只扣籃的教練
      2026-05-02 13:38:01
      英國朋友從上海回去后,一直搖頭說,你們中國已經是超一等國家了

      英國朋友從上海回去后,一直搖頭說,你們中國已經是超一等國家了

      小影的娛樂
      2026-05-02 18:16:32
      2026-05-02 21:35:01
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      15116文章數 66829關注度
      往期回顧 全部

      科技要聞

      AI熱潮耗盡庫存,Mac Mini起售調高200美元

      頭條要聞

      媒體:美國突然"翻臉" 對歐洲連打"三拳"一氣呵成

      頭條要聞

      媒體:美國突然"翻臉" 對歐洲連打"三拳"一氣呵成

      體育要聞

      休賽期總冠軍,輪到休斯頓火箭

      娛樂要聞

      白百何罕曬大兒子 18歲元寶越來越帥

      財經要聞

      雷軍很努力 小米還是跌破了30港元大關

      汽車要聞

      新紀錄!零跑汽車4月交付達71387臺

      態度原創

      親子
      健康
      藝術
      公開課
      軍事航空

      親子要聞

      麻麻們都喜歡的兒子

      干細胞治燒燙傷面臨這些“瓶頸”

      藝術要聞

      色塊與筆觸的激情之旅!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普:對伊戰事結束 無限期延長停火

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人人妻碰人人免费| 丝袜美女污污免费观看的网站| 亚洲精品国产综合久久一线| 丝袜shi在线播放| 亚洲国产字幕| 国产精品视频一区国模私拍| 熟女少妇精品一区二区| 欧洲亚洲国内老熟女超碰| 久久久高清日本道免费观看| 性色高清无码| 综合久久久久久久综合网| 国产初高中生视频在线观看| 国产精品久久久久影院色| 亚洲精品一区二区麻豆| 怡春院久久国语视频免费| 麻豆av永久地址久久精品| 亚洲avav天堂av在线网爱情| 制服丝袜在线亚洲| 亚洲天堂人妻| 亚洲欧美日韩高清在线电影 | 亚洲国产精品馒头| 亚洲国产美女精品久久久久| 亚洲精品日韩中文字幕| 久久福利导航| 日韩成人无码中文字幕| 国产成人久久91一区二区三区| 国产丝袜精品在线| 一区二区三区国产亚洲网站| 中文字幕国产日韩精品| 亚洲尤物av一区| 国产亚洲欧美在线人成aaaa| 中文字幕亚洲日韩无线码| 久久精品女| 久久精产国品一二三产品| 国产9 9在线 | 免费| 波多野结衣一区二区三区高清| 黑人巨大粗物挺进了少妇| 亚洲有无码中文网| 在线高清亚洲精品二区| 日本系列亚洲系列精品| 国产精品99中文字幕|