<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      Claude越更越廢?AMD AI負責人甩出23萬次調用記錄:已“變蠢+擺爛”,復雜工程根本干不了

      0
      分享至


      來源:AI思想會

      【前言】AI 正以前所未有的速度發展,新的機遇不斷涌現,如果你希望:與技術專家、產品經理和創業者深度交流,一起探索 AI如何改變各行各業。歡迎在文末掃二維碼,加入「AI思想會」交流群,和一群志同道合的伙伴共同學習、思考、創造!

      近日,曾被視為最強 AI 編碼工具之一的 Claude Code,遭遇了前所未有的信任危機。帶頭提出質疑的,是 AMD 人工智能部門的負責人——她直言吐槽 Claude Code 越更新越差,不僅“變蠢”,還學會了偷懶擺爛。

      不僅如此,她更拿出了數萬條實際使用數據進行深度分析,實錘了這一說法。



      一則 GitHub issue,引全網熱議

      這場爭議的導火索,源于 4 月 2 日一名昵稱為 stellaraccident 的用戶,在 Claude Code 的 GitHub 項目頁面上提交的一個問題反饋(Issue)。

      她沒繞任何彎子,直接在 issue 標題中就帶著不滿:“2 月份的更新導致 Claude Code 無法用于復雜的工程任務”。


      根據該用戶的 GitHub 個人資料和相關 Linkedln 帖子顯示,這位發帖人正是芯片制造商 AMD 人工智能部門主管 Stella Laurenzo。


      她明確列出了更新后 Claude Code 的四大問題,堪稱“四宗罪”:

      1. 無視指令

      2. 聲稱“最簡單的修復方案”,但其實是錯誤的

      3. 執行與要求相反的操作

      4. 在未按要求完成的情況下聲稱已完成

      為了證明自己并非隨口吐槽,Stella Laurenzo 還拿出了團隊幾個月的使用日志,里面詳細記錄了 6852 次會話,這些會話包含了 234760 次工具調用和 17871 個思維塊。

      所有數據都指向一個結論:2月份之后的 Claude Code,就是在擺爛,稍微復雜一點的工程活,根本信不過。


      Claude Code 到底擺爛成什么樣?

      通過對會話文件的量化分析,Stella Laurenzo 指出:思考內容脫敏功能(redact-thinking-2026-02-12)的上線,與復雜長會話工程工作流的質量退化,有著精準的對應關系。

      數據顯示,擴展思考 token 并非“錦上添花”,而是模型執行多步驟研究、遵守規范、精細修改代碼的核心必要條件。

      一旦思考深度降低,模型的工具使用模式就會從“先研究后修改”,明顯轉變為“直接修改”,這也直接引發了用戶反饋的各類質量問題。

      Stella Laurenzo 以及其團隊基于以下幾個維度剖析了 Claude Code 這幾個月間的變化:

      1.思考內容隱藏時間線與質量回退相吻合

      從會話 JSONL 文件中對思考塊的分析結果來看,變化更為直觀:


      調查報告顯示,質量退化問題于 3 月 8 日被獨立上報,而這一天,恰好是脫敏思考塊占比突破 50% 的日子。據悉,脫敏功能是分階段部署的,從 1.5% 逐步提升至 25%、58.4%,最終在一周內達到 100%。

      2.脫敏前思考深度已大幅下降

      1 月份時,Claude Code 每次思考的內容大約有 2200 個字符,能看出是在認真琢磨問題。可到了 2 月底,思考字符數直接暴跌至 720 個,相當于減少了三分之二的思考量,思考深度下降了 67%。


      除了思考偷懶,Stella Laurenzo 和 AMD 團隊還檢測了 Claude Code 的多項質量指標。

      在思考分析完成前,他們已基于 18000 + 用戶提示詞獨立計算以下指標:


      此外,他們也編寫了 stop-phrase-guard.sh 停止鉤子,用于自動檢測推諉、提前停止、請求許可等敷衍行為。

      結果顯示,3 月 8 日后的 17 天內,這個鉤子被觸發了 173 次,而在此之前,從未被觸發過。

      另外,Claude Code 的工作態度也發生了徹底轉變,最核心的變化就是修改代碼的邏輯:以前它會先認真閱讀相關文件,再動手修改,但對 234760 次工具調用的分析顯示,現在的它,已經不再先閱讀代碼再修改了。

      調查數據清晰地呈現了這一退化:1 月份時,Claude Code 改一次代碼平均要讀取 6.6 次文件,生怕出現錯誤。這算是它的“良好期”,會先讀取目標文件、關聯文件,全局檢索用法,查看頭文件與測試用例,再進行精準修改。

      可到了 3 月底,它平均只讀 2 次文件就敢直接動手修改,降幅超過 70%。這樣一來,問題自然層出不窮:僅讀取當前文件就直接修改,常常忽略上下文,進而出現亂插代碼、破壞原有注釋、重復編寫邏輯等問題,寫出來的代碼 Bug 滿天飛。

      很多程序員反饋,后續修改這些 Bug 的時間,比自己重新寫一段代碼還要久。


      除此之外,Claude Code 全新寫入的占比翻倍,模型更傾向于重寫整個文件,而非精準修改。這樣做雖然速度更快,但會丟失精度與上下文感知,反而得不償失。


      Stella Laurenzo 還進一部分分析了受影響的工作流,主要包括:

      • 50 + 并發代理會話執行系統編程(C、MLIR、GPU 驅動)
      • 30 分鐘以上自主運行,執行復雜多文件修改
      • 嚴格的項目規范(5000 + 字 CLAUDE.md 文檔)
      • 代碼評審、工單管理、迭代調試
      • 良好期單周末合并 19.1 萬行代碼

      其指出,擴展思考是模型實現以下能力的核心機制:

      • 行動前規劃多步驟方案(讀取文件、執行順序)

      • recalling 并遵循項目規范

      • 輸出前自我檢查錯誤

      • 判斷任務是否完成、會話是否繼續

      • 數百次工具調用中保持邏輯連貫

      而當思考深度不足時,模型就會選擇最省力的操作:不讀取文件直接修改、未完成任務就停止、推諉責任、用最簡單的方案替代正確方案。

      從 2 月到 3 月,Claude Code API 請求量直接暴漲了 80 倍,輸出的 token 也增加了 64 倍。據估算,每月的使用成本從幾百美元,直接飆升到 4 萬多美元。本來想省單次思考的算力,結果因為 Claude Code 反復改錯、需要不斷重試,反而讓整體成本直接失控,簡直是賠本賺吆喝。



      訴求:雖然我已換了其他大模型,但還是希望 Anthropic 能修復產品

      面對這樣的結果,Stella Laurenzo 表示,這不是她一個人遇到的問題,而且情況已經嚴重到無法在工作環境中繼續使用 Claude Code 的地步。

      她說道:“我們的工作環境復雜度高且穩定,通過挖掘數月日志,我們明確了問題的根源——自 2026 年 2 月起,Claude 已無法可靠完成復雜工程任務。團隊所有資深工程師均反饋了類似問題,其中一位工程師擁有可復現的測試流程,我們基于其日志開展實驗與數據分析,且已嘗試所有公開的變通方案。”

      在 Stella 看來,自己發布這份反饋,并不是為了抹黑 Anthropic,而是真心希望他們能重視這個問題,拯救 Claude Code 這個曾經的好產品。“我們已切換至其他服務商,其服務質量更優,但 Claude 曾為我們提供良好支持,因此提交此問題,希望 Anthropic 能修復產品。

      對此,其提出了四個建議:

      • 關于思考資源分配的透明度:如果思考 token 被減少或設上限,依賴深度推理的用戶需要知情。目前的 redact-thinking header 讓外部無法驗證這一點。

      • “最大思考”等級:執行復雜工程工作流的用戶愿意為保證深度推理付出更高費用。目前的訂閱模式沒有區分需要每次 200 個思考 token 的用戶和需要 20,000 個的用戶。

      • API 響應中的思考 token 指標:即使思考內容被隱藏,如果在使用情況響應中暴露 thinking_tokens,用戶仍可監控自己的請求是否獲得了所需的推理深度。

      • 高階用戶的金絲雀指標:停止鉤子違規率(從 0 → 每天 10 次)是一個可機器讀取的信號,可以在整個用戶群體中監控,作為質量回退的領先指標。


      網友吐槽:從“封神”到“勸退”,落差太大

      不光 AMD 這位高管,全網的程序員們看到這份反饋后,像是找到了組織,評論區里一片哀嚎。

      有人表示,這段時間一直懷疑是自己技術下滑了,寫代碼總被 Claude Code 帶偏,直到看到這份反饋才知道,原來大家都有一樣的困擾。

      作為 Claude 曾經的忠實用戶,程序員 bbecausereasonss 在 Reddit 上發帖稱:“我已經無法再心安理得地向客戶推薦 Claude Code 了。”

      他表示:“我是 MAX 用戶。剛開始使用 Claude Code 時,我真的被震撼到了。自 2022 年以來我一直在用 AI 做開發,這一次確實讓我感覺像是一個重要的歷史時刻。我曾經把 Claude Code 推薦進客戶的項目和開發流程中,在社交媒體上大力稱贊它,也在私下里不斷安利給身邊的人?!?/p>

      但他話鋒一轉,吐槽當前版本的模型狀態:“懶惰、無知、能力退化且視野狹隘,在還沒有真正理解整體問題和各種邊界情況之前,就盲目開始‘修復’——而且大多數補丁反而把事情搞得更糟。我已經無法再負責任地繼續推薦它了,因為這只會讓我看起來像個傻子,或者在胡說八道,甚至兩者兼具?!?/p>

      他還直言:“Claude Opus 在過去幾周簡直是一場災難——甚至還沒提到使用額度的問題。一個很貼切的比喻是,它像是被‘做了腦葉切除手術’,智商從 135–150 直接掉到 90–100,感覺退化成了 Sonnet 3.5。真的很失望?!?/p>


      還有人追問 Stella Laurenzo 究竟在用什么模型替代 Claude Code:

      “Claude 已經退化到無法被信任去完成復雜工程任務的地步。”

      差不多,但我覺得更準確的說法是:Claude 已經退化到連任何工程任務都不值得信任的程度了。

      它從來沒有一次就把事情做對過,寫出來的代碼充滿 bug 和重復邏輯,而且必須全程盯著,否則它一定會把東西搞壞。

      它已經變成了另一個 AI“玩具”。挺可惜的。

      能否分享一下你在用的“其他工具”?我也想試試。

      不過,Stella Laurenzo 并沒有指出自己用的是哪款模型替代。而是補充說道:「在 6 個月前,Claude 在推理質量和執行能力上幾乎是獨一檔的。但現在,其他競品也需要被非常認真地重新評估。就能力層級而言,Anthropic早已不再是唯一一個處在 Claude Opus 曾經所在水平的玩家。

      現在網友們的呼聲其實很一致:對于 AI 編程助手,可以接受它慢一點,但絕對不能接受它變蠢、變懶,更不能接受它敷衍了事。畢竟大家用 AI 編程助手,不是想要一個“快但錯”的打字機,而是想要一個能一起思考、能扛事的隊友,要是連最基本的思考都沒了,那這個工具,也就失去了它存在的意義。

      對此,你在使用 Claude Code 有什么樣的感受?

      參考:

      https://github.com/anthropics/claude-code/issues/42796

      https://github.com/stellaraccident

      https://www.theregister.com/2026/04/06/anthropic_claude_code_dumber_lazier_amd_ai_director/

      閱讀最新前沿科技趨勢報告,請訪問21世紀關鍵技術研究院的“未來知識庫”


      未來知識庫是 “21世紀關鍵技術研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

      截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告

      (加入未來知識庫,全部資料免費閱讀和下載)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      福建楊梅泡藥水事件持續發酵,浙江商販改口本地楊梅

      福建楊梅泡藥水事件持續發酵,浙江商販改口本地楊梅

      奇思妙想生活家
      2026-05-18 16:27:51
      現場直擊廣西柳州5.2級地震,柳州、桂林、貴港、南寧等多地均有震感,有人員被困,部分房屋有開裂現象,中國地震局啟動三級應急服務響應

      現場直擊廣西柳州5.2級地震,柳州、桂林、貴港、南寧等多地均有震感,有人員被困,部分房屋有開裂現象,中國地震局啟動三級應急服務響應

      極目新聞
      2026-05-18 08:36:26
      馬爾代夫史上最嚴重單次潛水事故:5名意大利遇難者遺體已全部打撈上岸

      馬爾代夫史上最嚴重單次潛水事故:5名意大利遇難者遺體已全部打撈上岸

      紅星新聞
      2026-05-18 21:05:38
      5個已被證實卻讓人難以接受的科學真理,顛覆你對世界的認知

      5個已被證實卻讓人難以接受的科學真理,顛覆你對世界的認知

      心中的麥田
      2026-05-18 19:34:44
      英國穆斯林年輕人,開始拒絕種姓婚姻

      英國穆斯林年輕人,開始拒絕種姓婚姻

      半勺甜心事
      2026-05-19 00:36:58
      金價全線跳水!國內金價跌破千元關口

      金價全線跳水!國內金價跌破千元關口

      現代快報
      2026-05-18 19:13:02
      菲律賓參議院正式開庭審理副總統莎拉彈劾案

      菲律賓參議院正式開庭審理副總統莎拉彈劾案

      獨舞獨舞
      2026-05-19 01:09:11
      匿名調查:字母哥下賽季去哪?69人預測留守,35人看好熱火

      匿名調查:字母哥下賽季去哪?69人預測留守,35人看好熱火

      墜入溫柔晚風
      2026-05-19 01:30:12
      馬斯克、黃仁勛空軍一號上合影曝光,馬斯克評論

      馬斯克、黃仁勛空軍一號上合影曝光,馬斯克評論

      霹靂炮
      2026-05-16 22:40:30
      這場頂級晚宴,真正的主角不是馬斯克、黃仁勛,而是一方中式桌面

      這場頂級晚宴,真正的主角不是馬斯克、黃仁勛,而是一方中式桌面

      魔都姐姐雜談
      2026-05-15 00:53:47
      國產電動SUV續航708公里,低價高配智駕超贊

      國產電動SUV續航708公里,低價高配智駕超贊

      智慧生活筆記
      2026-05-19 00:34:25
      黑龍江雙匯北大荒合資公司生產的豬肉抗生素嚴重超標近38倍

      黑龍江雙匯北大荒合資公司生產的豬肉抗生素嚴重超標近38倍

      每日質量報道網
      2026-05-18 21:24:26
      偽裝者續寫:阿誠死前才敢告訴明樓:巴黎那夜汪曼春懷了你的孩子

      偽裝者續寫:阿誠死前才敢告訴明樓:巴黎那夜汪曼春懷了你的孩子

      呆子的故事
      2026-01-23 14:59:54
      皇馬主場1-0力克塞維利亞,繼續緊追榜首。

      皇馬主場1-0力克塞維利亞,繼續緊追榜首。

      奔跑的象牙塔
      2026-05-19 01:02:34
      下月起!東莞東部"慢"速,將變快!

      下月起!東莞東部"慢"速,將變快!

      東莞潮事兒
      2026-05-17 16:27:06
      38個站點出現特大暴雨,湖北荊州市啟動防汛三級應急響應

      38個站點出現特大暴雨,湖北荊州市啟動防汛三級應急響應

      界面新聞
      2026-05-18 10:44:21
      打破魔咒!哈登生涯至今首次客場搶七取勝

      打破魔咒!哈登生涯至今首次客場搶七取勝

      北青網-北京青年報
      2026-05-18 21:12:44
      5.5噸茂名荔枝,深圳全城隨機派送!

      5.5噸茂名荔枝,深圳全城隨機派送!

      小影的娛樂
      2026-05-19 01:01:40
      別再只知道蘇錫寧了,江蘇這些悶聲發大財的城市,才是真有錢

      別再只知道蘇錫寧了,江蘇這些悶聲發大財的城市,才是真有錢

      奇思妙想生活家
      2026-05-18 10:38:48
      何超欣12歲那年,何鴻燊送她一棟倫敦豪宅,附帶一句叮囑:房子是讓你知道什么是資產,不是讓你住進去當公主。

      何超欣12歲那年,何鴻燊送她一棟倫敦豪宅,附帶一句叮囑:房子是讓你知道什么是資產,不是讓你住進去當公主。

      LULU生活家
      2026-05-17 14:44:10
      2026-05-19 02:03:00
      人工智能學家 incentive-icons
      人工智能學家
      人工智能領域權威媒體
      4744文章數 37464關注度
      往期回顧 全部

      科技要聞

      同一公司,有人獎金是6年工資,我卻只有半年

      頭條要聞

      賴清德要求美國繼續向臺出售武器 外交部表態

      頭條要聞

      賴清德要求美國繼續向臺出售武器 外交部表態

      體育要聞

      58順位的保羅,最強第三中鋒

      娛樂要聞

      票房會破14億!口碑第一電影出現了

      財經要聞

      中國芯片,怎么突然不便宜了?

      汽車要聞

      40.98萬起!充電5分鐘純電續航420km 騰勢N9閃充版勝算有多少?

      態度原創

      親子
      本地
      房產
      家居
      公開課

      親子要聞

      #戲水玩具

      本地新聞

      用蘇繡的方式,打開江西婺源

      房產要聞

      突發!海口重磅調規!碧桂園要解套;新埠島要起飛了!

      家居要聞

      觀山隱秀 心靈沉淀

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲精品麻豆一二三区| 江永县| 日韩无码乱了www亚洲无码视频| 66亚洲一卡2卡新区成片发布| 久久www免费人成看片中文| 无码AV在线播放| 国产亚洲视频在线播放香蕉| 亚洲一起cao| 亚洲国产精品热久久2022| 中文字幕久久人妻| 四虎影视一区二区精品| 三级4级全黄60分钟| 国产精品免费无遮挡无码永久视频| 热久在线免费观看视频| 97在线观看视频免费| 99国产精品白浆无码流出| 美女胸18大禁视频网站| 国产精品一区二区三区av| 中文字幕理伦午夜福利片| 亚洲AV无码一二区三区在线播放| 人妻无码久久精品| 欧洲AV秘 无码一区二区三| 制服 丝袜 亚洲 中文 综合| 国产午夜亚洲精品不卡网站| 国产精品普通话国语对白露脸| 亚洲中文字幕AV| 国产成人精品一区二区秒拍1o| 久久久久久精品天堂无码中文字幕| 国产精品中文免费福利| 亚洲色成人网站www永久男男| 国产色悠悠综合在线观看| 亚洲香蕉网久久综合影视| 中文无码制服丝袜人妻AV| 亚洲欧洲成人精品久久一码二码| 中国国产一级毛片视频| 手机永久AV在线播放| 国产精品人妻一区二区高 | 午夜精品久久久久久久爽| 中文字幕人妻有码在线| 天天干天天色综合网| 国产福利在线观看免费第一福利|