<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Anthropic估值萬億,但Claude 4.8沒那么驚艷

      0
      分享至

      文 | AIX財經(jīng),作者 | 王璐,編輯 | 魏佳

      Claude再次成為焦點。

      5月29日凌晨,AI行業(yè)又上演了一場“深夜突襲”。美國大模型公司Anthropic正式發(fā)布Claude最新旗艦模型Opus 4.8,并同步宣布完成H輪650億美元融資,投后估值高達9650億美元。在不到三個月的時間里,Anthropic的估值增長約154%,正式超過競爭對手OpenAI。

      本次模型更新,覆蓋編碼、智能體任務、推理與知識工作等核心能力,其中重點提升了模型的“誠實度”,并新增了支持大規(guī)模復雜任務并行處理的“動態(tài)工作流”功能。

      然而,若僅從功能列表來看,很容易高估此次發(fā)布的意義。實際上,Opus 4.8并沒有帶來架構(gòu)層面的顛覆性突破,從業(yè)者一致認為其屬于“漸進式進步”。

      但本次發(fā)布也傳遞出一個明確信號:大模型的競爭重心,正從技術突破,轉(zhuǎn)向誰更可靠、更好用、性價比更高。

      這種轉(zhuǎn)向,也體現(xiàn)在Claude的迭代節(jié)奏上,Opus 4.8距離上一版本Opus 4.7的發(fā)布僅43天。快速的更新速度,既是大模型競爭白熱化的縮影,也反映了Anthropic當前的處境。它必須以更快的節(jié)奏,同時向開發(fā)者、企業(yè)客戶與資本市場證明,Claude值得信賴。

      01.進步有限,“誠實”是最大亮點

      先看官方發(fā)布的Opus 4.8成績單。

      在編程、多學科推理、金融分析等主流基準測試中,Opus 4.8的得分全面超越前代Opus 4.7,也壓過了競爭對手GPT-5.5。但有一個細節(jié)值得關注:在最貼近開發(fā)者真實工作流的“終端編碼”測試(Terminal-Bench 2.1)中,Opus 4.8以74.6%拿下本次所有單項測試中最大的提升幅度,但仍落后于GPT-5.5的78.2%。


      不過,這個差距在實際使用中的影響,可能比數(shù)字看起來要小。

      資深開發(fā)者張鈺樞告訴「AIX財經(jīng)」,模型在“終端編碼”上的表現(xiàn),與開發(fā)者具體采用的工作流密切相關,如果日常高度依賴命令行逐條調(diào)試,GPT-5.5的領先或許更順手;但如果核心工作是在IDE中閱讀代碼、理解架構(gòu)、重構(gòu)或修復復雜缺陷,Claude在SWE-Bench Pro上的優(yōu)勢則更具參考價值。

      在他看來,對大多數(shù)應用層開發(fā)者而言,終端操作上的差距,更多反映的是廠商在各自工具鏈和優(yōu)化策略上的不同側(cè)重,而非模型底層編碼能力的根本性短板。因此,其在實際開發(fā)工作中的影響并不顯著,是可以接受的。

      相比編碼能力的細微得失,這次更新中更值得關注的,是Anthropic重點打磨的“誠實度”。官方數(shù)據(jù)顯示,Opus 4.8編寫的代碼中缺陷被漏報的概率,只有Opus 4.7的約四分之一,在“欺騙用戶”或“協(xié)助干壞事”等行為上的發(fā)生率也顯著下降。

      但這個數(shù)字并非沒有爭議。資深AI從業(yè)者方思明告訴「AIX財經(jīng)」,他并沒有感受到模型變得特別誠實,“這種進步可能更多體現(xiàn)在溝通話術或表達方式的微妙調(diào)整上。”

      Anthropic官方也表示,其在訓練過程中觀察到一個潛在矛盾,即模型在推理時,越來越傾向于“揣測評分者意圖”。也就是說,它可能正在形成“自己正在被測試”的感知,從而給出它認為能拿高分的答案,而非真正最優(yōu)或最真實的解答,這對它所追求的“誠實”原則,構(gòu)成了一定挑戰(zhàn)。

      綜合來看,Opus 4.8更像是一次扎實但幅度有限的小版本迭代,實際體驗上的提升感知并不顯著。

      方思明的評價頗具代表性,他認為“Opus4.8相比Opus4.6和GPT-5.5都算不上越級式的提升,更多是針對上一版本Opus4.7的修復與優(yōu)化。”鑒于此前4.7版本的表現(xiàn),對Anthropic而言,當下最迫切的任務是重建用戶對AI可靠性的信任,然而,僅憑目前公布的數(shù)據(jù)與表現(xiàn),仍難以說服整個市場相信Claude已是“最值得托付的那一個”。

      02.“動態(tài)工作流”成新王牌,但成本是個問題

      不止一位從業(yè)者表示,這次發(fā)布最值得關注的不僅只有Opus 4.8的各項評分,還有同步推出的Dynamic Workflows(動態(tài)工作流)。值得一提的是,Anthropic實驗室中能力更強的Claude Mythos Preview并未隨此次發(fā)布對外開放,也就是說,Opus 4.8是當前最強的“通用可用版本”,但不是Anthropic手里最強的牌。

      動態(tài)工作流可以簡單理解為,Claude現(xiàn)在能扮演“項目總監(jiān)”的角色,把一個大型復雜任務自動拆解成數(shù)百個子任務,分派給多個“子智能體”并行處理,中間結(jié)果經(jīng)過交叉驗證后,再整合輸出給用戶。

      Anthropic為此展示了一個官方案例:開發(fā)者Jarred Sumner借助動態(tài)工作流,將Bun的底層語言從Zig遷移到Rust,生成了約75萬行Rust代碼,通過了現(xiàn)有測試套件的99.8%,從第一次commit到最終merge,歷時11天。

      這相當于在不到兩周內(nèi),Claude便完成了一個通常需要高級工程師團隊耗時數(shù)月的大型底層重構(gòu)項目。

      一位從業(yè)者認為,Dynamic Workflows的出現(xiàn)標志著Claude的主張,從按次收費的“對話/生成”服務,轉(zhuǎn)向了按流程和結(jié)果收費的“復雜任務交付”服務,企業(yè)購買的,是完成一個具體、復雜工作流程的確定性。

      不過,這張“王牌”在業(yè)內(nèi)也引發(fā)了不少質(zhì)疑。

      在技術層面,有觀點認為其創(chuàng)新性有限。

      張鈺樞指出,動態(tài)工作流在架構(gòu)上并非顛覆性設計,其演示案例所驗證的更多是“技術可行性”,距離在真實生產(chǎn)環(huán)境中穩(wěn)定運行仍有顯著的工程化距離,其中涉及性能、資源與邊緣情況等一系列復雜挑戰(zhàn)。

      更為現(xiàn)實的制約來自經(jīng)濟層面。

      方思明指出,該模式比常規(guī)對話消耗更多Token,成本問題尤為突出。“由于需要同時調(diào)度十幾個智能體協(xié)同工作,其成本會陡然上升。即使一個工作流設計得再精巧,如果最終效果沒有顯著提升,而成本卻翻了幾倍,對企業(yè)來說仍然是不劃算的。”

      他補充道,現(xiàn)實中并非所有企業(yè)都擁有高預算。“微軟就曾表示,在某些場景中,使用AI的成本已高于人力成本。如今,一個成本可能數(shù)倍于普通AI的解決方案,其帶來的價值能否帶來相應倍數(shù)的回報,這需要市場和時間的驗證。”在他看來,這個功能的推出本身也帶有一定的實驗與探索性質(zhì)。

      為了降低使用門檻,Anthropic在成本端也做了調(diào)整。

      一方面,新增effort control(投入控制)機制,用戶可根據(jù)任務復雜程度和需求,手動調(diào)節(jié)Claude在任務上的“思考投入”強度。比如在“High模式”下,Claude會進行更深度的推理,以追求更優(yōu)結(jié)果;而在“輕量模式”下,則可實現(xiàn)更快的響應速度和更低的token消耗。

      另一方面,在定價策略上,Opus 4.8的常規(guī)模式維持了與上一版本相同的價格,仍為每百萬token 5美元(輸入)/ 25美元(輸出)。但快速模式的價格大幅下調(diào),從4.7時代的30美元(輸入)/ 150美元(輸出),降至10美元(輸入)/ 50美元(輸出)。在保持速度相當?shù)那疤嵯拢瑑r格降至原先的約三分之一,性價比提升顯著。

      雖然降價能在一定程度上緩解成本壓力,但動態(tài)工作流本身的ROI問題,仍是企業(yè)真正下場之前繞不開的那道坎。

      03.按月迭代背后,是技術與商業(yè)的雙重壓力

      Claude Opus 4.8的發(fā)布時間,距上一版本Opus 4.7僅相隔43天。如此密集的迭代節(jié)奏,正是技術與商業(yè)壓力疊加的直接體現(xiàn)。

      技術層面,這次快速迭代被部分從業(yè)者認為是一次不得不做的修復。

      Opus 4.7因自適應推理體驗不佳飽受詬病,該功能在部分場景下無法合理分配推理資源,導致模型面對復雜問題時過早省力,答案草率,推理鏈條殘缺。方思明直言,“Opus4.8主要目的還是在修復Opus4.7遺留的問題,Opus4.7在開發(fā)者圈里絕對不是一個口碑特別好的模型。”

      與此同時,外部壓力也不允許Anthropic慢下來。

      競爭對手OpenAI最新發(fā)布的GPT-5.5在多項基準測試中持續(xù)領先,Google Gemini憑借深度融入谷歌生態(tài)的分發(fā)優(yōu)勢構(gòu)成另一維度的競爭。方思明觀察到,這次發(fā)布某種程度上也是Anthropic與OpenAI在“輿論聲量上的直接對沖”。

      這背后有一個更深層的行業(yè)現(xiàn)實。不止一位從業(yè)者表示,當下大模型在架構(gòu)層面已難以制造顛覆性差距,競爭焦點正在轉(zhuǎn)向工程化實現(xiàn)和工作流塑造。

      也就是說,誰先把AI做進企業(yè)的日常生產(chǎn)流程,誰就占據(jù)了下一階段的核心位置。“動態(tài)工作流”的推出,正是Anthropic試圖在這一新維度上搶先布局,押注復雜任務的自動化交付能力,不再只靠單項測試分數(shù)的微弱領先。

      而最直接的壓力,來自資本市場。

      發(fā)布新模型同日,Anthropic宣布完成650億美元H輪融資,估值提升至9650億美元,其在2026年2月完成G輪融資時估值僅為3800億美元,三個月內(nèi)增長幅度約為154%,離萬億美元只差一步之遙,這個數(shù)字放在任何行業(yè)都稱得上驚人。

      支撐這個估值的,是Anthropic的收入增速。有報道稱,該公司預計二季度營收將達109億美元,并有望首次實現(xiàn)季度盈利。

      巨額融資帶來的彈藥固然充足,但與之對應的是資本市場同樣巨大的期待,投資者需要看到與估值相匹配的實質(zhì)性進展。

      Opus 4.8承擔著這個“證明自己”的任務。它在基準測試上的表現(xiàn)、動態(tài)工作流所描繪的自動化想象,以及全線對準企業(yè)級市場的產(chǎn)品升級方向,共同構(gòu)成了支撐這近萬億估值的底座,但動態(tài)工作流的投資回報率仍難以量化,“更誠實”的模型承諾能否真正贏得企業(yè)客戶的長期信任,還有待市場的最終檢驗。

      所以,Opus 4.8更像是一次信心釋放,用43天一個版本的節(jié)奏告訴市場,它還在加速。但能不能跑穩(wěn),才是這家公司接下來真正要做的事。

      *應受訪者要求,文中方思明為化名。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      訓練犯錯真罵!邦本揭秘徐正源 三鎮(zhèn)沒請后悔嗎?李金羽好好學吧

      訓練犯錯真罵!邦本揭秘徐正源 三鎮(zhèn)沒請后悔嗎?李金羽好好學吧

      刀鋒體育
      2026-05-30 08:48:50
      中方通告全球,對菲律賓發(fā)布66號公告:馬科斯明白,中國動真格了

      中方通告全球,對菲律賓發(fā)布66號公告:馬科斯明白,中國動真格了

      手里有讀
      2026-05-30 09:00:35
      霍啟剛拜訪國家高端智庫專家張維為,探討人才培養(yǎng)等問題

      霍啟剛拜訪國家高端智庫專家張維為,探討人才培養(yǎng)等問題

      深度報
      2026-05-30 00:39:32
      亞麻,就要皺皺的穿!

      亞麻,就要皺皺的穿!

      Yuki女人故事
      2026-05-29 21:50:37
      視頻丨越界挑釁的“德魯伊特”號是什么來頭?軍事專家解讀

      視頻丨越界挑釁的“德魯伊特”號是什么來頭?軍事專家解讀

      環(huán)球網(wǎng)資訊
      2026-05-29 11:47:33
      新加坡香會取消中國專場!李顯龍懵:中方不陪我們玩了

      新加坡香會取消中國專場!李顯龍懵:中方不陪我們玩了

      怪味歷史連連看
      2026-05-30 01:43:28
      硬漢演員片場“玩火自焚”?遲到大王惹怒奧斯卡影后慘遭開除

      硬漢演員片場“玩火自焚”?遲到大王惹怒奧斯卡影后慘遭開除

      影視情報室
      2026-05-29 01:30:06
      網(wǎng)友哭訴:比找不到工作更崩潰的是徹底不知道該干什么了?

      網(wǎng)友哭訴:比找不到工作更崩潰的是徹底不知道該干什么了?

      燈錦年
      2026-05-28 16:36:03
      再被曝光“圈路收費”的瀘沽湖景區(qū):已開通過境車輛專用通道

      再被曝光“圈路收費”的瀘沽湖景區(qū):已開通過境車輛專用通道

      南方都市報
      2026-05-29 17:10:06
      巴拿馬總統(tǒng)攤牌:沒收中國港口不是美國逼的,準備求中國續(xù)簽協(xié)議

      巴拿馬總統(tǒng)攤牌:沒收中國港口不是美國逼的,準備求中國續(xù)簽協(xié)議

      凝水文秋
      2026-05-30 10:26:26
      臺兒莊戰(zhàn)役傷亡爭議八十年,日方檔案還原真實戰(zhàn)況

      臺兒莊戰(zhàn)役傷亡爭議八十年,日方檔案還原真實戰(zhàn)況

      磊子講史
      2026-05-26 14:22:17
      白人女性與黑人女性的體味差異,網(wǎng)友真實分享引發(fā)熱議

      白人女性與黑人女性的體味差異,網(wǎng)友真實分享引發(fā)熱議

      特約前排觀眾
      2025-12-22 00:20:06
      一部作品毀掉演藝生涯的12位演員

      一部作品毀掉演藝生涯的12位演員

      膠片猴
      2026-05-29 13:07:13
      給阿嬤的情書最大受益者絕對是藍鴻春導演,如今潮汕地區(qū)無人不知

      給阿嬤的情書最大受益者絕對是藍鴻春導演,如今潮汕地區(qū)無人不知

      小邵說劇
      2026-05-30 09:57:42
      難怪西方集體對中國黑臉:全球蛋糕分完,發(fā)現(xiàn)桌上只有7億人的碗

      難怪西方集體對中國黑臉:全球蛋糕分完,發(fā)現(xiàn)桌上只有7億人的碗

      熱點一網(wǎng)打盡
      2026-05-18 11:25:54
      埃及公布世界杯26人名單:33歲薩拉赫第2次參賽 巴薩18歲天才入選

      埃及公布世界杯26人名單:33歲薩拉赫第2次參賽 巴薩18歲天才入選

      我愛英超
      2026-05-30 07:30:51
      俄羅斯亡,中國寒?非也!比西方圍堵更可怕的,是我們的妄自菲薄

      俄羅斯亡,中國寒?非也!比西方圍堵更可怕的,是我們的妄自菲薄

      領悟看世界
      2026-04-18 00:26:25
      著名歌唱家劉維維病逝!追夢路上有坎坷,將悲痛留給了妻子和兒子

      著名歌唱家劉維維病逝!追夢路上有坎坷,將悲痛留給了妻子和兒子

      小蔑談事
      2026-05-30 09:31:08
      0-2上海!廣廈隊能奪冠嗎?王仕鵬給出了自己的答案

      0-2上海!廣廈隊能奪冠嗎?王仕鵬給出了自己的答案

      體育哲人
      2026-05-29 17:07:11
      貴陽女子健身房被多人圍毆,警方介入,原因曝光,被打一點也不冤

      貴陽女子健身房被多人圍毆,警方介入,原因曝光,被打一點也不冤

      楓塵余往逝
      2026-05-29 22:21:35
      2026-05-30 12:40:49
      鈦媒體APP incentive-icons
      鈦媒體APP
      獨立財經(jīng)科技媒體
      134330文章數(shù) 862203關注度
      往期回顧 全部

      科技要聞

      車圈大佬發(fā)聲:價格戰(zhàn)遠去,但競爭仍殘酷

      頭條要聞

      車內(nèi)放3千萬財物的賓利遭竊 車主:金條是最不值錢的

      頭條要聞

      車內(nèi)放3千萬財物的賓利遭竊 車主:金條是最不值錢的

      體育要聞

      即使是文班亞馬,也做不到這件事

      娛樂要聞

      向太曝黃曉明曾當眾給她下跪

      財經(jīng)要聞

      雙匯管不住一頭豬

      汽車要聞

      900V+3.2秒破百 領克10+&領克10上市16.99萬元起

      態(tài)度原創(chuàng)

      家居
      健康
      親子
      教育
      旅游

      家居要聞

      云棲 舒展如流云

      嘗試干細胞療法如何避免踩坑?

      親子要聞

      孩子食欲不振怎么辦,開點香辣雞腿堡就好了

      教育要聞

      不追光環(huán),平凡本身就是意義

      旅游要聞

      康養(yǎng)療愈成度假剛需,這場展會說透行業(yè)變局

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 五月花av| 中文字幕精品av乱码在线| 国产99久久无码精品| 波多野结衣在线精品视频| 欧美A级视频| 免费成人精品永久视频| 中文字幕乱码一区二区免费| 日韩欧激情一区二区三区| 国产精品久久久国产盗摄| 亚洲AV秘 无套一区二区三区| 亚洲狠狠婷婷综合久久久| 亚洲av成人在线一区| 波多野结衣久久一区二区| 国产精品自产拍在线观看| 97中文字幕在线观看| 国产中文三级全黄| 大陆熟女热妇Av旧56| 久久久久99精品成人片牛牛影视| 国产精品亚洲а∨无码播放| 丰满无码人妻热妇无码区| 国产AV影片麻豆精品传媒| 亚洲熟妇夜夜一区二区三区| 尤物视频色版在线观看| 国产av一区二区不卡| 国产欧美成人一区二区a片| 国产欧美精品区一区二区三区 | 久久亚洲精品无码va白人极品| 亚洲欧美人成人让影院| 日韩精品人成在线播放| 亚洲婷婷综合中文字幕第一页 | 熟女毛多熟妇人妻在线视频| 亚洲精品爆乳一区二区H| 天天操天天干视频| 亚洲日韩精品一区二区三区无码 | 天天做天天爱夜夜夜爽毛片| 影音先锋手机丝袜在线看| 久久久久性色AV毛片特级| 欧美青青草| 九九热在线视频免费观看| 黄色wwww| 亚洲精品第一|