「海外版DeepSeek」來了！Claude降價80%引發(fā)AI地震，緩解“盼V4”焦慮

2026-02-19 10:44:10　來源: 鯨選AI

北京舉報

分享至

春節(jié)這兩天等待DeepSeek新版本的焦慮氣氛中，硅谷突然扔下了一顆AI炸彈。

Anthropic 突然宣布 Claude Sonnet 4.6 發(fā)布，平價用戶也能用上旗艦級 AI 能力。更勁爆的是，這個模型在保持 Sonnet 系列價格不變的情況下（輸入百萬，輸出 15/百萬 token），性能已經(jīng)逼近此前售價高昂的 Opus 4.6——如果以“性能/價格比”計算，相當(dāng)于性價比暴漲 80%。

這個打法，讓人立刻想起一年前 DeepSeek R1 的“降價風(fēng)暴”：同樣的“性能不降、價格腰斬”，同樣的“免費用戶也能用旗艦款”。只不過這一次，發(fā)起降價的不是中國創(chuàng)業(yè)公司，而是硅谷明星獨角獸 Anthropic。

X 上的 AI 開發(fā)者 Poonam Soni ( @CodeByPoonam) 第一時間發(fā)推：“Breaking: Anthropic 剛剛發(fā)布 Claude Sonnet 4.6，配備 100 萬 token 上下文窗口，在 OSWorld 電腦操控基準(zhǔn)測試中得分 72.5%, SWE-bench 代碼測試 79.6%, Opus 級性能貫穿編碼和推理全場景。”這條推文迅速引發(fā)關(guān)注。

人工智能分析指數(shù) v4.0）的模型能力排行榜

從上圖也可以看到，Claude Sonnet 4.6以51 分位列榜單第 2 名，僅次于同公司的 Claude Opus 4.6（max），在 10 項專業(yè)評測中展現(xiàn)了非常均衡的綜合能力。

一、Claude Sonnet 4.6 到底有多強？用數(shù)據(jù)說話 1. 代碼能力：79.6%，逼近 Opus 旗艦水平

在SWE-bench Verified這個“真實軟件工程問題解決率”的行業(yè)金標(biāo)準(zhǔn)測試中，Claude Sonnet 4.6 交出了驚人的成績單：

Sonnet 4.6: 79.6%
Opus 4.6（旗艦款）: 80.8%
GPT-5.2: 80.0%
Sonnet 4.5（上一代）: 77.2%

僅差 1.2 個百分點，但價格只有 Opus 的五分之一。這意味著對于絕大多數(shù)編程任務(wù)，Sonnet 4.6 已經(jīng)可以完全替代 Opus，而成本直接砍掉 80%。

對比 DeepSeek V3.2：雖然后者在成本上更有優(yōu)勢（完成同樣任務(wù)約 1.01 美元 vs Claude Sonnet 4.6 約 27 美元），但 Sonnet 在企業(yè)級穩(wěn)定性、API 文檔完善度、以及與 AWS Bedrock 等云平臺的深度集成上，仍然是生產(chǎn)環(huán)境的首選。

2. 電腦操控能力：72.5%,16 個月暴漲 387%

OSWorld-Verified基準(zhǔn)測試衡量 AI“像人類一樣操作電腦”的能力——點擊、輸入、導(dǎo)航應(yīng)用、完成多步驟任務(wù)。Claude 在這個領(lǐng)域的進(jìn)化速度堪稱恐怖：

2024 年 10 月Claude Sonnet 3.5: 14.9%
2026 年 2 月Claude Sonnet 4.6:72.5%
增幅： 387% (16 個月內(nèi)）

更關(guān)鍵的是，Sonnet 4.6 的 72.5% 得分僅比 Opus 4.6 的 72.7% 低 0.2 個百分點，而 GPT-5.2 在這個測試中只有 38.2%——Claude 幾乎是 GPT 的兩倍。

Pace 公司 CEO Jamie Cuffe 在給 VentureBeat 的聲明中透露：“Sonnet 4.6 在我們復(fù)雜的保險業(yè)電腦操控基準(zhǔn)測試中得分94%，是所有 Claude 模型中最高的。它能在失敗后進(jìn)行推理并自我糾正，這是我們之前從未見過的能力。”

3. 辦公生產(chǎn)力：1633 Elo，全場最佳

在GDPval-AA Elo 辦公任務(wù)評分中，Claude Sonnet 4.6 不僅超越了所有競爭對手，甚至反超了自家旗艦 Opus:

Sonnet 4.6: 1633 Elo
Opus 4.6: 1606 Elo
GPT-5.2: 1462 Elo
Gemini 3 Pro: 1548 Elo

在Finance Agent v1.1金融分析基準(zhǔn)測試中，Sonnet 4.6 同樣領(lǐng)跑：

Sonnet 4.6: 63.3%
Opus 4.6: 60.1%
GPT-5.2: 59.0%

這意味著在實際的企業(yè)辦公場景（財務(wù)分析、數(shù)據(jù)處理、文檔整理）中，中檔價格的 Sonnet 4.6 已經(jīng)是市場上最強的模型。

4. 長文本推理：100 萬 token 上下文，真正能用

Anthropic 為 Sonnet 4.6 配備了100 萬 token 上下文窗口（beta)，但更重要的是它在長文本中的推理能力。在Vending-Bench Arena評估中（測試 AI 能否長期運營一個模擬企業(yè)）, Sonnet 4.6 展現(xiàn)出了顯著的“長期規(guī)劃能力”提升。

Twitter 用戶 Felipe Corrêa 評論道：“兩周內(nèi) Anthropic 發(fā)布兩次重大更新。Claude Sonnet 4.6 在編碼、智能體、長文本推理上都達(dá)到了前沿水平。在電腦操控基準(zhǔn)測試中得分 94%。GPT、Gemini 與 Claude 的競爭從未如此激烈。”

5. 用戶偏好：70% 更愛 Sonnet 4.6，59% 認(rèn)為它超越舊版 Opus

Anthropic 內(nèi)部測試顯示：

70% 的用戶更喜歡 Sonnet 4.6 而非上一代 Sonnet 4.5
59% 的用戶認(rèn)為 Sonnet 4.6 比舊版旗艦 Opus 4.5 更好用

這是 Claude 歷史上第一次出現(xiàn)“中檔型號性能超越舊旗艦”的情況。

二、“海外版 DeepSeek”？更像是硅谷的降維打擊

把 Claude Sonnet 4.6 稱為“海外版 DeepSeek”，本質(zhì)上是在說：Anthropic 學(xué)會了 DeepSeek 的“性價比革命”打法。

DeepSeek 教會硅谷的三件事

2025 年 1 月，DeepSeek R1 以“600 萬美元訓(xùn)練成本”和“API 價格僅為 GPT-4o 十分之一”的姿態(tài)橫空出世，用“性能+開源+低價”的三重組合拳，直接打破了硅谷“高性能=高價格”的商業(yè)邏輯，高貴的 OpenAI o1 沒開的 Reasoning 時代，被 DeepSeek R1 開啟。

隨后的連鎖反應(yīng)迅速蔓延：字節(jié)、騰訊、百度、阿里將大模型 API 價格下調(diào) 50%-90%, OpenAI 推出更便宜的 GPT-4o Turbo, Google 加速 Gemini Flash 系列推廣。

一位 AI 行業(yè)分析師在 2026 年初的報告中直言：“DeepSeek 的出現(xiàn)，阻止了 AI 訂閱費用飆升至三位數(shù)美元的趨勢，將高端 AI 推理能力的價格底線永久性地拉低了。”

Claude 的反擊：不降價，但提升性價比 80%

Anthropic 的策略更聰明：API 價格不變（ 15），但性能直逼旗艦 Opus( 25)。

維度

Claude Sonnet 4.6

Claude Opus 4.6

性價比優(yōu)勢

API 價格

-40%

SWE-bench 代碼

79.6%

80.8%

僅差 1.2%

OSWorld 電腦操控

72.5%

72.7%

僅差 0.2%

辦公任務(wù) Elo

1633

1606

反超

金融分析

63.3%

60.1%

反超綜合性價比

+80%

更重要的是，Anthropic 將 Sonnet 4.6 設(shè)為claude.ai和 Claude Cowork 的默認(rèn)免費模型，全球數(shù)百萬免費用戶無需付費就能體驗到接近旗艦級的 AI 能力。

這一招，幾乎是對 DeepSeek“免費開放高性能模型”策略的完美復(fù)刻。

對比 DeepSeek：各有所長，但 Claude 更適合生產(chǎn)環(huán)境

維度

Claude Sonnet 4.6

DeepSeek V3.2

成本

（同樣編程任務(wù)）

~$27

~$1.01

性能穩(wěn)定性

企業(yè)級，久經(jīng)驗證

頻繁升級

API 文檔

完善，開發(fā)者友好

持續(xù)完善中

云平臺集成

AWS Bedrock 深度集成

第三方支持有限

企業(yè)支持

7×24 專業(yè)團隊

社區(qū)為主

開源

閉源

MIT 開源

結(jié)論：如果你是個人開發(fā)者或預(yù)算極度敏感的項目，DeepSeek 仍然是最佳選擇；但如果你需要在生產(chǎn)環(huán)境中部署 AI, Claude Sonnet 4.6 的穩(wěn)定性、企業(yè)支持和云平臺集成，是 DeepSeek 短期內(nèi)難以替代的。

Claude Cowork 引發(fā)的“SaaSpocalypse”：軟件行業(yè)的地震前兆

值得注意的是，就在 Claude Sonnet 4.6 發(fā)布前兩周，Anthropic 已經(jīng)引發(fā)了一場行業(yè)震蕩。1 月 30 日，Anthropic 為 Claude Cowork 發(fā)布了 11 個新插件，涵蓋法律、金融、銷售、營銷、數(shù)據(jù)分析等領(lǐng)域，讓 AI 能夠自主完成原本需要專業(yè)軟件的復(fù)雜任務(wù)。

市場反應(yīng)堪稱“血洗”：

單日蒸發(fā) 2850 億美元：Salesforce、Adobe、Workday、ServiceNow 等企業(yè)軟件巨頭股價暴跌 6%-8%。
印度 IT 股全線崩盤：Infosys 跌 7.89%、TCS 跌 6.29%、Wipro 跌 4.52%, Nifty IT 指數(shù)單日暴跌 6.84%。
Jefferies 交易員命名“SaaSpocalypse”：市場情緒從“AI 幫助這些公司”轉(zhuǎn)向“AI 取代這些公司”。

Claude Sonnet 4.6 會加劇這場危機嗎？答案是肯定的。Sonnet 4.6 的性能提升+價格下降，意味著原本只有大企業(yè)才能負(fù)擔(dān)的 AI 自動化能力，現(xiàn)在中小企業(yè)甚至個人開發(fā)者都能用上。當(dāng) AI 能以更低成本完成原本需要 Salesforce、DocuSign、Adobe 的工作時，傳統(tǒng) SaaS 的“訂閱費+功能鎖定”商業(yè)模式將面臨根本性挑戰(zhàn)。

正如《財富》雜志所言：“Opus 4.6 的多智能體協(xié)作功能，可能對 Salesforce、Microsoft、Workday 等 SaaS 巨頭構(gòu)成最大威脅——它們一直試圖讓客戶升級到自己的 AI 智能體平臺，但 Claude 已經(jīng)搶先一步。”

三、不用再等 DeepSeek V4 了？現(xiàn)在就是最好的窗口期

就在 Claude Sonnet 4.6 發(fā)布的同一周，中文 AI 社區(qū)卻陷入了“期盼 V4”的焦慮：

2 月 14 日： DeepSeek 官方宣布支持 100 萬 token 上下文，但用戶發(fā)現(xiàn)模型“變冷淡了”——回復(fù)變短、風(fēng)格變干，“DeepSeek 被指變冷淡了”沖上微博熱搜。
2 月 16 日：疑似 DeepSeek V4 基準(zhǔn)測試泄露，SWE-bench 得分 83.7%，超越 Claude Opus 4.5 和 GPT-5.2，傳言春節(jié)期間發(fā)布。
2 月 18 日： V4 仍未上線，官方無明確時間表

這種“等待”的焦慮，恰恰給了 Claude Sonnet 4.6 一個絕佳的市場窗口：

對于普通用戶：與其苦等 V4，不如現(xiàn)在就用上 Sonnet 4.6，穩(wěn)定性和易用性已驗證。
對于企業(yè)客戶： Claude 的企業(yè)級支持、數(shù)據(jù)安全保障、AWS Bedrock 集成，是開源模型短期內(nèi)難以替代的。
對于開發(fā)者： API 穩(wěn)定性和文檔完善度，遠(yuǎn)超“灰度測試+頻繁調(diào)整”的 DeepSeek。

一位 AI 產(chǎn)品經(jīng)理在社交媒體上直言：“DeepSeek 教會了硅谷如何做性價比，但 Claude 證明了閉源商業(yè)模型依然可以在‘性價比戰(zhàn)爭’中活下來——只要你愿意放下身段，真正把價格打下來。”

寫在最后：AI 降價戰(zhàn)的最大贏家是每一個普通用戶

這場由 DeepSeek 引發(fā)、Claude 接力的“AI 降價地震”，本質(zhì)上是在用“降維打擊”的方式，把 AI 能力從少數(shù)人的特權(quán)，變成所有人的基礎(chǔ)設(shè)施：

一年前，能用上 GPT-4 級別 AI 的只有付費用戶；現(xiàn)在，普通用戶就能用上接近 Opus 級別的 Claude。
一年前，中小企業(yè)的 AI 預(yù)算動輒數(shù)萬美元；現(xiàn)在，幾百美元就能跑通完整的 AI 工作流
一年前，“高性能=高價格”是行業(yè)共識；現(xiàn)在，性價比成為核心競爭力

AI 技術(shù)的迭代速度，已經(jīng)快到“等待”本身就是一種成本。DeepSeek V4 可能下周就來，也可能再等一個月；但 Claude Sonnet 4.6 現(xiàn)在就能用，而且有免費渠道。

現(xiàn)在就開始用 AI 解決實際問題——無論是寫代碼、做分析、還是自動化辦公。當(dāng)然母公司 Anthropic 的對華態(tài)度，使得國內(nèi)團隊使用 Claude 的場景，可能僅限出海項目，這是遠(yuǎn)不如擁抱開源精神的 DeepSeek 的地方。

總而言之，這場“AI 地震”已經(jīng)蔓延開來。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.