網易首頁 > 網易號 > 正文申請入駐

DeepSeek-V4實測：超高效上下文，更像是token價格戰的序章

2026-04-24 22:14:20　來源: 刺猬公社

北京舉報

分享至

準備好做Agent基模，價格戰可能下半年到來。

文｜陳梅希

編｜園長

沒有開聲勢浩大的全球發布會，沒有安排老板錄制一檔視頻博客，DeepSeek-V4預覽版就這么默默更新了，一如它過去所做的那樣。時間選在了周五上午，作為自媒體從業者也萬分感謝，沒有讓我們在周末的北影節觀影現場突然離場去研究一個大模型的全新版本。

公告里說的和沒說的

更新通知發布在DeepSeek的官方公眾號，全文只有1087個字。同步公開的，DeepSeek-V4 模型的開源鏈接和技術報告。縱覽這些公開信息，有以下幾件事值得關注：

1.官網、App、API調用全部上線新模型，分為DeepSeek-v4-pro和DeepSeek-v4-flash兩種，可自行切換調用。兩種模型均為開源模型。

性能上，開源的DeepSeek-V4-Pro能比肩頂級閉源模型。Agent能力大幅提高，其中Coding能力在其公司內部的評測體驗中“優于 Sonnet 4.5，交付質量接近 Opus 4.6 非思考模式，但仍與 Opus 4.6 思考模式存在一定差距”；文檔和PPT生成能力均大幅提升。（第二部分我們將對其代碼能力和PPT生成能力進行橫向測評。）

DeepSeek內部已將員工使用的Agentic Coding 模型切換為DeepSeek-V4，證明其在實際研發場景中已具備生產力價值。

2.技術革新方面，這個版本在上下文問題上最值得關注的是超高的上下文效率，而非上下文規模。

DeepSeek-V4通過全新的混合注意力機制，在實現超長上下文能力的同時，降低了對計算和顯存的需求，根據官方文檔：“從現在開始，1M（一百萬）上下文將是 DeepSeek 所有官方服務的標配。”

閱讀其技術文檔可以發現，全新的注意力機制結合了CSA (Compressed Sparse Attention，壓縮稀疏注意力)和HCA (Heavily Compressed Attention，重度壓縮注意力)，其中CSA搭配DeepSeek自研的稀疏注意力算法，而HCA對鍵值緩存采用更高的壓縮倍率，但保留了Transformer架構里的稠密注意力算法。粗淺理解一下，就是壓縮得少的跳著看，已經被猛猛壓縮過的那就每個都看。

To enhance long-context efficiency, we design a hybrid attention mechanism combining Compressed Sparse Attention (CSA) and Heavily Compressed Attention (HCA). CSA compresses the KV caches along the sequence dimension and then performs DeepSeek Sparse Attention (DSA) (DeepSeek-AI, 2025), whereas HCA applies more aggressive compression to the KV caches but keeps dense attention.

這種混合注意力機制的核心理念，是在超長上下文中，并不是所有鍵值都需要全注意力和稠密計算。其實帶入人類自己的閱讀體驗也是如此，我們看論文時總是聚精會神地先看摘要、導語和結論，而在文獻綜述環節意識模糊。本科選修網絡文學課，老師在第一節課就告訴我們這學期要至少讀完兩千萬字的網文，并介紹了一種“掃文”方式：對角線閱讀法，每頁書只看左上角、正中間、右下角，現在想想，這何嘗不是一種稀疏注意力算法。

注意力的壓縮，是為了減少計算量，最終目標是提升超長上下文的效率。根據技術報告，“在一百萬tokens上下文中，V4-Pro的推理計算量僅需V3.2的27%，KV緩存占用僅為10%。”

In the one-million-token context setting, DeepSeek-V4-Pro requires only 27% of single-token inference FLOPs and 10% of KV cache compared with DeepSeek-V3.2.

3.按理說，token壓縮結合稀疏注意力機制提高計算效率后，廠商的計算成本和顯存成本（同等token規模下）都會大幅減少，最終會反映到token定價上。DeepSeek-V4在今天也公布了定價，每百萬tokens的定價如下：

這個價格，和海外頭部大模型相比，有很大的優勢。以DeepSeek-V4自稱交付質量接近的Opus 4.6 非思考模型為例，命中緩存的輸入單價為0.5美元/百萬token，未命中緩存的輸入單價為5美元/百萬token，輸出單價為25美元/百萬token。按4月24日當日匯率計算，DeepSeek-V4-pro的三項單價，分別是Opus 4.6的24%、35%和14%。

海外頭部大模型API調用計價（截至2026.4.24），刺猬公社手動統計，僅供參考；數據來源：各平臺官網

但和國內競品相比，DeepSeek-V4暫時還沒有對著價格大砍一刀的架勢。

國內模型中同樣有百萬上下文能力的是阿里在本月初發布的Qwen3.6-plus，對單次輸入的token數進行分層計價，當單次輸入小于256K時，Qwen3.6-plus的輸入和輸出單價均介于DeepSeek-V4-Flash和DeepSeek-V4-Pro之間。

國內頭部大模型API調用計價（截至2026.4.24），刺猬公社手動統計，僅供參考；數據來源：各平臺官網、公告

4.準備好做Agent基模，價格戰可能下半年到來

華為昇騰芯片在DeepSeek 官方公告中被提及，雖然只是以出現在圖片注釋中的低調形式。在更新公告的定價說明截圖下，有一行注釋小字：“受限于高端算力，目前Pro的服務吞吐十分有限，預計下半年昇騰950超節點批量上市后，Pro的價格會大幅下調。”

這條注釋，也許在宣告一種可能性：在DeepSeek-V4 使用大幅降低計算成本的新注意力機制后，V4-Pro沒有大幅降價，是因為高端算力稀缺，而不是成本不允許降價。換言之，一旦國產高端算力在下半年順利接棒，DeepSeek就有空間大幅下調token定價。

DeepSeek也做好了充足的、充當Agent 基模的準備，畢竟在更新公告里特意寫道自己“針對 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 產品進行了適配和優化”。除了三位耳熟能詳的Agent選手，CodeBuddy是騰訊云開發的代碼助手。

超高效上下文，更像是token價格戰的一頁序章。也有從業者提供了另一種視角：當DeepSeek已經公開宣布下半年會大幅下調V4-Pro價格后，DeepSeek的模型能力線和價格線，將成為閉源模型的“斬殺線”。

實測DeepSeek-V4-Pro

因為更新公告里重點提及了代碼能力、PPT生成能力，刺猬公社基于這兩個領域，對DeepSeek-V4預覽版進行了簡單的橫向測試，對照的是近期發布/更新的，分別以這兩項能力為賣點的產品。

1.代碼能力VS阿里秒悟

秒悟是阿里巴巴ATH事業群于將近10天前發布的AI開發平臺，讓0代碼能力的用戶能使用自然語言完成自己的產品開發。剛上線時，我讓秒悟做了一個《作家推薦器》，通過給用戶做8道選擇題判斷TA可能喜歡的作家，題庫一共30道，覆蓋100位作家。經過大概1個小時的調試后，這個測試小網頁上線了：

雖然不知道為什么秒悟在配色上唯愛清華紫，而且在出文本選擇題的時候像吃了50噸張嘉佳（然而它自己建構的作家庫里沒有張嘉佳），但作為和朋友自娛自樂的小玩具，可用度還是非常高的。我自己做了測試，竟然真的測出了我喜歡的作家。

DeepSeek-V4-Pro正式上線后，我用同樣的提示詞，測試它做網頁的能力。大概5分鐘后，測試網頁完成了。

第一次生成，點擊跳轉邏輯并未生效，DeepSeek選擇重寫數千行代碼，先提供了一個只包含10個作家的簡化版。等簡化版運行成功，它確認自己代碼結構沒有問題后，我讓它把作家庫恢復到100個，它依然選擇了把代碼全部重寫，而不是讓我替換若干個代碼模塊。

DeepSeek給出的解決方式，讓我恍惚覺得自己擁有無限的token火力，在對這個小小的網頁需求進行過飽和攻擊，而在此過程中，我其實完全沒有付費。

橫向測評之后，秒悟的優勢在于0操作門檻，最終的交付結果是一個用戶可以打開的網頁，用戶可以直接分享給朋友或是互聯網上的任何人。劣勢在于價格，做一個作家推薦器大概花掉了40000積分，按照積分的零售價格是40塊，如果不想花錢，按每天登錄贈送2000積分的速度，大概連續登錄20天可以做一個玩具網頁。最終我斥39元巨資訂購了每月100000積分的套餐。

DeepSeek-V4-Pro的最大優勢當然是免費，幾千行代碼說寫就寫；另一個優勢是快速，雖然沒有左拉一個助手，右拉一個設計師，建構若干項蜂群工程，但不到10分鐘就做完了。劣勢則是只能生成一份代碼，讓我打包成html格式再去瀏覽器打開，如果想直接分享到線上，還需要自己完成部署。另外，如果說使用qwen的秒悟像吃了五十噸張嘉佳老師，那么DeepSeek做出來的作家推薦器就像是吃了五十噸DeepSeek。

2.PPT生成能力VS MaxHermes

測試PPT生成能力時，我直接選擇了使用DeepSeek-V4的技術文檔，共59頁pdf，要求是生成一個給大學生做講座用的PPT。

MaxHermes很快完成了一個可以直接下載的PPT文件，結構和美化都做得不錯。劣勢是要花錢，為了使用MaxHermes，我需要花39元買一個基礎版會員，再花49元訂購一個token plan包月。

DeepSeek則生成了代碼，需要在本地用Python運行，沒有那些Agent方便，而且樣式有些過于樸素了。最大優點依然是完全免費，留了圖片的占位符，需要用戶自己做一些圖片替換工作。題外話，為什么不管寫網站還是做PPT，大模型們都不約而同地默認選擇了紫色系？

如果用Claude Code 、OpenClaw等Agent產品搭配DeepSeek 4.0的API，應該能獲得更便捷的體驗，但就要走DeepSeek的API計費邏輯了，無法像現在這樣完全免費。

更何況，現在是周五晚上9點半國產大模型的更新固然重要使我從早到晚坐在電腦前興奮地敲了一天字但是周五晚上跟朋友約好去五道營喝酒聽歌同樣重要我將在關注AI進展的同時保衛我的線下生活那正是我在開頭就感謝DeepSeek 在周五上午發布更新的原因。

媒介合作聯系微信號|ciweimeijiejun

如需和我們交流可后臺回復“進群”加社群

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.