<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek-V4實測:超高效上下文,更像是token價格戰的序章

      0
      分享至


      準備好做Agent基模,價格戰可能下半年到來。

      文|陳梅希

      編|園長

      沒有開聲勢浩大的全球發布會,沒有安排老板錄制一檔視頻博客,DeepSeek-V4預覽版就這么默默更新了,一如它過去所做的那樣。時間選在了周五上午,作為自媒體從業者也萬分感謝,沒有讓我們在周末的北影節觀影現場突然離場去研究一個大模型的全新版本。



      公告里說的和沒說的

      更新通知發布在DeepSeek的官方公眾號,全文只有1087個字。同步公開的,DeepSeek-V4 模型的開源鏈接和技術報告。縱覽這些公開信息,有以下幾件事值得關注:

      1.官網、App、API調用全部上線新模型,分為DeepSeek-v4-pro和DeepSeek-v4-flash兩種,可自行切換調用。兩種模型均為開源模型。

      性能上,開源的DeepSeek-V4-Pro能比肩頂級閉源模型。Agent能力大幅提高,其中Coding能力在其公司內部的評測體驗中“優于 Sonnet 4.5,交付質量接近 Opus 4.6 非思考模式,但仍與 Opus 4.6 思考模式存在一定差距”;文檔和PPT生成能力均大幅提升。(第二部分我們將對其代碼能力和PPT生成能力進行橫向測評。)

      DeepSeek內部已將員工使用的Agentic Coding 模型切換為DeepSeek-V4,證明其在實際研發場景中已具備生產力價值。

      2.技術革新方面,這個版本在上下文問題上最值得關注的是超高的上下文效率,而非上下文規模。

      DeepSeek-V4通過全新的混合注意力機制,在實現超長上下文能力的同時,降低了對計算和顯存的需求,根據官方文檔:“從現在開始,1M(一百萬)上下文將是 DeepSeek 所有官方服務的標配。”

      閱讀其技術文檔可以發現,全新的注意力機制結合了CSA (Compressed Sparse Attention,壓縮稀疏注意力)和HCA (Heavily Compressed Attention,重度壓縮注意力),其中CSA搭配DeepSeek自研的稀疏注意力算法,而HCA對鍵值緩存采用更高的壓縮倍率,但保留了Transformer架構里的稠密注意力算法。粗淺理解一下,就是壓縮得少的跳著看,已經被猛猛壓縮過的那就每個都看。

      To enhance long-context efficiency, we design a hybrid attention mechanism combining Compressed Sparse Attention (CSA) and Heavily Compressed Attention (HCA). CSA compresses the KV caches along the sequence dimension and then performs DeepSeek Sparse Attention (DSA) (DeepSeek-AI, 2025), whereas HCA applies more aggressive compression to the KV caches but keeps dense attention.

      這種混合注意力機制的核心理念,是在超長上下文中,并不是所有鍵值都需要全注意力和稠密計算。其實帶入人類自己的閱讀體驗也是如此,我們看論文時總是聚精會神地先看摘要、導語和結論,而在文獻綜述環節意識模糊。本科選修網絡文學課,老師在第一節課就告訴我們這學期要至少讀完兩千萬字的網文,并介紹了一種“掃文”方式:對角線閱讀法,每頁書只看左上角、正中間、右下角,現在想想,這何嘗不是一種稀疏注意力算法。

      注意力的壓縮,是為了減少計算量,最終目標是提升超長上下文的效率。根據技術報告,“在一百萬tokens上下文中,V4-Pro的推理計算量僅需V3.2的27%,KV緩存占用僅為10%。”

      In the one-million-token context setting, DeepSeek-V4-Pro requires only 27% of single-token inference FLOPs and 10% of KV cache compared with DeepSeek-V3.2.


      3.按理說,token壓縮結合稀疏注意力機制提高計算效率后,廠商的計算成本和顯存成本(同等token規模下)都會大幅減少,最終會反映到token定價上。DeepSeek-V4在今天也公布了定價,每百萬tokens的定價如下:


      這個價格,和海外頭部大模型相比,有很大的優勢。以DeepSeek-V4自稱交付質量接近的Opus 4.6 非思考模型為例,命中緩存的輸入單價為0.5美元/百萬token,未命中緩存的輸入單價為5美元/百萬token,輸出單價為25美元/百萬token。按4月24日當日匯率計算,DeepSeek-V4-pro的三項單價,分別是Opus 4.6的24%、35%和14%。


      海外頭部大模型API調用計價(截至2026.4.24),刺猬公社手動統計,僅供參考;數據來源:各平臺官網

      但和國內競品相比,DeepSeek-V4暫時還沒有對著價格大砍一刀的架勢。

      國內模型中同樣有百萬上下文能力的是阿里在本月初發布的Qwen3.6-plus,對單次輸入的token數進行分層計價,當單次輸入小于256K時,Qwen3.6-plus的輸入和輸出單價均介于DeepSeek-V4-Flash和DeepSeek-V4-Pro之間。


      國內頭部大模型API調用計價(截至2026.4.24),刺猬公社手動統計,僅供參考;數據來源:各平臺官網、公告

      4.準備好做Agent基模,價格戰可能下半年到來

      華為昇騰芯片在DeepSeek 官方公告中被提及,雖然只是以出現在圖片注釋中的低調形式。在更新公告的定價說明截圖下,有一行注釋小字:“受限于高端算力,目前Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,Pro的價格會大幅下調。”

      這條注釋,也許在宣告一種可能性:在DeepSeek-V4 使用大幅降低計算成本的新注意力機制后,V4-Pro沒有大幅降價,是因為高端算力稀缺,而不是成本不允許降價。換言之,一旦國產高端算力在下半年順利接棒,DeepSeek就有空間大幅下調token定價。

      DeepSeek也做好了充足的、充當Agent 基模的準備,畢竟在更新公告里特意寫道自己“針對 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 產品進行了適配和優化”。除了三位耳熟能詳的Agent選手,CodeBuddy是騰訊云開發的代碼助手。

      超高效上下文,更像是token價格戰的一頁序章。也有從業者提供了另一種視角:當DeepSeek已經公開宣布下半年會大幅下調V4-Pro價格后,DeepSeek的模型能力線和價格線,將成為閉源模型的“斬殺線”。


      實測DeepSeek-V4-Pro

      因為更新公告里重點提及了代碼能力、PPT生成能力,刺猬公社基于這兩個領域,對DeepSeek-V4預覽版進行了簡單的橫向測試,對照的是近期發布/更新的,分別以這兩項能力為賣點的產品。

      1.代碼能力VS阿里秒悟

      秒悟是阿里巴巴ATH事業群于將近10天前發布的AI開發平臺,讓0代碼能力的用戶能使用自然語言完成自己的產品開發。剛上線時,我讓秒悟做了一個《作家推薦器》,通過給用戶做8道選擇題判斷TA可能喜歡的作家,題庫一共30道,覆蓋100位作家。經過大概1個小時的調試后,這個測試小網頁上線了:


      雖然不知道為什么秒悟在配色上唯愛清華紫,而且在出文本選擇題的時候像吃了50噸張嘉佳(然而它自己建構的作家庫里沒有張嘉佳),但作為和朋友自娛自樂的小玩具,可用度還是非常高的。我自己做了測試,竟然真的測出了我喜歡的作家。


      DeepSeek-V4-Pro正式上線后,我用同樣的提示詞,測試它做網頁的能力。大概5分鐘后,測試網頁完成了。


      第一次生成,點擊跳轉邏輯并未生效,DeepSeek選擇重寫數千行代碼,先提供了一個只包含10個作家的簡化版。等簡化版運行成功,它確認自己代碼結構沒有問題后,我讓它把作家庫恢復到100個,它依然選擇了把代碼全部重寫,而不是讓我替換若干個代碼模塊。

      DeepSeek給出的解決方式,讓我恍惚覺得自己擁有無限的token火力,在對這個小小的網頁需求進行過飽和攻擊,而在此過程中,我其實完全沒有付費。


      橫向測評之后,秒悟的優勢在于0操作門檻,最終的交付結果是一個用戶可以打開的網頁,用戶可以直接分享給朋友或是互聯網上的任何人。劣勢在于價格,做一個作家推薦器大概花掉了40000積分,按照積分的零售價格是40塊,如果不想花錢,按每天登錄贈送2000積分的速度,大概連續登錄20天可以做一個玩具網頁。最終我斥39元巨資訂購了每月100000積分的套餐。

      DeepSeek-V4-Pro的最大優勢當然是免費,幾千行代碼說寫就寫;另一個優勢是快速,雖然沒有左拉一個助手,右拉一個設計師,建構若干項蜂群工程,但不到10分鐘就做完了。劣勢則是只能生成一份代碼,讓我打包成html格式再去瀏覽器打開,如果想直接分享到線上,還需要自己完成部署。另外,如果說使用qwen的秒悟像吃了五十噸張嘉佳老師,那么DeepSeek做出來的作家推薦器就像是吃了五十噸DeepSeek。


      2.PPT生成能力VS MaxHermes

      測試PPT生成能力時,我直接選擇了使用DeepSeek-V4的技術文檔,共59頁pdf,要求是生成一個給大學生做講座用的PPT。

      MaxHermes很快完成了一個可以直接下載的PPT文件,結構和美化都做得不錯。劣勢是要花錢,為了使用MaxHermes,我需要花39元買一個基礎版會員,再花49元訂購一個token plan包月。


      DeepSeek則生成了代碼,需要在本地用Python運行,沒有那些Agent方便,而且樣式有些過于樸素了。最大優點依然是完全免費,留了圖片的占位符,需要用戶自己做一些圖片替換工作。題外話,為什么不管寫網站還是做PPT,大模型們都不約而同地默認選擇了紫色系?


      如果用Claude Code 、OpenClaw等Agent產品搭配DeepSeek 4.0的API,應該能獲得更便捷的體驗,但就要走DeepSeek的API計費邏輯了,無法像現在這樣完全免費。

      更何況,現在是周五晚上9點半國產大模型的更新固然重要使我從早到晚坐在電腦前興奮地敲了一天字但是周五晚上跟朋友約好去五道營喝酒聽歌同樣重要我將在關注AI進展的同時保衛我的線下生活那正是我在開頭就感謝DeepSeek 在周五上午發布更新的原因。




      媒介合作聯系微信號|ciweimeijiejun

      如需和我們交流可后臺回復“進群”加社群

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      廣東一男子打麻將時倒地身亡!“傾向于猝死”,家屬怒告棋牌室

      廣東一男子打麻將時倒地身亡!“傾向于猝死”,家屬怒告棋牌室

      南方都市報
      2026-05-05 00:10:56
      廣東一景區巖石被染成五彩色,景區回應:是環保涂料

      廣東一景區巖石被染成五彩色,景區回應:是環保涂料

      上觀新聞
      2026-05-05 13:44:14
      81年閱兵,鄧公指著一名師長說:此人重點培養,后來他是啥軍銜?

      81年閱兵,鄧公指著一名師長說:此人重點培養,后來他是啥軍銜?

      歷史龍元閣
      2026-03-30 14:15:06
      146億庫存積壓、三次降價仍滯銷,洋巨頭:我們的財路被斷了

      146億庫存積壓、三次降價仍滯銷,洋巨頭:我們的財路被斷了

      果殼
      2026-05-05 10:36:20
      杰米-懷特:吳宜澤的長臺非常出色,若戰術提升可以變得更強

      杰米-懷特:吳宜澤的長臺非常出色,若戰術提升可以變得更強

      懂球帝
      2026-05-05 14:44:05
      新華社消息|湖南瀏陽煙花廠爆炸已致26死61傷

      新華社消息|湖南瀏陽煙花廠爆炸已致26死61傷

      新華社
      2026-05-05 14:24:56
      大批“宇航員”排隊打卡內蒙烏蘭哈達火山,景區:內部環境似火星地表,牧民提供“宇航服”出租服務,休眠火山很安全

      大批“宇航員”排隊打卡內蒙烏蘭哈達火山,景區:內部環境似火星地表,牧民提供“宇航服”出租服務,休眠火山很安全

      極目新聞
      2026-05-04 16:07:52
      回不來了!美國一句話,賴清德被架在火上烤,還想“順”到美國?

      回不來了!美國一句話,賴清德被架在火上烤,還想“順”到美國?

      知法而形
      2026-05-04 17:45:49
      慣子如殺子!孩子這幾種表現說明已經被慣壞了,再不改就來不及了

      慣子如殺子!孩子這幾種表現說明已經被慣壞了,再不改就來不及了

      木言觀
      2026-04-29 22:28:49
      你敢信?84歲老人月退休金3700,摳出74萬存款,全網怒罵這樣活著

      你敢信?84歲老人月退休金3700,摳出74萬存款,全網怒罵這樣活著

      叮當當科技
      2026-05-05 11:41:05
      大病越來越多?勸告:寧可不運動,也別做這5件“傷身”事

      大病越來越多?勸告:寧可不運動,也別做這5件“傷身”事

      芹姐說生活
      2026-05-02 14:16:21
      別再被抗戰劇騙了!一名日軍攝影師,拍下真正的“鬼子進村”照片

      別再被抗戰劇騙了!一名日軍攝影師,拍下真正的“鬼子進村”照片

      歷史甄有趣
      2026-05-04 08:10:22
      BLACKPINK全員亮相metgala紅毯

      BLACKPINK全員亮相metgala紅毯

      精彩背后
      2026-05-05 10:57:08
      核武高懸!特朗普放話“抹去伊朗”,導彈互射后最后壓艙石是誰?

      核武高懸!特朗普放話“抹去伊朗”,導彈互射后最后壓艙石是誰?

      魔法污A
      2026-05-05 14:09:16
      熱巴紅繩事件升級!超10位明星拍過同款,網友:“越看越詭異”

      熱巴紅繩事件升級!超10位明星拍過同款,網友:“越看越詭異”

      楓塵余往逝
      2026-05-03 09:34:30
      當不成總統了?全美爆發大規模混亂,特朗普或被迫下臺

      當不成總統了?全美爆發大規模混亂,特朗普或被迫下臺

      云景侃記
      2026-05-05 14:30:06
      山東鐘先生悲劇升級!倆兒非親生,妻子跑路后最新進展來了

      山東鐘先生悲劇升級!倆兒非親生,妻子跑路后最新進展來了

      杰絲聊古今
      2026-05-05 12:04:56
      蔚來CEO李斌:今年車賣不好公司就沒了

      蔚來CEO李斌:今年車賣不好公司就沒了

      快科技
      2026-05-03 09:20:06
      倒反天罡!法官向刺殺川普的槍手道歉

      倒反天罡!法官向刺殺川普的槍手道歉

      大洛杉磯LA
      2026-05-05 06:11:22
      這就是烈士江姐的真實的樣貌,并非演員扮演,貨真價實的罕見照片

      這就是烈士江姐的真實的樣貌,并非演員扮演,貨真價實的罕見照片

      浩渺青史
      2026-05-04 00:50:25
      2026-05-05 16:11:00
      刺猬公社 incentive-icons
      刺猬公社
      聽記者講幕后,聽新聞前輩講古
      10050文章數 172586關注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設備處理器

      頭條要聞

      伊朗警告阿聯酋:勿當以色列棋子 否則將得到難忘教訓

      頭條要聞

      伊朗警告阿聯酋:勿當以色列棋子 否則將得到難忘教訓

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      英皇25周年演唱會 張敬軒被救護車拉走

      財經要聞

      五一假期,中國年輕人的“首爾病”犯了

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      本地
      時尚
      親子
      游戲
      公開課

      本地新聞

      用青花瓷的方式,打開西溪濕地

      夏天最經典的銀色,貴氣十足!

      親子要聞

      吃糖對孩子的危害不只是牙齒!家長一定要注意

      知名解說Miss輝煌戰績遭打假!負責人怒懟:別硬蹭了

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美丰满熟妇xxxx性ppx人交| AV天堂亚洲| 91国在线啪精品一区| 欧美日韩免费专区在线观看| 中文字幕制服国产精品| 欧美啪啪视频| 任我爽精品视频在线观看| 欧美另类图区清纯亚洲| 久久精品视频只有这里| 精品一区二区三区不卡| 欧美成年黄网站色视频| 九九成人精品| 先锋成人影音| 亚洲AV不卡一区二区三区| 一本大道无码日韩精品影视| 高清国产一区二区无遮挡| 蜜桃AV抽搐高潮一区二区| jjzz国产| 97精品人妻系列无码人妻| 久久青青草原精品国产app| 成人免费A级毛片无码| 国内av网站| 国产精品午夜福利视频| 亚洲人成网站77777在线观看| 激情综合一区二区三区| 在线免费不卡av网站一区| 无码不卡av毛片| 亚洲中文无码av在线| 亚洲成人av高清在线| 人妻少妇久久久久久97人妻| 先锋资源av| 久久逼久久| 国内精品乱码卡一卡2卡三卡新区| 波多野结衣一区二区三区高清av| 国产第一区二区三区精品| 福利色导航| 久久精品囯产精品亚洲| 人妻二区三区| 国产在线精品人成导航| 刘婷户外视频大全播放| 中文 在线 日韩 亚洲 欧美|