網易首頁 > 網易號 > 正文申請入駐

實測DeepSeek V4，為國產化而生。

2026-04-24 15:00:19　來源: 數字生命卡茲克

天津舉報

分享至

今天，等了一年的DeepSeek V4，終于發布了。

本來每天都很期待，但是發布的這一刻，突然感覺進入到了一種賢者模式。

人有點麻了，這一周發了7、8個新模型，最近24小時就發了4個，昨天下午剛開始測MiMo，然后HY3發了，剛寫完MiMo，然后GPT-5.5發了，今天剛發完MiMO，然后DeepSeek v4發了。

我現在就仿佛雞排哥，寫完你的寫你的，寫完你的寫你的。

我也第一時間把DeepSeek V4接到了我的Claude Code里。

然后很多朋友問為啥沒有R2了，這塊我簡單的科普一下下，就是在去年這個階段，推理模型和非推理模型還是分開的，也就是DeepSeek R1是推理模型，DeepSeek V3是非推理模型。

然后到了后面，基本Claude和GPT都還開始使用混合模型了，也就是用思考強度去控制模型是否進行推理。

所以DeepSeek V3.1的時候，也改成了混合模型的架構，這些V4同樣的，也是混合模型。

所以R2存在的意義現在就有點不明確了，就像OpenAI o3，就成了OpenAI的最后一代推理模型，被并到了GPT-5里面。

再簡單說一下DeepSeek V4這次的一些特性。

先看跑分。

這是DeepSeek V4自己的。

各方面都有明顯加強。

然后這段時間，模型又太多太雜太亂了，于是我又自己整理了一下，因為大家的數據和口徑總是經常不一樣，所以這個表能看個大概，但是不能深究。。。

先是知識推理類的。

沒有數據的就是沒放這塊的跑分。

可以看到DeepSeek最強的還是SimpleQA這兩個知識類的，逼近Gemini 3.1 Pro，在其他的地方只能說中庸。

然后代碼類的。

可以非常明顯的看到走的也是Gemini那一卦的，在競賽、算法類比較強，但是真實代碼工程能力上，只能說從分數上看，也沒啥大幅領先，第一梯隊水平。

代碼這塊我覺得也可以把Arena最新的評分放出來，目前DeepSeek V4排第三，第一還是GLM-5.1，MiMo沒上榜是因為還沒開源出來，目前只有API，開源估計下周了。

Agent能力這一卦上。

這個確實比較強。

跑分大概就是這樣，其實可以看到比較正常，在現在一眾諸神混戰的年代里，可以給到人上人，但是如果大家是夯爆了的預期的話，可能就會失望了。

然后還有一個非常直觀的數據，V4-Pro的總參數量是1.6T，也就是1.6萬億。

V3.2是671B，也就是6710億，V4的參數量，翻了將近兩倍半。

所以其實你可以看到，在如今這個時代，依然還是大就好，大就牛逼，大就是聰明。

但是因為大帶來的提升，也變向帶來了Token的漲價，算力就那么多，模型參數越來越大，Agent推理所用的Token又越來越多，不漲價都不可能了。

V4-Pro是輸入12元，輸出24元每百萬token，V4-Flash是輸入1元，輸出2元。

換算成美元的話，輸入1.74美元每百萬token，輸出3.48美元。V4-Flash，輸入0.14美元每百萬token，輸出0.28美元。

作為對比，Claude Opus 4.7是輸入5美元，輸出25美元，GPT-5.5是輸入5美元，輸出30美元。

MimM-V2.5-Pro在0到256k token內，是￥7/￥21每百萬token（輸入/輸出），在256k到1M token內是￥14/￥42每百萬token（輸入/輸出）。

平均下來國產模型價格定價都差不多，雖然有點對不起DeepSeek一直以來的價格屠夫的稱稱號，但還是大概比海外模型平均便宜60%左右。

不過這里面有個細節很多人可能沒注意到。

DeepSeek在定價頁面底部有一行小字，大意是說，受限于高端算力，目前Pro的服務吞吐十分有限，預計下半年昇騰950超節點批量上市后，Pro的價格會大幅下調。

也就是說，V4-Pro現在的價格還不是最終態，等芯片產能跟上了，價格還會往下降，這一點我覺得還是挺重要的。

然后這個事，加上DeepSeek V4的報告里，其實能透露出非常多國產化的細節，明顯是為了給國產芯片做準備的。

有幾個小細節，我也不知道我理解的對不對，有大佬可以來拍磚一下。

1. V4在后訓練和推理體系里引入了MXFP4。

雖然訓練還是用的英偉達體系，但是在后訓練和推理上用這個基本上就意味著，DeepSeek在往開放低精度格式和多硬件適配方向走，可以適配國產卡比如華為昇騰、寒武紀、壁仞等等，會降低對NVIDIA的FP8生態的綁定，特別是推理的時候，那這就是正兒八經的國產生態國產模型了，可惜的就是現在價格還沒下來。

2. V4的底層內核不再完全靠CUDA寫，用了一個叫TileLang的DSL。DeepSeek希望底層算子開發不要完全鎖死在CUDA上，而是用更高一層的語言描述計算，再盡量編譯到不同硬件上，這個非常牛逼，可以大大降低遷移成本。

3. V4專門搞了一個叫MegaMoE的融合內核，設計目標是減少專家并行中的通信等待，目前已經在華為昇騰上跑通。

這三條放一起，方向就非常清楚了，V4是完完全全的，為了國產卡而設計的模型。

這真的不是啥愛國故事，所有人都知道，未來算力有多缺，算力生產有多慢，但是Agent加速之下，Token帶來的消耗有多恐怖。

算力被卡脖子，所有人都沒有辦法，君不見GLM-5.1這么好的模型，有多受限于算力推理嗎？

算力博弈，很多時候，就是頂層博弈。

DeepSeek v4，就是算力博弈逼出來的現實。

未來一年，國產大模型跑國產卡這件事，感覺會逐漸成熟了。

然后多模態的事，我知道大家很關心。

因為現在，多模態幾乎是標配了，比如Opus 4.7大幅強化的就是多模態能力，K2.6、MiMo-V2.5-Pro也都標配了多模態，更別提GPT-5.5了。

因為沒有多模態，你讀不了圖，你沒有視覺能力，審美上也必然差一截，同時什么Computer Use之類的Agent能力，更是想都別想。

但是非常非常可惜的是，DeepSeek V4，不是多模態。

還是一個純文本模型，沒有多模態能力。

一聲長嘆，其實很早以前就在傳V4有多模態了，我也知道他們內部肯定做了多模態的工作，但是最后，還是沒有放出來，看來適配國產卡的壓力，還是太大太大了。

多模態，可能只能等到v4.5或者v5.0了，希望這兩個版本，沒有了適配國產卡的壓力，不要再讓我們等一年了。

目前V4 Pro我也接到Claude Code里面了。

我們在自己緊鑼密鼓的測試了3個小時之后，有了一些自己粗糙的結論。

我個人感覺，跟Claude Code的適配，是有一些問題的，我現在不知道到底是適配的問題，還是模型的問題。

舉個最簡單的例子，我的本地skill，是有一個直接管理我服務器的skill的。

我至今沒有見到任何一個模型，在我說出明確帶有服務器的詞語的時候，不去調用我的服務器skill去服務器查詢。

GLM-5.1、MiniMax M2.7、Kimi K2.6、MiMo-V2.5-Pro，沒有一個有問題，但是，DeepSeek V4，出了問題。

我需要把Prompt說的如此明確才可以。

非常的奇怪。

我們小伙伴也是，之前他做了一個社群運營系統，已經做完了，在桌面留了個PRD，用來測試的，但，理解力也有點問題，雖然是為了測試，在根目錄進行啟動的，但一般還是會進行全局搜索一下的，而不是直接拒絕。

然后開發這塊，我自己之前測試Opus 4.7的Case扔給了他，這個需求其實就是給我們開發一個招聘網站，要使用女神異聞錄5的風格，同時還要部署到我的服務器上，但是我的需求說的非常的亂，也會比較考驗模型需求的理解能力。

Opus 4.7當時做出來的效果是這樣的。

在給DeepSeek V4 Pro開發的時候，速度非常的緩慢。

大概花了24分鐘做完的。

然后實現效果是這樣的，

UI其實還好了，但是出了蠻大的問題，就是沒有跟我進行任何的確認。

因為我的約束給的是非常多的，比如CLAUDE.md里面，還有我的skill里面，最基本的一個問題，就是比如沒有遵守skill的描述。

任何新項目，部署到服務器上，都是一定要跟用戶確認域名是否OK的，但是沒有做任何確認，直接自己選了 careers.virxact.com干上去了，24分鐘結束之后，給了我一個域名，讓我確認。

這個其實蠻奇怪的，我的約束好像很多也都失效了。

而模型的寫作能力上，反而是讓我覺得比較開心的點。

相比于其他模型，幾乎不說人話不看寫作了，DeepSeek是為數不多的還關注這一塊的。

第一個是強行調用我的skill，去寫一篇關于Token漲價的文章。

花了大概8分鐘，不知道開了多少個網頁，然后寫了一篇，在幾層檢測上，自己完成了。

效果大概是這樣的。

還讓他對我昨天GPT-image-2的黑暗森林那篇進行了中段續寫的測試。

整體效果達不到Opus 4.6那種潤物細無聲的級別，但是比Opus 4.7要好，如果你用修改度來區分，那大概Opus 4.6直出的我的修改度是30%，Opus 4.7我的修改度是60%，那DeepSeek V4 Pro的修改讀大概在45%左右。

并且因為上下文增加，在輸出長文檔上，效果會好的多的多。

對DeepSeek V4的測試大概就是這樣。

有好有壞。

我昨天在GPT-5.5的文章里修正過一次推薦，早上我也寫過MiMo-V2.5-Pro，說它是我現在覺得搭配Claude Code的最佳模型之一。

現在，我再更改一下推薦：

1. 如果你更偏好海外模型，且愿意花20～200刀會員訂閱費：

在內容創作（文章、策劃案、腳本等）這種需要創意的場景上，我至今依然推薦使用Claude Code + Claude Opus 4.6。

而在通用開發、數據分析、文檔處理等所有其他場景下，我更推薦你用Codex + GPT-5.5。

2. 如果你更偏好國內模型：

在內容創作場景上，我推薦你使用DeepSeek官網，沒有必要用Claude Code。

而在其他所有場景下，我依然推薦你使用Claude Code + GLM-5.1或MiMo-V2.5-Pro的組合。

DeepSeek V4，身上背負的東西太多，承載的東西也太多。

大家給的期望也足夠的大。

雖然非常坦誠的講，這次的模型，并沒有大幅度的領先和巨型的驚艷。

但，對于模型的國產化、乃至AI的國產化，都是濃墨重彩的一筆。

希望這一次，完成了所有的底層積累，厚積薄發。

在V4.5或者V5的時候。

讓世界，繼續聽到DeepSeek的聲音。

以上，既然看到這里了，如果覺得不錯，隨手點個贊、在看、轉發三連吧，如果想第一時間收到推送，也可以給我個星標?～謝謝你看我的文章，我們，下次再見。

>/ 作者：卡茲克

>/ 投稿或爆料，請聯系郵箱：wzglyay@virxact.com

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

正式取消！知名985高校：公眾進校不用預約了

南方都市報 2026-05-14 13:02:01
10169 跟貼 10169
古巴宣布燃油儲備耗盡全國電網進入"危急狀態"

澎湃新聞 2026-05-14 19:20:31
8606 跟貼 8606

“小馬云”范小勤成年后直播首秀，在線人數突破7萬，禮物刷屏

星視頻 2026-05-14 15:29:30
426 跟貼 426

招牌職業隊中甲墊底，青訓人才大量流失，“中國足球之鄉”梅州究竟怎么了？

文匯報 2026-05-15 04:30:13
14 跟貼 14
高奢版售價或超10萬元！追覓手機預計今年發布，創始人俞浩揚言要與蘋果、三星三分天下，最終必將超越蘋果4萬億美元市值

大風新聞 2026-05-14 13:40:08
3469 跟貼 3469

武功山景區遭“臭屁蟲”圍攻？有游客調侃“張嘴能吃飽”，景區提醒：可自備防蟲藥物

瀟湘晨報 2026-05-14 17:33:19
980 跟貼 980

九寨溝將實行“雙向檢票”？工作人員：出園檢票并非新政策，一直嚴禁溝內住宿

上游新聞 2026-05-11 15:40:24
2953 跟貼 2953
獨家專訪｜蔡斌：排球人生路，問心無愧

澎湃新聞 2026-05-14 18:20:28
268 跟貼 268

北京之行心情不錯，國際足聯秘書長到訪工體

北京日報客戶端 2026-05-14 18:55:29
2699 跟貼 2699
月薪1.6萬、全年無休的放羊工作，兩對80后夫妻已上崗。牧場老板：一對照顧1000多只羊，冬天冰天雪

封面新聞 2026-05-14 18:06:52
115 跟貼 115
業主首車免費，租戶首車200元/月！滬上小區停車新規，引發“公租房權益”之爭→

新民晚報 2026-05-14 18:51:24
99 跟貼 99
中雨+雷暴大風！我市將迎大范圍降水

錦繡太原 2026-05-15 11:14:57
1 跟貼 1
中超|利矛戰鐵盾，克雷桑領銜鋒線，泰山破局依舊靠“單兵”？

齊魯壹點 2026-05-15 12:04:05
2 跟貼 2
自助餐加了“飽腹劑”？記者調查自助餐“快速飽腹”的秘密

大象新聞 2026-05-13 14:30:03
169 跟貼 169
烏稱俄大規模襲擊已致11個地區停電

財聯社 2026-05-14 16:58:09
1053 跟貼 1053
俞浩為什么“瘋狂”刷屏？專家拆解追覓品牌營銷三大打法

每日經濟新聞 2026-05-15 00:26:07
36 跟貼 36
貓媽媽趁早上人少帶娃們滑滑梯，網友：像小朋友一樣可愛。（來源：快看）

學申論的談妹 2026-05-14 19:29:40
151 跟貼 151
多地網友拍到的“不明飛行物”到底是啥？（2026·05·14）

今日辟謠 2026-05-14 17:23:09
114 跟貼 114
汶川縣臥龍鎮政府深夜通報

澎湃新聞 2026-05-15 08:56:05
0 跟貼 0
“早晚高峰只能龜速前進” ！深圳水官高速免費通行僅半月，網友吐槽太堵！專家建議

南方都市報 2026-05-15 09:02:51
1 跟貼 1
北交所新股發行迎改革窗口期市值打新成市場關注焦點

財聯社 2026-05-15 07:09:29
56 跟貼 56
美股三大指數集體收漲納指、標普500指數續創新高

每日經濟新聞 2026-05-15 07:02:11
52 跟貼 52
明天起，機票燃油附加費上調

極目新聞 2026-05-15 07:37:25
38 跟貼 38
4月末M2余額353.04萬億元同比增長8.6%

中國人民銀行 2026-05-14 17:02:34
129 跟貼 129
支付寶回應“女子深夜被莫名捐款184萬元 ”：賬戶存在共用嫌疑，不排除涉違法犯罪的可能，正向警方尋求幫助

封面新聞 2026-05-15 12:54:14
0 跟貼 0
“活著，孩子才有媽媽喊” 濟南大明湖一女子落水，陪母抗癌姑娘的這句話讓人破防丨看見正能量

封面新聞 2026-05-15 12:56:07
0 跟貼 0
荔枝、西瓜、芒果、榴蓮批量上市專家提示當心糖分超標

北青網-北京青年報 2026-05-15 11:52:05
0 跟貼 0
男童海底撈奔跑，被熱油鍋燙傷！店長稱曾多次提醒，家長“孩子跑會兒怎么了”

上海法治聲音 2026-05-15 12:58:07
0 跟貼 0
別酸了，說男方家里有錢？我說幾句

高恒說 2026-05-15 12:52:51
0 跟貼 0

數字生命卡茲克

反復橫跳于不同的AI領域，努力分享一些很酷的AI干貨

517文章數 648關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

房產

家居

親子

軍事航空

手機 / 數碼

房產 / 家居

實測DeepSeek V4，為國產化而生。

兩年聯姻一地雞毛，傳蘋果OpenAI瀕臨決裂

歡迎宴會座位公開:馬斯克黃仁勛與中國企業家同桌吃飯

歡迎宴會座位公開:馬斯克黃仁勛與中國企業家同桌吃飯

德約科維奇買的球隊，從第6級聯賽升入法甲

方媛回應住男生單人間：女孩的配得感

特朗普的北京時刻

雙零重力座椅/AI智能體/調光天幕 啟境GT7內飾發布

態度原創

在地球另一端，我成了這所小眾留學院校法學院的首位中國學生

海南樓市新政要出！擬調公積金貸款額度，最高可貸168萬！

110㎡淡而有致的生活表達

爸爸的貼心小棉襖，睡覺都要貼身上，光兒子的真羨慕！

烏克蘭首都基輔遭空襲 死亡人數增至12人

雙零重力座椅/AI智能體/調光天幕啟境GT7內飾發布

烏克蘭首都基輔遭空襲死亡人數增至12人