<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      實測DeepSeek V4,為國產化而生。

      0
      分享至

      今天,等了一年的DeepSeek V4,終于發布了。


      本來每天都很期待,但是發布的這一刻,突然感覺進入到了一種賢者模式。

      人有點麻了,這一周發了7、8個新模型,最近24小時就發了4個,昨天下午剛開始測MiMo,然后HY3發了,剛寫完MiMo,然后GPT-5.5發了,今天剛發完MiMO,然后DeepSeek v4發了。

      我現在就仿佛雞排哥,寫完你的寫你的,寫完你的寫你的。


      我也第一時間把DeepSeek V4接到了我的Claude Code里。


      然后很多朋友問為啥沒有R2了,這塊我簡單的科普一下下,就是在去年這個階段,推理模型和非推理模型還是分開的,也就是DeepSeek R1是推理模型,DeepSeek V3是非推理模型。

      然后到了后面,基本Claude和GPT都還開始使用混合模型了,也就是用思考強度去控制模型是否進行推理。

      所以DeepSeek V3.1的時候,也改成了混合模型的架構,這些V4同樣的,也是混合模型。

      所以R2存在的意義現在就有點不明確了,就像OpenAI o3,就成了OpenAI的最后一代推理模型,被并到了GPT-5里面。

      再簡單說一下DeepSeek V4這次的一些特性。

      先看跑分。

      這是DeepSeek V4自己的。



      各方面都有明顯加強。

      然后這段時間,模型又太多太雜太亂了,于是我又自己整理了一下,因為大家的數據和口徑總是經常不一樣,所以這個表能看個大概,但是不能深究。。。

      先是知識推理類的。


      沒有數據的就是沒放這塊的跑分。

      可以看到DeepSeek最強的還是SimpleQA這兩個知識類的,逼近Gemini 3.1 Pro,在其他的地方只能說中庸。

      然后代碼類的。


      可以非常明顯的看到走的也是Gemini那一卦的,在競賽、算法類比較強,但是真實代碼工程能力上,只能說從分數上看,也沒啥大幅領先,第一梯隊水平。

      代碼這塊我覺得也可以把Arena最新的評分放出來,目前DeepSeek V4排第三,第一還是GLM-5.1,MiMo沒上榜是因為還沒開源出來,目前只有API,開源估計下周了。


      Agent能力這一卦上。


      這個確實比較強。

      跑分大概就是這樣,其實可以看到比較正常,在現在一眾諸神混戰的年代里,可以給到人上人,但是如果大家是夯爆了的預期的話,可能就會失望了。

      然后還有一個非常直觀的數據,V4-Pro的總參數量是1.6T,也就是1.6萬億。


      V3.2是671B,也就是6710億,V4的參數量,翻了將近兩倍半。

      所以其實你可以看到,在如今這個時代,依然還是大就好,大就牛逼,大就是聰明。

      但是因為大帶來的提升,也變向帶來了Token的漲價,算力就那么多,模型參數越來越大,Agent推理所用的Token又越來越多,不漲價都不可能了。

      V4-Pro是輸入12元,輸出24元每百萬token,V4-Flash是輸入1元,輸出2元。


      換算成美元的話,輸入1.74美元每百萬token,輸出3.48美元。V4-Flash,輸入0.14美元每百萬token,輸出0.28美元。

      作為對比,Claude Opus 4.7是輸入5美元,輸出25美元,GPT-5.5是輸入5美元,輸出30美元。

      MimM-V2.5-Pro在0到256k token內,是¥7/¥21每百萬token(輸入/輸出),在256k到1M token內是¥14/¥42每百萬token(輸入/輸出)。

      平均下來國產模型價格定價都差不多,雖然有點對不起DeepSeek一直以來的價格屠夫的稱稱號,但還是大概比海外模型平均便宜60%左右。

      不過這里面有個細節很多人可能沒注意到。

      DeepSeek在定價頁面底部有一行小字,大意是說,受限于高端算力,目前Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,Pro的價格會大幅下調。

      也就是說,V4-Pro現在的價格還不是最終態,等芯片產能跟上了,價格還會往下降,這一點我覺得還是挺重要的。

      然后這個事,加上DeepSeek V4的報告里,其實能透露出非常多國產化的細節,明顯是為了給國產芯片做準備的。

      有幾個小細節,我也不知道我理解的對不對,有大佬可以來拍磚一下。

      1. V4在后訓練和推理體系里引入了MXFP4。


      雖然訓練還是用的英偉達體系,但是在后訓練和推理上用這個基本上就意味著,DeepSeek在往開放低精度格式和多硬件適配方向走,可以適配國產卡比如華為昇騰、寒武紀、壁仞等等,會降低對NVIDIA的FP8生態的綁定,特別是推理的時候,那這就是正兒八經的國產生態國產模型了,可惜的就是現在價格還沒下來。

      2. V4的底層內核不再完全靠CUDA寫,用了一個叫TileLang的DSL。DeepSeek希望底層算子開發不要完全鎖死在CUDA上,而是用更高一層的語言描述計算,再盡量編譯到不同硬件上,這個非常牛逼,可以大大降低遷移成本。

      3. V4專門搞了一個叫MegaMoE的融合內核,設計目標是減少專家并行中的通信等待,目前已經在華為昇騰上跑通。


      這三條放一起,方向就非常清楚了,V4是完完全全的,為了國產卡而設計的模型。

      這真的不是啥愛國故事,所有人都知道,未來算力有多缺,算力生產有多慢,但是Agent加速之下,Token帶來的消耗有多恐怖。

      算力被卡脖子,所有人都沒有辦法,君不見GLM-5.1這么好的模型,有多受限于算力推理嗎?

      算力博弈,很多時候,就是頂層博弈。

      DeepSeek v4,就是算力博弈逼出來的現實。

      未來一年,國產大模型跑國產卡這件事,感覺會逐漸成熟了。

      然后多模態的事,我知道大家很關心。

      因為現在,多模態幾乎是標配了,比如Opus 4.7大幅強化的就是多模態能力,K2.6、MiMo-V2.5-Pro也都標配了多模態,更別提GPT-5.5了。

      因為沒有多模態,你讀不了圖,你沒有視覺能力,審美上也必然差一截,同時什么Computer Use之類的Agent能力,更是想都別想。

      但是非常非常可惜的是,DeepSeek V4,不是多模態。

      還是一個純文本模型,沒有多模態能力。

      一聲長嘆,其實很早以前就在傳V4有多模態了,我也知道他們內部肯定做了多模態的工作,但是最后,還是沒有放出來,看來適配國產卡的壓力,還是太大太大了。

      多模態,可能只能等到v4.5或者v5.0了,希望這兩個版本,沒有了適配國產卡的壓力,不要再讓我們等一年了。

      目前V4 Pro我也接到Claude Code里面了。


      我們在自己緊鑼密鼓的測試了3個小時之后,有了一些自己粗糙的結論。

      我個人感覺,跟Claude Code的適配,是有一些問題的,我現在不知道到底是適配的問題,還是模型的問題。

      舉個最簡單的例子,我的本地skill,是有一個直接管理我服務器的skill的。

      我至今沒有見到任何一個模型,在我說出明確帶有服務器的詞語的時候,不去調用我的服務器skill去服務器查詢。

      GLM-5.1、MiniMax M2.7、Kimi K2.6、MiMo-V2.5-Pro,沒有一個有問題,但是,DeepSeek V4,出了問題。


      我需要把Prompt說的如此明確才可以。


      非常的奇怪。

      我們小伙伴也是,之前他做了一個社群運營系統,已經做完了,在桌面留了個PRD,用來測試的,但,理解力也有點問題,雖然是為了測試,在根目錄進行啟動的,但一般還是會進行全局搜索一下的,而不是直接拒絕。


      然后開發這塊,我自己之前測試Opus 4.7的Case扔給了他,這個需求其實就是給我們開發一個招聘網站,要使用女神異聞錄5的風格,同時還要部署到我的服務器上,但是我的需求說的非常的亂,也會比較考驗模型需求的理解能力。

      Opus 4.7當時做出來的效果是這樣的。



      在給DeepSeek V4 Pro開發的時候,速度非常的緩慢。

      大概花了24分鐘做完的。


      然后實現效果是這樣的,


      UI其實還好了,但是出了蠻大的問題,就是沒有跟我進行任何的確認。

      因為我的約束給的是非常多的,比如CLAUDE.md里面,還有我的skill里面,最基本的一個問題,就是比如沒有遵守skill的描述。

      任何新項目,部署到服務器上,都是一定要跟用戶確認域名是否OK的,但是沒有做任何確認,直接自己選了 careers.virxact.com干上去了,24分鐘結束之后,給了我一個域名,讓我確認。

      這個其實蠻奇怪的,我的約束好像很多也都失效了。

      而模型的寫作能力上,反而是讓我覺得比較開心的點。

      相比于其他模型,幾乎不說人話不看寫作了,DeepSeek是為數不多的還關注這一塊的。

      第一個是強行調用我的skill,去寫一篇關于Token漲價的文章。


      花了大概8分鐘,不知道開了多少個網頁,然后寫了一篇,在幾層檢測上,自己完成了。


      效果大概是這樣的。



      還讓他對我昨天GPT-image-2的黑暗森林那篇進行了中段續寫的測試。


      整體效果達不到Opus 4.6那種潤物細無聲的級別,但是比Opus 4.7要好,如果你用修改度來區分,那大概Opus 4.6直出的我的修改度是30%,Opus 4.7我的修改度是60%,那DeepSeek V4 Pro的修改讀大概在45%左右。

      并且因為上下文增加,在輸出長文檔上,效果會好的多的多。

      對DeepSeek V4的測試大概就是這樣。

      有好有壞。

      我昨天在GPT-5.5的文章里修正過一次推薦,早上我也寫過MiMo-V2.5-Pro,說它是我現在覺得搭配Claude Code的最佳模型之一。

      現在,我再更改一下推薦:

      1. 如果你更偏好海外模型,且愿意花20~200刀會員訂閱費:

      在內容創作(文章、策劃案、腳本等)這種需要創意的場景上,我至今依然推薦使用Claude Code + Claude Opus 4.6。

      而在通用開發、數據分析、文檔處理等所有其他場景下,我更推薦你用Codex + GPT-5.5。

      2. 如果你更偏好國內模型:

      在內容創作場景上,我推薦你使用DeepSeek官網,沒有必要用Claude Code。

      而在其他所有場景下,我依然推薦你使用Claude Code + GLM-5.1或MiMo-V2.5-Pro的組合。

      DeepSeek V4,身上背負的東西太多,承載的東西也太多。

      大家給的期望也足夠的大。

      雖然非常坦誠的講,這次的模型,并沒有大幅度的領先和巨型的驚艷。

      但,對于模型的國產化、乃至AI的國產化,都是濃墨重彩的一筆。

      希望這一次,完成了所有的底層積累,厚積薄發。

      在V4.5或者V5的時候。

      讓世界,繼續聽到DeepSeek的聲音。

      以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。

      >/ 作者:卡茲克

      >/ 投稿或爆料,請聯系郵箱:wzglyay@virxact.com

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      5月最不好惹的3個生肖:別人虧時候他們賺,別人賺時候他們多賺!

      5月最不好惹的3個生肖:別人虧時候他們賺,別人賺時候他們多賺!

      毅談生肖
      2026-05-15 11:49:53
      丈夫:你把工資拿娘家,兒子用啥?妻子:侄子都養了,兒子也能養

      丈夫:你把工資拿娘家,兒子用啥?妻子:侄子都養了,兒子也能養

      惟來
      2026-05-14 12:02:01
      突然強勢拉升!外交部就特朗普訪華情況答記者問,科創芯片ETF(588290)上漲1.32%

      突然強勢拉升!外交部就特朗普訪華情況答記者問,科創芯片ETF(588290)上漲1.32%

      每日經濟新聞
      2026-05-15 11:24:39
      男子酒后執意要開車,女友勸阻無效后下車走人,警方調查發現其并非第一次酒駕,已被刑事立案偵查

      男子酒后執意要開車,女友勸阻無效后下車走人,警方調查發現其并非第一次酒駕,已被刑事立案偵查

      極目新聞
      2026-05-14 22:36:50
      深夜,暴漲超43%!大牛股,突傳利好!

      深夜,暴漲超43%!大牛股,突傳利好!

      證券時報
      2026-05-15 00:13:10
      特斯拉推出“輕松貸” 五年月供可低至約2193元

      特斯拉推出“輕松貸” 五年月供可低至約2193元

      太平洋汽車
      2026-05-15 12:34:15
      醫生不會告訴你的秘密:這個部位越敏感,性生活越和諧

      醫生不會告訴你的秘密:這個部位越敏感,性生活越和諧

      精彩分享快樂
      2026-05-15 12:11:32
      有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

      有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

      夜深愛雜談
      2026-02-18 20:55:58
      日媒質疑國乒使詐,主帥點出王曼昱孫穎莎差距,梁靖崑獲三萬獎金

      日媒質疑國乒使詐,主帥點出王曼昱孫穎莎差距,梁靖崑獲三萬獎金

      三十年萊斯特城球迷
      2026-05-14 23:13:04
      1985年,國安叛徒藏身南美,中國6名兵王萬里鋤奸,FBI顏面盡失

      1985年,國安叛徒藏身南美,中國6名兵王萬里鋤奸,FBI顏面盡失

      干史人
      2026-04-14 21:10:03
      季后賽報銷!太陽決定交易!排隊給湖人道歉

      季后賽報銷!太陽決定交易!排隊給湖人道歉

      籃球教學論壇
      2026-05-15 11:23:11
      俄羅斯又開始許愿,要求烏克蘭撤出“俄羅斯領土”

      俄羅斯又開始許愿,要求烏克蘭撤出“俄羅斯領土”

      山河路口
      2026-05-13 20:35:10
      故宮留面子,天壇亮底線!特朗普訪華地大變,暗藏中國的大國格局

      故宮留面子,天壇亮底線!特朗普訪華地大變,暗藏中國的大國格局

      小小科普員
      2026-05-14 20:24:25
      中美會談結束,特朗普用4字評價,美媒發現:中國這次話說的很重

      中美會談結束,特朗普用4字評價,美媒發現:中國這次話說的很重

      尋墨閣
      2026-05-15 01:15:17
      里程全國第一,卻有30余縣“手無寸鐵”:廣東高鐵的繁華與盲區

      里程全國第一,卻有30余縣“手無寸鐵”:廣東高鐵的繁華與盲區

      普陀動物世界
      2026-05-14 11:47:14
      漢語是犧牲了什么,才成為世界最緊湊、最高效的語言?

      漢語是犧牲了什么,才成為世界最緊湊、最高效的語言?

      瓜哥的動物日記
      2026-05-13 00:58:37
      僅僅因為一個枕頭,性生活發生了翻天覆地的變化

      僅僅因為一個枕頭,性生活發生了翻天覆地的變化

      精彩分享快樂
      2026-05-15 12:07:56
      何炅工作室回應:沒通知我們啊

      何炅工作室回應:沒通知我們啊

      南方都市報
      2026-05-14 17:49:25
      乒乓球全錦賽延期!原因:與王楚欽和孫穎莎有關,球迷力挺王勵勤

      乒乓球全錦賽延期!原因:與王楚欽和孫穎莎有關,球迷力挺王勵勤

      老王大話體育
      2026-05-15 12:19:44
      97年我對女老師說我喜歡她,她紅著臉說:考上重點大學我就嫁給你

      97年我對女老師說我喜歡她,她紅著臉說:考上重點大學我就嫁給你

      千秋文化
      2026-05-02 19:36:54
      2026-05-15 13:11:00
      數字生命卡茲克 incentive-icons
      數字生命卡茲克
      反復橫跳于不同的AI領域,努力分享一些很酷的AI干貨
      517文章數 648關注度
      往期回顧 全部

      科技要聞

      兩年聯姻一地雞毛,傳蘋果OpenAI瀕臨決裂

      頭條要聞

      歡迎宴會座位公開:馬斯克黃仁勛與中國企業家同桌吃飯

      頭條要聞

      歡迎宴會座位公開:馬斯克黃仁勛與中國企業家同桌吃飯

      體育要聞

      德約科維奇買的球隊,從第6級聯賽升入法甲

      娛樂要聞

      方媛回應住男生單人間:女孩的配得感

      財經要聞

      特朗普的北京時刻

      汽車要聞

      雙零重力座椅/AI智能體/調光天幕 啟境GT7內飾發布

      態度原創

      教育
      房產
      家居
      親子
      軍事航空

      教育要聞

      在地球另一端,我成了這所小眾留學院校法學院的首位中國學生

      房產要聞

      海南樓市新政要出!擬調公積金貸款額度,最高可貸168萬!

      家居要聞

      110㎡淡而有致的生活表達

      親子要聞

      爸爸的貼心小棉襖,睡覺都要貼身上,光兒子的真羨慕!

      軍事要聞

      烏克蘭首都基輔遭空襲 死亡人數增至12人

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 理论片午午伦夜理片影院99| 日韩精品极品视频在线观看免费| 国内精品伊人久久久久AV一坑 | 天天插天天干天天操| 婷婷成人综合激情在线视频播放| 亚洲欧美日韩精品成人| 亚洲第一二三区日韩国产| 国产黄色av网址| 熟女丰满老熟女熟妇| 黄色Av电影| 亚洲精品无码人妻无码| 色五月婷婷色色网| 国产产在线精品亚洲aavv| 日韩av综合中文字幕| 亚洲女同精品久久女同| 国产高潮白浆喷| 中文字幕久精品免费视频蜜桃视频| 亚洲最大成人综合网| 国产精品尤物午夜福利| 国精偷拍一区二区三区| 日本午夜精品一区二区三区电影| 亚洲黄站| 黄页网址大全免费观看视频国产 | 国产福利影院| 熟女在线国产| 中文字幕精品人妻丝袜| 中文人妻AV高清一区二区| 久久久亚洲精品蜜桃臀| xxxx欧美| 好吊视频一区二区三区人妖| 99久久精品费精品国产一区二区| 国产精品午夜福利在线观看地址| 色欲AV永久无码精品无码蜜桃| 洋洋av| 久久精品国产亚洲av天海翼| 精品国产乱码久久久久APP下载| 婷婷99精品国产97久久综合| 国产精品资源管理站在线直播| 日韩中文字幕精品免费一区| 国内揄拍高清国内精品对白| 国产欧美精品一区二区三区-老狼 真实单亲乱l仑对白视频 |