<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      DeepSeek-V4終于更新了!一百萬超長上下文,Agent能力大幅增強,能力接近Opus 4.6

      0
      分享至

      剛剛,期待已久的DeepSeek-V4 終于更新了。

      DeepSeek 正式上線并開源了 DeepSeek-V4 的預(yù)覽版,分為 Pro 和 Flash 兩個版本。DeepSeek-V4 擁有百萬字超長上下文,在 Agent 能力、世界知識和推理性能上均實現(xiàn)國內(nèi)與開源領(lǐng)域的領(lǐng)先。

      這次的更新力度不小,有兩個核心變化:一是,V4 擁有 1M 的超長上下文,1M 上下文已經(jīng)成為了標(biāo)配;二是,Agent 能力大幅的增強。

      DeepSeek 官方提到,V4-Pro 在 Agentic Coding 評測中已經(jīng)達(dá)到了當(dāng)前開源模型最佳水平,也是公司內(nèi)部員工日常在使用的 Agentic Coding 模型。據(jù)內(nèi)部員工評測,V4-Pro 的反饋體驗優(yōu)于 Sonnet 4.5,交付質(zhì)量接近 Opus 4.6 非思考模式。

      目前,DeepSeek-V4 已經(jīng)在官網(wǎng)、官方 App 中上線,用戶可以直接體驗。同時,API 也已同步上線,model_name 改為 deepseek-v4-pro 或 deepseek-v4-flash 即可調(diào)用。

      ??關(guān)注 Founder Park,最及時最干貨的創(chuàng)業(yè)分享

      Founder Park 正在持續(xù)尋找值得被看見的 AI 團隊與項目。

      我們將通過「AI 產(chǎn)品市集」、內(nèi)容報道、社群分發(fā)等方式,幫你觸達(dá)早期用戶、獲得真實反饋,以及建立關(guān)鍵連接。

      如果你正在做 AI 相關(guān)的事,歡迎和我們聊聊。

      01兩款新模型:Flash、Pro 版本

      此次更新的 DeepSeek-V4 模型,按大小分為兩個版本:DeepSeek-V4-Pro 和 DeepSeek-V4-Flash。


      V4-Pro 擁有 1.6T 總參數(shù)、49B 激活參數(shù);V4-Flash 為 284B 總參數(shù)、13B 激活參數(shù),兩款模型均原生支持 1M token 的上下文長度。

      此外,V4-Flash 在 32T tokens 上完成預(yù)訓(xùn)練,V4-Pro 則在 33T tokens 上完成預(yù)訓(xùn)練。

      DeepSeek-V4-Pro是這次發(fā)布的旗艦版本,各項能力均對標(biāo)頂級閉源模型。


      其中,Agent 能力是突出的升級方向。在 Agentic Coding 評測中,V4-Pro 已達(dá)到當(dāng)前開源模型最佳水平,并在其他 Agent 相關(guān)評測中同樣表現(xiàn)優(yōu)異。據(jù) DeepSeek 內(nèi)部員工評測反饋,使用體驗優(yōu)于 Sonnet 4.5,交付質(zhì)量接近 Opus 4.6 非思考模式,但與 Opus 4.6 思考模式仍存在一定差距。

      值得一提的是,V4-Pro 還針對 Claude Code、OpenClaw、OpenCode、CodeBuddy 等主流 Agent 產(chǎn)品進(jìn)行了專項適配和優(yōu)化,在代碼任務(wù)、文檔生成任務(wù)等方面的表現(xiàn)均有提升。

      世界知識方面,V4-Pro 在測評中大幅領(lǐng)先其他開源模型,僅稍遜于頂尖閉源模型 Gemini-Pro-3.1。

      推理性能同樣亮眼,在數(shù)學(xué)、STEM、競賽型代碼的測評中,V4-Pro 超越了當(dāng)前所有已公開評測的開源模型,取得了比肩世界頂級閉源模型的成績。


      DeepSeek-V4-Flash則是更多面向?qū)Τ杀竞退俣雀舾械膱鼍啊O啾扔?V4-Pro,V4-Flash 在世界知識儲備方面稍遜,但推理能力接近。

      由于模型參數(shù)和激活更小,Flash 版能夠提供更加快捷、經(jīng)濟的 API 服務(wù)。在 Agent 評測中,V4-Flash 在簡單任務(wù)上與 V4-Pro 相當(dāng),但在高難度任務(wù)上仍有一定差距。

      02提出全新的注意力機制
      一百萬上下文成為標(biāo)配

      DeepSeek 官方特別提到,DeepSeek-V4 使用了一種全新的注意力機制,在 token 維度進(jìn)行壓縮,結(jié)合 DSA 稀疏注意力(DeepSeek Sparse Attention),實現(xiàn)了全球領(lǐng)先的長上下文能力。同時,相比傳統(tǒng)方法大幅降低了對計算和顯存的需求。從現(xiàn)在起,一百萬上下文將是 DeepSeek 所有官方服務(wù)的標(biāo)配。


      DeepSeek-V4 和 DeepSeek-V3.2 的計算量和顯存容量隨上下文長度的變化

      DeepSeek-V4 的技術(shù)報告中提到,這次架構(gòu)升級包含了三項核心創(chuàng)新:

      • CSA+HCA 混合注意力機制(Compressed Sparse Attention 與 Heavily Compressed Attention),這是實現(xiàn)超長上下文高效處理的核心所在;

      • mHC(Manifold-Constrained Hyper-Connections,流形約束超連接),用于強化傳統(tǒng)殘差連接,提升信號在層間傳播的穩(wěn)定性;

      • 引入Muon 優(yōu)化器,帶來更快的收斂速度與更穩(wěn)定的訓(xùn)練過程;

      在效率層面,技術(shù)報告同樣給出了更具體的量化數(shù)據(jù):在 1M token 上下文場景下,V4-Pro 的單 token 推理 FLOPs 僅為 DeepSeek-V3.2 的27%,KV Cache 大小僅為10%。V4-Flash 的效率提升更為激進(jìn),F(xiàn)LOPs 僅為10%,KV Cache 僅為7%

      03官網(wǎng)、App、API 同步上線,即日可用

      目前,DeepSeek API 已經(jīng)同步上線了 V4-Pro 和 V4-Flash,支持 OpenAI ChatCompletions 接口與 Anthropic 接口。訪問新模型時,base_url 不變,model 參數(shù)改為 deepseek-v4-pro 或 deepseek-v4-flash 即可。

      V4-Pro 與 V4-Flash 最大上下文長度均為 1M,同時支持非思考模式與思考模式。其中思考模式支持通過 reasoning_effort 參數(shù)設(shè)置思考強度(high / max)。對于復(fù)雜的 Agent 場景,DeepSeek 官方建議使用思考模式并將強度設(shè)置為 max。


      需要注意的是,舊有的兩個模型名 deepseek-chat 與 deepseek-reasoner 將于三個月后(2026-07-24)停止使用。當(dāng)前階段內(nèi),這兩個模型名分別對應(yīng)的是 deepseek-v4-flash 的非思考模式與思考模式。

      更詳細(xì)的調(diào)用方式請參考官方文檔:api-docs.deepseek.com

      開源權(quán)重和本地部署

      • DeepSeek-V4 模型開源鏈接:

      https://huggingface.co/collections/deepseek-ai/deepseek-v4

      https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

      • DeepSeek-V4 技術(shù)報告:

      https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf


      轉(zhuǎn)載原創(chuàng)文章請?zhí)砑游⑿牛篺ounderparker

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      兒子說想給自己做床蠶絲被,一家三口網(wǎng)購了1萬粒蠶卵!如今12000條蠶寶寶每天要吃30斤桑葉……媽媽:崩潰并快樂著

      兒子說想給自己做床蠶絲被,一家三口網(wǎng)購了1萬粒蠶卵!如今12000條蠶寶寶每天要吃30斤桑葉……媽媽:崩潰并快樂著

      都市快報橙柿互動
      2026-05-19 00:29:55
      為什么75寸電視才2500?不是買不起,是真的沒必要買

      為什么75寸電視才2500?不是買不起,是真的沒必要買

      老特有話說
      2026-05-18 16:32:15
      特朗普:可能不得不再給伊朗猛烈一擊!北約也設(shè)下最后期限:若霍爾木茲海峽7月初未開放,將考慮護(hù)航

      特朗普:可能不得不再給伊朗猛烈一擊!北約也設(shè)下最后期限:若霍爾木茲海峽7月初未開放,將考慮護(hù)航

      每日經(jīng)濟新聞
      2026-05-20 00:56:10
      萬萬沒想到,特朗普又立“大功”,大量頂尖人才被他“送回”中國

      萬萬沒想到,特朗普又立“大功”,大量頂尖人才被他“送回”中國

      愛意隨風(fēng)起呀
      2026-05-19 20:14:30
      女人最吃的這幾種肢體觸摸,第二種一摸就心動,五十歲以上更管用

      女人最吃的這幾種肢體觸摸,第二種一摸就心動,五十歲以上更管用

      匹夫來搞笑
      2026-05-20 00:56:06
      情侶遛狗時發(fā)現(xiàn)湖里鴨子發(fā)出喵喵叫,一看竟是鴨子馱著幼貓在游動

      情侶遛狗時發(fā)現(xiàn)湖里鴨子發(fā)出喵喵叫,一看竟是鴨子馱著幼貓在游動

      半島晨報
      2026-05-19 13:15:03
      生意太好被處處刁難,屠夫6天殺13人,公安部A級通緝犯石悅軍落網(wǎng)

      生意太好被處處刁難,屠夫6天殺13人,公安部A級通緝犯石悅軍落網(wǎng)

      易玄
      2026-05-18 23:06:35
      爆雷!知名品牌天津店跑路?全國多地消費者維權(quán)!收了錢不回復(fù)!

      爆雷!知名品牌天津店跑路?全國多地消費者維權(quán)!收了錢不回復(fù)!

      天津生活通
      2026-05-19 21:05:01
      商家稱校園買家購45把雨傘全損退貨!校方:好像有班級運動會用了 具體還需再核實

      商家稱校園買家購45把雨傘全損退貨!校方:好像有班級運動會用了 具體還需再核實

      閃電新聞
      2026-05-19 21:34:39
      隨著馬刺勝雷霆,1-0領(lǐng)先,我必須承認(rèn)5個現(xiàn)實:總冠軍失去懸念

      隨著馬刺勝雷霆,1-0領(lǐng)先,我必須承認(rèn)5個現(xiàn)實:總冠軍失去懸念

      籃球掃地僧
      2026-05-19 14:00:14
      深度科普:狗交配過程為何會很難分開?下次看到狗交配請默默離開

      深度科普:狗交配過程為何會很難分開?下次看到狗交配請默默離開

      宇宙時空
      2026-05-18 17:30:14
      美國百萬顏值網(wǎng)紅出庭受審,卻被英俊法官氣場碾壓,引全網(wǎng)熱議

      美國百萬顏值網(wǎng)紅出庭受審,卻被英俊法官氣場碾壓,引全網(wǎng)熱議

      譯言
      2026-05-19 08:18:57
      35萬的瑪莎拉蒂,刺痛了多少豪車玩家!

      35萬的瑪莎拉蒂,刺痛了多少豪車玩家!

      蔣東文
      2026-05-19 21:24:32
      垃圾食品清單已列出,燕麥片排第2,排第1的很多人喜歡吃

      垃圾食品清單已列出,燕麥片排第2,排第1的很多人喜歡吃

      路醫(yī)生健康科普
      2026-05-17 19:35:03
      2026必知:強奸、通奸、嫖娼,法律定性與處罰全解讀

      2026必知:強奸、通奸、嫖娼,法律定性與處罰全解讀

      周哥一影視
      2026-05-19 14:15:11
      在岸人民幣兌美元較周一夜盤收盤跌127點

      在岸人民幣兌美元較周一夜盤收盤跌127點

      財聯(lián)社
      2026-05-20 03:10:12
      馬斯克再放話:年底全美鋪開無人出租車,德州僅30輛

      馬斯克再放話:年底全美鋪開無人出租車,德州僅30輛

      碳基打工人
      2026-05-19 00:42:10
      上次奪冠還是大帝時代,阿森納傳奇亨利轉(zhuǎn)發(fā)球隊奪冠海報

      上次奪冠還是大帝時代,阿森納傳奇亨利轉(zhuǎn)發(fā)球隊奪冠海報

      懂球帝
      2026-05-20 06:25:33
      8黃代價!海港“臟”戰(zhàn)術(shù)擊倒成都蓉城,急了:劉殿座轉(zhuǎn)身射門

      8黃代價!海港“臟”戰(zhàn)術(shù)擊倒成都蓉城,急了:劉殿座轉(zhuǎn)身射門

      足球大腕
      2026-05-19 23:27:04
      黃仁勛貼身女助理身份曝光!哈佛畢業(yè)年薪125萬美金,亞裔學(xué)霸

      黃仁勛貼身女助理身份曝光!哈佛畢業(yè)年薪125萬美金,亞裔學(xué)霸

      魔都姐姐雜談
      2026-05-18 19:18:22
      2026-05-20 06:36:49
      FounderPark incentive-icons
      FounderPark
      關(guān)注AI創(chuàng)業(yè),專注和創(chuàng)業(yè)者聊真問題
      1217文章數(shù) 162關(guān)注度
      往期回顧 全部

      科技要聞

      馬斯克敗訴,法院判他起訴OpenAI太晚了

      頭條要聞

      媒體:特朗普為何拋涉臺"四不"說法 魯比奧解釋清楚了

      頭條要聞

      媒體:特朗普為何拋涉臺"四不"說法 魯比奧解釋清楚了

      體育要聞

      文班亞馬:沒拿到MVP,就證明自己是MVP

      娛樂要聞

      姚晨刪博難平眾怒,為什么她還能蹦噠

      財經(jīng)要聞

      潔麗雅硬剛豪門內(nèi)斗傳言

      汽車要聞

      煥新極氪009上市41.38萬起 齊家版讓MPV回歸家庭

      態(tài)度原創(chuàng)

      教育
      旅游
      親子
      藝術(shù)
      軍事航空

      教育要聞

      “以后照樣找不到工作”,家長凌晨送高中生上學(xué),網(wǎng)友卻看清現(xiàn)實

      旅游要聞

      從景點打卡到全城漫游,“中國旅游日”上海推百余項活動打造初夏文旅盛宴

      親子要聞

      媽媽你看!娜塔莎生孩子了!暴力擦邊影響心智尚未成熟的未成年人

      藝術(shù)要聞

      李克農(nóng)將軍書法,字字皆是大將風(fēng)范!

      軍事要聞

      特朗普暫緩打擊伊朗 稱系應(yīng)中東三國請求

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 欧美三级在线| 免费一级欧美在线大片| 视频一区二区三区四区不卡| 先锋影音av成人| 成人影院免费观看在线播放视频| 依依成人精品视频在线观看| 无码ol丝袜高跟秘书在线观看| 亚洲国产精品浪潮AV| 99精品国产成人一区二区| 免费看视频的网站| 97免费人妻在线视频| 午夜激成人免费视频在线观看| 国产精品亚洲四区在线观看| 国产一码二码三码区别| 亚洲av免费成人精品区| 亚洲熟妇无码成人A片| 亚洲成人精品| 国产蜜芽尤物在线一区| 久久久精品久久久久久96| 中文字幕日韩精品国产| 亚洲日本韩国欧美云霸高清| 国产99久久精品一区二区| 精品人妻123| 久久精品国产亚洲婷婷| 综合一区亚洲| 久久精品道一区二区三区| 深夜福利导航| 实拍女处破www免费看| 亚洲av中文一区二区| 精品人妻无码一区二区三区四川人| 色综合网天天综合色中文| 蜜臂aV| 国产成人精选视频在线观看| 婷婷色国产精品视频一区| 国产成人在线观看网站| 亚洲 欧美 动漫 少妇 自拍| 中文字幕99国产精品| 男人天堂2025| 亚洲免费成人小说| 亚洲伊人久久大香线蕉AV| 久久精品亚洲热综合一区二区|