4月24日,萬眾期待的DeepSeek V4終于發(fā)布了。
一共兩個(gè)版本:
DeepSeek-V4-Pro:對(duì)標(biāo)頂級(jí)閉源模型,1.6T,49B激活,上下文長度1M。
DeepSeek-V4-Flash:更小更快的經(jīng)濟(jì)版,284B,13B激活,上下文長度1M。
DeepSeek宣稱:“在Agent能力、世界知識(shí)和推理性能上均實(shí)現(xiàn)國內(nèi)與開源領(lǐng)域的領(lǐng)先。”
據(jù)公司評(píng)測(cè),DeepSeek-V4使用體驗(yàn)優(yōu)于美國AI巨頭Anthropic發(fā)布的Sonnet 4.5,交付質(zhì)量接近Opus 4.6非思考模式。不過,仍與Opus 4.6思考模型存在一定差距。
并且,下半年將支持華為算力。
DeepSeek V4開創(chuàng)了一種全新的注意力機(jī)制,在token維度進(jìn)行壓縮,結(jié)合DSA稀疏注意力一起用。相比傳統(tǒng)方法,對(duì)計(jì)算和顯存的需求大幅降低。
另一個(gè)備受關(guān)注的信息是,梁文鋒終于對(duì)外部融資松了口。
據(jù)《財(cái)經(jīng)》報(bào)道,DeepSeek正在洽談融資,投資方為騰訊與阿里巴巴,兩家投資方預(yù)計(jì)共計(jì)投資18億美元。DeepSeek本輪融資的估值約200億美元。
截至目前,DeepSeek、騰訊、阿里三方均未公開確認(rèn)或回應(yīng)上述投資意向及具體數(shù)據(jù)。
除了研發(fā)投入的壓力,DeepSeek融資的更重要原因嗎,或許是因?yàn)榻谌瞬帕魇闆r比較嚴(yán)重。
2025年下半年開始,DeepSeek的“江湖地位”開始動(dòng)搖,未能保住C端用戶量第一的位置,而且不少公司都在積極挖角DeepSeek的員工。
DeepSeek終于全面出手了,這一次,或?qū)⒃僖淮螖噭?dòng)AI風(fēng)云。
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.