這兩天,AI圈又炸了。
不是什么新模型刷榜,也不是哪家大廠融資,是一條看起來有點"低調(diào)"的消息——
DeepSeek V4要來了。
而且,這次不一樣。
![]()
01 真正的大事
4月8號,DeepSeek網(wǎng)頁端悄悄上線了兩個模式:"快速模式"和"專家模式"。
聽起來好像就是個產(chǎn)品更新對吧?
但業(yè)內(nèi)人都懂,這是在給V4鋪路。
因為就在這兩天,DeepSeek創(chuàng)始人梁文鋒在內(nèi)部透露:V4會在4月下旬正式發(fā)布。
萬億參數(shù)。
百萬級上下文窗口。
這些數(shù)字聽起來很嚇人,但真正讓我停下來想了一晚上的,是另一件事——
首次實現(xiàn)與華為昇騰等國產(chǎn)芯片的深度適配。
我再說一遍:首次。
02 等了多久
這個問題,可能很多人沒有概念。
過去幾年,中國AI公司訓(xùn)模型,基本只有一個選擇:英偉達(dá)的CUDA生態(tài)。
你用國產(chǎn)芯片?可以,但適配成本極高,性能損耗巨大,最后還是得回到英偉達(dá)的懷抱。
這就是所謂的"卡脖子"——不是芯片造不出來,是你的芯片跑不動主流模型。
DeepSeek這次做的事,本質(zhì)上是打開了一個缺口。
"去CUDA化"這個口號,喊了很多年,終于有人真的邁出去了。
而且不是玩票性質(zhì)的兼容測試,是"深度適配"。
這意味著什么?
意味著以后訓(xùn)模型,國產(chǎn)芯片真的能用了。
03 大廠已經(jīng)動手了
消息剛出來,阿里、字節(jié)、騰訊已經(jīng)行動了。
據(jù)媒體報道,這三家預(yù)訂了數(shù)十萬片新一代AI算力芯片。
為什么這么急?
因為誰先拿到算力,誰就能先上線新模型。
而DeepSeek這次的"快速+專家"雙模式,明顯是在告訴市場:
我們準(zhǔn)備好了。
快速模式適合日常對話,響應(yīng)快,能識別圖片和文件;專家模式擅長復(fù)雜任務(wù),支持深度思考和智能搜索。
這說明什么?
說明DeepSeek正在構(gòu)建一個完整的模型矩陣——
以后可能還會有更輕量的、更深度、更多模態(tài)的不同入口。
這不是一個模型發(fā)布,是一整個生態(tài)在成型。
04 更大的意義
說點更遠(yuǎn)的。
過去一年,中國AI最缺的是什么?
不是錢,不是人,是信心。
每次有新模型發(fā)布,總有人問:這是不是又套殼?能不能自主可控?國產(chǎn)芯片什么時候能用?
這些問題,DeepSeek V4給出了一部分答案。
萬億參數(shù)、百萬上下文,這是硬實力的體現(xiàn);
國產(chǎn)芯片深度適配,這是生態(tài)獨立的開始。
當(dāng)然,我說的是"開始",不是"完成"。
CUDA生態(tài)積累了十幾年,國產(chǎn)芯片要追上,還有很長的路要走。
但至少,這條路現(xiàn)在有人走了。
05 寫在最后
這幾天我一直在想一個問題:
中國AI到底需要什么?
是更多的大模型嗎?是更多的論文嗎?是更多的融資嗎?
可能都不是。
我們需要的,是一次次真實的、可驗證的突破。
DeepSeek V4是不是這個突破?
現(xiàn)在下結(jié)論還為時過早。
但有一點是確定的:
每一次這樣的嘗試,都在把中國AI往前推一小步。
愿這些一小步,最終能匯聚成我們真正想看到的那個未來。
磨平一些信息差。
這好像,就是我為數(shù)不多能做的。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.