這兩天,投資圈徹底炸了。
有知情人士爆料,AI明星公司DeepSeek正式啟動(dòng)成立以來的首次外部融資——目標(biāo)估值不低于100億美元,計(jì)劃募集至少3億美元資金。
而眾所周知,就在一年前梁文鋒還明確拒絕過VC投資,并對(duì)外表示“DeepSeek暫無融資計(jì)劃”。
當(dāng)時(shí),有知名投資者找了三撥人想約見,被拒絕;甚至與DeepSeek北京辦公室同樓辦公的百度風(fēng)投也沒能投進(jìn)去。
那個(gè)曾經(jīng)把所有投資人擋在門外的梁文鋒,為什么突然要錢了?
![]()
“從不融資”已是過去
消息一出,討論立刻分成了兩派。
一種說,完了,連DeepSeek都頂不住AI燒錢的壓力;另一種說,AI圈要變天了,梁文鋒這是要憋個(gè)大的。
但如果你只看到“缺錢”兩個(gè)字,就把梁文鋒和這件事看小了。
![]()
圖源:知乎
據(jù)悉,2023年7月,當(dāng)DeepSeek正式成立之時(shí),梁文鋒從第一天就給這家公司劃了一條清晰的紅線:不接受外部融資,不稀釋股權(quán),不被任何人的商業(yè)化時(shí)間表綁架。
他確實(shí)有這個(gè)底氣。梁文鋒是幻方量化的創(chuàng)始人,而幻方是國(guó)內(nèi)頂級(jí)的量化對(duì)沖基金,管理規(guī)模超700億元,2025年平均收益率高達(dá)56.6%。
早在2019年,他就花2億元自研了深度學(xué)習(xí)訓(xùn)練平臺(tái)螢火一號(hào),兩年后又砸10億元建螢火二號(hào),大批采購英偉達(dá)A100,把幻方做成了國(guó)內(nèi)屈指可數(shù)的萬卡集群公司。
有量化基金從業(yè)者估算,僅2025年一年,幻方就為梁文鋒帶來了超過7億美元的收入。
有錢、有卡、有人,這就是DeepSeek長(zhǎng)期拒絕融資的底氣。梁文鋒說得也很直白:VC都是幫LP管錢,都得賺錢,所以就談不到一塊去。
然而,在過去一年里,這個(gè)防火墻似乎被逐漸擊穿了。
當(dāng)下,AI大模型的競(jìng)賽,已經(jīng)到了決勝期或決勝期前夜。
3月31日,OpenAI剛以8520億美元的估值完成了1220億美元的融資。Anthropic在2月以3800億美元估值完成300億美元融資。
國(guó)內(nèi)同樣在加速,智譜AI已于1月登陸港股,IPO前完成8輪融資、累計(jì)募資超83億元。月之暗面Kimi更是在短短數(shù)月內(nèi)先后完成多輪融資,估值已突破100億美元。
當(dāng)身邊的競(jìng)品都在用市場(chǎng)化手段綁定人才、儲(chǔ)備算力,梁文鋒還能堅(jiān)持多久?
![]()
圖源:X
半導(dǎo)體研究機(jī)構(gòu)SemiAnalysis曾估算,DeepSeek的服務(wù)器總資本支出接近16億美元,其中9億多直接和運(yùn)行計(jì)算集群相關(guān)。而越往頂尖走,每往前追一步,邊際成本就越高。
從15秒跑到13秒,多練練就行;但從10秒跑到9秒9,每提升0.1秒,都要付出幾倍的努力和成本。這不是靠一家量化基金的利潤(rùn)就能無限支撐的。
此外,不少人認(rèn)為DeepSeek曾經(jīng)的優(yōu)勢(shì),在于對(duì)英偉達(dá)芯片的深度綁定和調(diào)教。
與多數(shù)依賴規(guī)模堆疊的大模型不同,DeepSeek是從“效率”入手,通過一系列算法與工程優(yōu)化,實(shí)現(xiàn)了接近SOTA水平的性能,同時(shí)大幅壓低成本。
但這種效率,一方面建立在梁文鋒早年量化交易積累的大量英偉達(dá)GPU資源之上,另一方面也深度依賴英偉達(dá)的CUDA生態(tài)。
一旦出現(xiàn)供應(yīng)鏈限制,整個(gè)公司的研發(fā)、訓(xùn)練、推理都可能受到嚴(yán)重影響。而當(dāng)前美國(guó)對(duì)高端芯片的出口管制持續(xù)收緊,英偉達(dá)最新一代Blackwell芯片的獲取存在一定限制。
多重壓力疊加之下,不是梁文鋒想通了,是他不得不通。
![]()
DeepSeek V4背后,梁文鋒的野心徹底暴露
很多人盯著融資的數(shù)字,卻忽略了這次事件里最影響行業(yè)格局的一件事:DeepSeek即將發(fā)布的V4模型,正在全力從英偉達(dá)的CUDA生態(tài)向華為昇騰芯片遷移。
結(jié)合前面所說,V4的技術(shù)野心,遠(yuǎn)超外界想象。
根據(jù)目前披露的信息,V4的參數(shù)規(guī)模躍升至萬億級(jí)別。它采用MoE架構(gòu),總參數(shù)約1萬億,但每個(gè)token僅激活約370億參數(shù),推理成本幾乎與V3持平——這個(gè)設(shè)計(jì)思路延續(xù)了DeepSeek一貫的效率優(yōu)先哲學(xué)。
上下文窗口擴(kuò)展到100萬token,并引入了一套名為Engram的條件記憶架構(gòu),實(shí)現(xiàn)超長(zhǎng)上下文的恒定時(shí)間檢索。據(jù)內(nèi)部測(cè)試,在100萬token長(zhǎng)度下的信息召回率達(dá)到97%,遠(yuǎn)超V3在128K上下文時(shí)的表現(xiàn)。
更重要的是,V4將是DeepSeek首個(gè)原生多模態(tài)模型,支持文本、圖像和視頻生成。此前DeepSeek的模型一直以純文本為主,而其他旗艦?zāi)P驮缫褤肀Ф嗄B(tài)。
據(jù)悉,該模型代碼能力也被大幅強(qiáng)化,內(nèi)部benchmark顯示SWE-bench成績(jī)超過80%,HumanEval達(dá)到90%,據(jù)稱V4能處理整個(gè)代碼倉庫級(jí)別的復(fù)雜bug修復(fù)。
此外,V4預(yù)計(jì)將分兩個(gè)版本發(fā)布:完整版超萬億參數(shù),面向華為昇騰芯片;輕量版約2000億參數(shù),面向通用對(duì)話和API服務(wù)。
![]()
圖源:抖音
當(dāng)然,行業(yè)的關(guān)注點(diǎn)不會(huì)停留在模型本身。
DeepSeek V4對(duì)華為昇騰算力生態(tài)的深度適配,大幅降低了對(duì)英偉達(dá)生態(tài)的依賴。這件事的意義之大,以至于英偉達(dá)創(chuàng)始人黃仁勛在近期采訪中公開表達(dá)了關(guān)注。
外媒爆料,黃仁勛私下表示,“如果有一天DeepSeek先在華為芯片上發(fā)布,那對(duì)我們來說將是一個(gè)可怕的結(jié)果”。
當(dāng)然,這條路并不好走。與英偉達(dá)CUDA生態(tài)的深度綁定,使得切換國(guó)產(chǎn)芯片需要“重寫”大量核心代碼,遷移成本高昂。
據(jù)多家行業(yè)媒體報(bào)道,DeepSeek原計(jì)劃今年2月發(fā)布V4,但因工程問題多次推遲,團(tuán)隊(duì)正在投入大量精力進(jìn)行適配遷移工作。這也是DeepSeek已有15個(gè)月沒有大版本更新的重要原因之一。
然而,這件事一旦做成,意義將遠(yuǎn)遠(yuǎn)超出DeepSeek自身。
它將成為全球第一個(gè)不依賴英偉達(dá)的頂尖AI大模型,為中國(guó)AI產(chǎn)業(yè)鏈的自主可控提供一個(gè)重要的技術(shù)支點(diǎn)。
從這個(gè)角度看,梁文鋒的融資,買的是算力,更是一個(gè)生態(tài)自主的機(jī)會(huì)。
![]()
融資的深層邏輯
那么,除了這些,融資的真正意義是什么?
首先,融資解決了期權(quán)定價(jià)的問題。
DeepSeek此前一直沒有進(jìn)行大規(guī)模市場(chǎng)化融資,公司估值沒有明確的市場(chǎng)標(biāo)尺,團(tuán)隊(duì)成員手里的期權(quán)價(jià)值缺少清晰的參照。
這次融資,通過市場(chǎng)化方式給公司定了估值,本質(zhì)上就是給團(tuán)隊(duì)搭建了合理的長(zhǎng)期激勵(lì)體系。這比給員工漲工資更重要——在AI這個(gè)高度依賴頂級(jí)人才的行業(yè),沒有市場(chǎng)化的激勵(lì)機(jī)制,留人就是一句空話。
其次,融資為V4的研發(fā)和部署提供了彈藥。
V4要實(shí)現(xiàn)萬億參數(shù)、適配國(guó)產(chǎn)芯片、做到原生多模態(tài),每一項(xiàng)都是燒錢的大工程。雖然幻方量化持續(xù)為DeepSeek供血,但AI大模型競(jìng)賽的本質(zhì)已經(jīng)變了——這不是接下來一兩年可以結(jié)束的,未來三年有可能爭(zhēng)出個(gè)分曉。
梁文鋒這次啟動(dòng)融資,核心就是為了長(zhǎng)期研發(fā)儲(chǔ)備充足的算力彈藥。
第三,融資開啟了商業(yè)化的通道。
DeepSeek的開源路線決定了它的商業(yè)化路徑必須走差異化。閉源玩家的商業(yè)化路徑更清晰,但DeepSeek必須通過API調(diào)用和企業(yè)定制來變現(xiàn)。
而企業(yè)級(jí)客戶,尤其是政府客戶和大型國(guó)企,選擇AI供應(yīng)商時(shí),看的不是技術(shù)指標(biāo),而是資質(zhì)和背景。
本輪融資如果引入國(guó)有資本,意味著DeepSeek可能獲得政府AI項(xiàng)目的優(yōu)先供應(yīng)商資格;美元基金入場(chǎng),則為國(guó)際化擴(kuò)張鋪平了資質(zhì)道路。
但融資也帶來了一個(gè)無法回避的問題:DeepSeek正在從一家“例外”走向一家正常的商業(yè)公司。
過去DeepSeek最特殊的地方,恰恰在于它不像一家典型AI公司。它背后有幻方量化供血,梁文鋒不急著融資,也不急著把公司推上估值、商業(yè)化和資本退出的流水線。
DeepSeek對(duì)自己的定位,與其說是一家商業(yè)公司,不如說更像是一個(gè)完全獨(dú)立于資本市場(chǎng)而運(yùn)作的開源研究機(jī)構(gòu)。
但今天的AI競(jìng)爭(zhēng)已經(jīng)不是單點(diǎn)模型能力的競(jìng)爭(zhēng)了。
字節(jié)有豆包、有即夢(mèng),阿里和騰訊開始把世界模型推到臺(tái)前,智譜、MiniMax已經(jīng)登陸港股。
如果只看DeepSeek至少100億美元的估值,它當(dāng)然還是一家很貴的AI公司。可放在今天的中國(guó)AI坐標(biāo)系里,智譜、MiniMax在港股高點(diǎn)的市值都曾突破3000億港元,月之暗面最新估值已經(jīng)達(dá)到了180億美元。
DeepSeek過去可以靠技術(shù)理想和開源聲望行走江湖。但當(dāng)行業(yè)從技術(shù)競(jìng)賽轉(zhuǎn)向生態(tài)和商業(yè)化競(jìng)爭(zhēng),一家公司終究需要治理結(jié)構(gòu)、估值體系、薪酬激勵(lì)、商業(yè)化收入和長(zhǎng)期預(yù)算。
研究理想可以繼續(xù)存在,但公司終究要面對(duì)現(xiàn)實(shí)。
不是理想不好,是現(xiàn)實(shí)太貴。算力成本在漲,人才價(jià)格在漲,競(jìng)爭(zhēng)對(duì)手的估值在漲——當(dāng)所有生產(chǎn)要素都在漲價(jià),技術(shù)理想主義本身也在漲價(jià)。
梁文鋒用三年時(shí)間證明了一件事:用更少的錢可以做出很好的模型。但現(xiàn)在他需要證明另一件事:用市場(chǎng)化的方式,能不能讓這家公司走得更遠(yuǎn)。
畢竟,AGI不是靠理想就能抵達(dá)的。
作者| 劉峰
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.