網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

梁文鋒終于低頭，DeepSeek首輪融資曝光

2026-04-21 14:34:17　來源: 科技頭版Pro

廣東舉報(bào)

分享至

這兩天，投資圈徹底炸了。

有知情人士爆料，AI明星公司DeepSeek正式啟動(dòng)成立以來的首次外部融資——目標(biāo)估值不低于100億美元，計(jì)劃募集至少3億美元資金。

而眾所周知，就在一年前梁文鋒還明確拒絕過VC投資，并對(duì)外表示“DeepSeek暫無融資計(jì)劃”。

當(dāng)時(shí)，有知名投資者找了三撥人想約見，被拒絕；甚至與DeepSeek北京辦公室同樓辦公的百度風(fēng)投也沒能投進(jìn)去。

那個(gè)曾經(jīng)把所有投資人擋在門外的梁文鋒，為什么突然要錢了？

“從不融資”已是過去

消息一出，討論立刻分成了兩派。

一種說，完了，連DeepSeek都頂不住AI燒錢的壓力；另一種說，AI圈要變天了，梁文鋒這是要憋個(gè)大的。

但如果你只看到“缺錢”兩個(gè)字，就把梁文鋒和這件事看小了。

圖源：知乎

據(jù)悉，2023年7月，當(dāng)DeepSeek正式成立之時(shí)，梁文鋒從第一天就給這家公司劃了一條清晰的紅線：不接受外部融資，不稀釋股權(quán)，不被任何人的商業(yè)化時(shí)間表綁架。

他確實(shí)有這個(gè)底氣。梁文鋒是幻方量化的創(chuàng)始人，而幻方是國(guó)內(nèi)頂級(jí)的量化對(duì)沖基金，管理規(guī)模超700億元，2025年平均收益率高達(dá)56.6%。

早在2019年，他就花2億元自研了深度學(xué)習(xí)訓(xùn)練平臺(tái)螢火一號(hào)，兩年后又砸10億元建螢火二號(hào)，大批采購英偉達(dá)A100，把幻方做成了國(guó)內(nèi)屈指可數(shù)的萬卡集群公司。

有量化基金從業(yè)者估算，僅2025年一年，幻方就為梁文鋒帶來了超過7億美元的收入。

有錢、有卡、有人，這就是DeepSeek長(zhǎng)期拒絕融資的底氣。梁文鋒說得也很直白：VC都是幫LP管錢，都得賺錢，所以就談不到一塊去。

然而，在過去一年里，這個(gè)防火墻似乎被逐漸擊穿了。

當(dāng)下，AI大模型的競(jìng)賽，已經(jīng)到了決勝期或決勝期前夜。

3月31日，OpenAI剛以8520億美元的估值完成了1220億美元的融資。Anthropic在2月以3800億美元估值完成300億美元融資。

國(guó)內(nèi)同樣在加速，智譜AI已于1月登陸港股，IPO前完成8輪融資、累計(jì)募資超83億元。月之暗面Kimi更是在短短數(shù)月內(nèi)先后完成多輪融資，估值已突破100億美元。

當(dāng)身邊的競(jìng)品都在用市場(chǎng)化手段綁定人才、儲(chǔ)備算力，梁文鋒還能堅(jiān)持多久？

圖源：X

半導(dǎo)體研究機(jī)構(gòu)SemiAnalysis曾估算，DeepSeek的服務(wù)器總資本支出接近16億美元，其中9億多直接和運(yùn)行計(jì)算集群相關(guān)。而越往頂尖走，每往前追一步，邊際成本就越高。

從15秒跑到13秒，多練練就行；但從10秒跑到9秒9，每提升0.1秒，都要付出幾倍的努力和成本。這不是靠一家量化基金的利潤(rùn)就能無限支撐的。

此外，不少人認(rèn)為DeepSeek曾經(jīng)的優(yōu)勢(shì)，在于對(duì)英偉達(dá)芯片的深度綁定和調(diào)教。

與多數(shù)依賴規(guī)模堆疊的大模型不同，DeepSeek是從“效率”入手，通過一系列算法與工程優(yōu)化，實(shí)現(xiàn)了接近SOTA水平的性能，同時(shí)大幅壓低成本。

但這種效率，一方面建立在梁文鋒早年量化交易積累的大量英偉達(dá)GPU資源之上，另一方面也深度依賴英偉達(dá)的CUDA生態(tài)。

一旦出現(xiàn)供應(yīng)鏈限制，整個(gè)公司的研發(fā)、訓(xùn)練、推理都可能受到嚴(yán)重影響。而當(dāng)前美國(guó)對(duì)高端芯片的出口管制持續(xù)收緊，英偉達(dá)最新一代Blackwell芯片的獲取存在一定限制。

多重壓力疊加之下，不是梁文鋒想通了，是他不得不通。

DeepSeek V4背后，梁文鋒的野心徹底暴露

很多人盯著融資的數(shù)字，卻忽略了這次事件里最影響行業(yè)格局的一件事：DeepSeek即將發(fā)布的V4模型，正在全力從英偉達(dá)的CUDA生態(tài)向華為昇騰芯片遷移。

結(jié)合前面所說，V4的技術(shù)野心，遠(yuǎn)超外界想象。

根據(jù)目前披露的信息，V4的參數(shù)規(guī)模躍升至萬億級(jí)別。它采用MoE架構(gòu)，總參數(shù)約1萬億，但每個(gè)token僅激活約370億參數(shù)，推理成本幾乎與V3持平——這個(gè)設(shè)計(jì)思路延續(xù)了DeepSeek一貫的效率優(yōu)先哲學(xué)。

上下文窗口擴(kuò)展到100萬token，并引入了一套名為Engram的條件記憶架構(gòu)，實(shí)現(xiàn)超長(zhǎng)上下文的恒定時(shí)間檢索。據(jù)內(nèi)部測(cè)試，在100萬token長(zhǎng)度下的信息召回率達(dá)到97%，遠(yuǎn)超V3在128K上下文時(shí)的表現(xiàn)。

更重要的是，V4將是DeepSeek首個(gè)原生多模態(tài)模型，支持文本、圖像和視頻生成。此前DeepSeek的模型一直以純文本為主，而其他旗艦?zāi)Ｐ驮缫褤肀Ф嗄B(tài)。

據(jù)悉，該模型代碼能力也被大幅強(qiáng)化，內(nèi)部benchmark顯示SWE-bench成績(jī)超過80%，HumanEval達(dá)到90%，據(jù)稱V4能處理整個(gè)代碼倉庫級(jí)別的復(fù)雜bug修復(fù)。

此外，V4預(yù)計(jì)將分兩個(gè)版本發(fā)布：完整版超萬億參數(shù)，面向華為昇騰芯片；輕量版約2000億參數(shù)，面向通用對(duì)話和API服務(wù)。

圖源：抖音

當(dāng)然，行業(yè)的關(guān)注點(diǎn)不會(huì)停留在模型本身。

DeepSeek V4對(duì)華為昇騰算力生態(tài)的深度適配，大幅降低了對(duì)英偉達(dá)生態(tài)的依賴。這件事的意義之大，以至于英偉達(dá)創(chuàng)始人黃仁勛在近期采訪中公開表達(dá)了關(guān)注。

外媒爆料，黃仁勛私下表示，“如果有一天DeepSeek先在華為芯片上發(fā)布，那對(duì)我們來說將是一個(gè)可怕的結(jié)果”。

當(dāng)然，這條路并不好走。與英偉達(dá)CUDA生態(tài)的深度綁定，使得切換國(guó)產(chǎn)芯片需要“重寫”大量核心代碼，遷移成本高昂。

據(jù)多家行業(yè)媒體報(bào)道，DeepSeek原計(jì)劃今年2月發(fā)布V4，但因工程問題多次推遲，團(tuán)隊(duì)正在投入大量精力進(jìn)行適配遷移工作。這也是DeepSeek已有15個(gè)月沒有大版本更新的重要原因之一。

然而，這件事一旦做成，意義將遠(yuǎn)遠(yuǎn)超出DeepSeek自身。

它將成為全球第一個(gè)不依賴英偉達(dá)的頂尖AI大模型，為中國(guó)AI產(chǎn)業(yè)鏈的自主可控提供一個(gè)重要的技術(shù)支點(diǎn)。

從這個(gè)角度看，梁文鋒的融資，買的是算力，更是一個(gè)生態(tài)自主的機(jī)會(huì)。

融資的深層邏輯

那么，除了這些，融資的真正意義是什么？

首先，融資解決了期權(quán)定價(jià)的問題。

DeepSeek此前一直沒有進(jìn)行大規(guī)模市場(chǎng)化融資，公司估值沒有明確的市場(chǎng)標(biāo)尺，團(tuán)隊(duì)成員手里的期權(quán)價(jià)值缺少清晰的參照。

這次融資，通過市場(chǎng)化方式給公司定了估值，本質(zhì)上就是給團(tuán)隊(duì)搭建了合理的長(zhǎng)期激勵(lì)體系。這比給員工漲工資更重要——在AI這個(gè)高度依賴頂級(jí)人才的行業(yè)，沒有市場(chǎng)化的激勵(lì)機(jī)制，留人就是一句空話。

其次，融資為V4的研發(fā)和部署提供了彈藥。

V4要實(shí)現(xiàn)萬億參數(shù)、適配國(guó)產(chǎn)芯片、做到原生多模態(tài)，每一項(xiàng)都是燒錢的大工程。雖然幻方量化持續(xù)為DeepSeek供血，但AI大模型競(jìng)賽的本質(zhì)已經(jīng)變了——這不是接下來一兩年可以結(jié)束的，未來三年有可能爭(zhēng)出個(gè)分曉。

梁文鋒這次啟動(dòng)融資，核心就是為了長(zhǎng)期研發(fā)儲(chǔ)備充足的算力彈藥。

第三，融資開啟了商業(yè)化的通道。

DeepSeek的開源路線決定了它的商業(yè)化路徑必須走差異化。閉源玩家的商業(yè)化路徑更清晰，但DeepSeek必須通過API調(diào)用和企業(yè)定制來變現(xiàn)。

而企業(yè)級(jí)客戶，尤其是政府客戶和大型國(guó)企，選擇AI供應(yīng)商時(shí)，看的不是技術(shù)指標(biāo)，而是資質(zhì)和背景。

本輪融資如果引入國(guó)有資本，意味著DeepSeek可能獲得政府AI項(xiàng)目的優(yōu)先供應(yīng)商資格；美元基金入場(chǎng)，則為國(guó)際化擴(kuò)張鋪平了資質(zhì)道路。

但融資也帶來了一個(gè)無法回避的問題：DeepSeek正在從一家“例外”走向一家正常的商業(yè)公司。

過去DeepSeek最特殊的地方，恰恰在于它不像一家典型AI公司。它背后有幻方量化供血，梁文鋒不急著融資，也不急著把公司推上估值、商業(yè)化和資本退出的流水線。

DeepSeek對(duì)自己的定位，與其說是一家商業(yè)公司，不如說更像是一個(gè)完全獨(dú)立于資本市場(chǎng)而運(yùn)作的開源研究機(jī)構(gòu)。

但今天的AI競(jìng)爭(zhēng)已經(jīng)不是單點(diǎn)模型能力的競(jìng)爭(zhēng)了。

字節(jié)有豆包、有即夢(mèng)，阿里和騰訊開始把世界模型推到臺(tái)前，智譜、MiniMax已經(jīng)登陸港股。

如果只看DeepSeek至少100億美元的估值，它當(dāng)然還是一家很貴的AI公司。可放在今天的中國(guó)AI坐標(biāo)系里，智譜、MiniMax在港股高點(diǎn)的市值都曾突破3000億港元，月之暗面最新估值已經(jīng)達(dá)到了180億美元。

DeepSeek過去可以靠技術(shù)理想和開源聲望行走江湖。但當(dāng)行業(yè)從技術(shù)競(jìng)賽轉(zhuǎn)向生態(tài)和商業(yè)化競(jìng)爭(zhēng)，一家公司終究需要治理結(jié)構(gòu)、估值體系、薪酬激勵(lì)、商業(yè)化收入和長(zhǎng)期預(yù)算。

研究理想可以繼續(xù)存在，但公司終究要面對(duì)現(xiàn)實(shí)。

不是理想不好，是現(xiàn)實(shí)太貴。算力成本在漲，人才價(jià)格在漲，競(jìng)爭(zhēng)對(duì)手的估值在漲——當(dāng)所有生產(chǎn)要素都在漲價(jià)，技術(shù)理想主義本身也在漲價(jià)。

梁文鋒用三年時(shí)間證明了一件事：用更少的錢可以做出很好的模型。但現(xiàn)在他需要證明另一件事：用市場(chǎng)化的方式，能不能讓這家公司走得更遠(yuǎn)。

畢竟，AGI不是靠理想就能抵達(dá)的。

作者| 劉峰

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.