![]()
誰能想到,曾要堅守“純粹搞AGI創新”的梁文鋒,終究沒能扛住現實的重擊。
4月17日消息,據The information報道,DeepSeek正在與投資人洽談首次外部融資,并尋求以超100億美元(約合人民幣682億元)的估值籌集至少3億美元(約合20億元)。
報道稱,本輪融資DeepSeek希望增強其資金實力,以便在競爭激烈的AI模型研發領域占據更有利的地位。此前,DeepSeek公司曾拒絕過多家頂級風險投資公司和科技巨頭的投資邀約。
如果此次DeepSeek成功完成融資,對于其幻方量化創始人、深度求索創始人兼CEO梁文鋒而言,這將是一次重大轉變。
梁文峰在業內以技術理想主義者著稱,他希望DeepSeek保持獨立,不受商業壓力影響。
截至發稿前,DeepSeek尚未對此置評。
但另一方面,DeepSeek似乎一直沒有發布期待已久的V4模型。因此,市場質疑“DeepSeek是否曇花一現”。
DeepSeek從火到涼的一年
DeepSeek一直由中國對沖基金幻方量化提供資金支持。
DeepSeek于2024年12月發布了處理語言、運行對話應用的基礎模型V3,并于2025年1月開始提供具有強大推理功能的R1模型,引發中美AI行業的高度關注。
DeepSeek之所以爆火,原因在于R1模型在更低成本與開源生態的基礎上,多個關鍵任務層面展現出與美國OpenAI o1等頂尖閉源模型相匹敵,甚至更優的性能。
美國風險投資家Marc Andreessen表示,DeepSeek模型是 AI 的“斯普特尼克時刻”,即是20世紀50年代末蘇聯衛星發射,開啟太空競賽的時刻。
DeepSeek披露過幾個關鍵數據:V3訓練成本僅花費560萬美元,V3/R1模型理論一天的總收入達到56.2萬美元(約合407.41萬元)、成本利潤率高達545%。
隨后,彭博根據市場分析估算,DeepSeek的估值區間在10億美元到1500億美元之間,而估值區間的中間值則為20億至300億美元。
根據彭博億萬富翁指數,如果按照上述估值計算,持有DeepSeek公司84%股份的梁文峰,身價超過1800億元人民幣,將有望躋身亞洲最富有的科技大亨之列。
盡管過去幾個月沒有發布DeepSeek V4,但梁文鋒團隊一直在進行模型小迭代。
2025年12月1日,DeepSeek發布V3.2系列模型(含標準版與高性能版),性能逼近甚至超越同類閉源模型,128K上下文場景中預填充成本降低51%、解碼速度提升62.5%,推理總成本僅為同類閉源模型1/3,其中V3.2-Speciale在數學證明賽事中獲金牌,達到人類選手第二水平。
2026年1月20日,恰逢DeepSeek-R1開源一周年,開發者在GitHub的FlashMLA代碼庫中意外發現神秘標識符“MODEL-1”,其橫跨114個文件、出現28次,與現有V3.2模型并列引用且未沿用舊版命名規則,暗示DeepSeek將推出架構重構的新版本模型而非簡單迭代。
2026年2月11日,DeepSeek App推送1.7.4版本更新,開啟新模型灰度測試,該版本疑似V4正式亮相前的終極灰度版。
DeepSeek將模型上下文長度從128K擴展至1M(接近提升10倍),知識庫更新至2025年5月,多項核心能力實質性提升且已對齊Gemini 3 Pro及Kimi 2.5等主流閉源模型。
算力耗錢,梁文鋒堅守的AI夢動搖了
然而,DeepSeek遲遲未發布,市場猜測與國產AI算力適配緩慢有關。
而隨著DeepSeek融資消息曝光,猜測該機構算力資金緊張,讓梁文鋒不得不選擇外部融資補充“彈藥”。
早前有消息稱,DeepSeek V4首次實現了與國產芯片的深度適配。這標志著中國AI產業在擺脫對國外技術生態依賴、推進去CUDA化進程中邁出了具有里程碑意義的關鍵一步。
從魔改PTX到使用UE8M0 FP8 Scale的參數精度,DeepSeek先榨取英偉達GPU算力,再適配國產芯片,可能會在軟硬件協同方面帶來新的突破,進一步提高訓練效率。
根據此前報道,DeepSeek V4大模型將徹底重構技術架構,核心引入mHC(多路殘差混合連接)與Engram(AI記憶模塊)兩項黑科技,聚焦代碼生成、推理效率與邊緣部署三大能力,技術路徑從“堆參數”轉向“雙軸稀疏+記憶-計算分離”。
市場預計,DeepSeek新模型訓練成本再降50%,若實現完全開源或將推動行業API價格減少60%。
據報道,DeepSeek原計劃于2月份發布其下一代旗艦機型V4,但由于工程和其他方面的困難,發布時間已被多次推遲。DeepSeek的工程師們花費了大量時間使V4能夠開箱即用地兼容國產芯片,這導致了發布延遲,因為DeepSeek之前都是用英偉達算力芯片訓練。
如今,梁文鋒的AGI理想終究敗給現實。
梁文鋒曾接受采訪時表示,國產AI模型訓練效率有差距。
“我們估計,國內最好的水平和國外最好的相比,模型結構和訓練動力學上可能有一倍的差距,光這一點我們要消耗兩倍的算力才能達到同樣效果。另外數據效率上可能也有一倍差距,也就是我們要消耗兩倍的訓練數據和算力,才能達到同樣的效果。合起來就要多消耗4倍算力。我們要做的,正是不停地去縮小這些差距。”
“英偉達的領先,不只是一個公司的努力,而是整個西方技術社區和產業共同努力的結果。他們能看到下一代的技術趨勢,手里有路線圖。中國AI的發展,同樣需要這樣的生態。很多國產芯片發展不起來,也是因為缺乏配套的技術社區,只有第二手消息,所以中國必然需要有人站到技術的前沿。”梁文鋒稱。
人才流失、競爭加劇
市場認為,DeepSeek此次選擇融資的另一個原因,與人才和市場競爭不無關系。
自R1模型取得突破性成功以來,DeepSeek一直沒有發布新一代模型,而且這家初創公司最近也流失了一些明星研究人員。
其中,DeepSeek V3模型的主要貢獻者羅福莉,近幾個月加入了小米,領導其新成立的MiMo AI大模型部門。
同時,4月15日消息,智能紀元AGI獨家獲悉,DeepSeek核心AI研究員郭達雅日前已入職字節跳動Seed團隊,繼續負責模型研發工作,傳薪酬待遇遠高于DeepSeek。
上個月,郭達雅正式從DeepSeek離職,字節、阿里、百度等大廠均被傳出接觸這位90后大佬,而圍繞郭達雅離職話題一度引發關注。
![]()
如今,通過籌集外部資金,DeepSeek 可以投入更多資金用于計算資源,以繼續開發前沿AI模型,并可以支付更多薪酬給人才,以防止頂尖研究人員流失。
不過,從通用大模型向垂直領域深耕、從技術突破向商業落地,頂尖科研人才目前面臨的最大課題在于:想做研究必須先想商業化,這相當“擰巴”。
而且,AI領域的競爭環境也發生了變化。SI模型正以前所未有的速度發展,而來自美國和中國的科技巨頭憑借雄厚的財力,正對初創企業施加越來越大的壓力。
這或許是促使DeepSeek改變了融資策略并開始籌集資金的原因之一。
據知情人士透露,目前一些美國風險投資家可能對投資DeepSeek有所顧慮。
怎么說呢。
說到底,DeepSeek的轉折,從來不是梁文鋒一個人的“理想妥協”,而是整個國產AI行業的縮影。
沒有資本托底,再頂尖的技術也難以為繼,再純粹的理想也終將向算力、人才、競爭低頭。
20億融資或許能解DeepSeek的燃眉之急,卻解不了“AGI理想”與“商業化生存”的矛盾。
曾經的AI黑馬是否會淪為曇花一現?
梁文鋒放下執念后,DeepSeek能否在巨頭圍剿中殺出重圍?
答案,或許要等那個遲到的V4模型,給出最終回應。
畢竟在AI圈,理想不能當飯吃,但沒有理想,又終究走不遠。
當前DeepSeek面臨巨大困境,AI模型長期不迭代意味著“技術掉隊”,而且OpenClaw加速進展,對于AI公司來說,當前DeepSeek對行業面臨巨大的不確定性,需要重新評估。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.