![]()
2026年4月17日,一則消息攪動了全球AI行業的平靜:曾以"不差錢"著稱的中國大模型黑馬DeepSeek,正計劃開啟成立以來的首次外部融資,目標估值超100億美元,計劃募資至少3億美元。這家由量化巨頭幻方量化孵化、長期堅持"自給自足"的AI公司,為何突然轉向資本市場?背后折射出的不僅是一家企業的戰略調整,更是全球AI競賽進入白熱化階段,中國AI企業在資金、人才、技術、芯片多重壓力下的生存縮影。
一、從"AI界拼多多"到資金告急:低成本神話難以為繼
DeepSeek的崛起,本身就是AI行業的一段傳奇。2023年7月,由幻方量化創始人梁文鋒創立,這家成立僅兩年多的公司,憑借一系列驚艷的模型產品,迅速成為全球AI領域最受矚目的黑馬。
2025年1月,DeepSeek-R1模型橫空出世,以極低的訓練成本實現了接近OpenAIo1的頂級性能,震驚業界。這款模型不僅在性能上比肩國際頂尖水平,更以"低成本"顛覆了行業認知——其訓練成本僅約600萬美元,是同類競品的十分之一,因此被稱為"AI界拼多多"。當時,DeepSeek一度引發資本市場對高端AI芯片需求的重新審視,甚至導致英偉達等芯片巨頭股價波動。
這一"低成本奇跡"的背后,是DeepSeek獨特的"自我供血"模式。作為幻方量化孵化的AI公司,DeepSeek長期依賴母公司的資金與算力支持。幻方量化作為國內頂級量化私募,2025年實現56.6%的平均收益率,管理資產超700億元,為DeepSeek提供了穩定的"彈藥"。梁文鋒曾多次公開表示,DeepSeek"短期內沒有融資計劃",面臨的問題"從來不是錢,而是高端芯片短缺"。公司甚至多次拒絕了國內頭部VC和科技巨頭的投資邀約,包括2025年傳出的百億估值融資傳聞,也被官方直接辟謠。
然而,僅僅一年多后,這份"不差錢"的底氣已悄然消失。AI大模型研發的"燒錢"速度遠超預期,隨著模型參數規模指數級增長、算力需求持續攀升、研發團隊不斷擴張,即便是幻方量化這樣的"印鈔機",也逐漸難以獨自支撐DeepSeek的發展需求。
更關鍵的是,DeepSeek過去的低成本優勢,很大程度上依賴于復用幻方量化存量的A100、H800等上一代芯片。但隨著技術迭代,這些老舊芯片已無法滿足新一代模型的訓練需求。公司雖嘗試使用英偉達最新Blackwell芯片訓練下一代模型,但受美國出口管制影響,高端芯片獲取受限。與此同時,為擺脫芯片封鎖、實現自主可控,DeepSeek被迫投入大量資源將模型從英偉達架構遷移至華為昇騰芯片,這一技術適配過程不僅耗時費力,更帶來了巨額額外成本。
從"低成本研發"到"高投入競賽",DeepSeek的資金壓力與日俱增,長期堅持的"自我供血"模式已難以為繼,尋求外部融資成為必然選擇。
二、人才流失危機:核心團隊被"挖角",技術進度受阻
比資金壓力更緊迫的,是DeepSeek正面臨嚴重的人才流失危機。自R1模型爆紅后,公司不僅遲遲未推出新一代模型,多位核心研發人員更是相繼離職,直接影響了技術研發進度。
2026年4月,DeepSeek核心研究員郭達雅確認加盟字節跳動,加入其大模型研發團隊Seed,擔任智能體方向負責人。作為R1模型第一作者、V2/V3系列核心作者,郭達雅的離開對DeepSeek是重大損失。盡管字節跳動否認"億元年薪挖角"傳聞,但業內普遍認為,其薪資總包包含現金、期權與激勵股權,長期收益可觀。
更早之前,DeepSeekV3模型重要貢獻者羅福莉已加入小米,負責小米AI業務。作為V2/V3/MoE模型的核心研究員,羅福莉入職小米后迅速帶領團隊推出MiMo-V2-Pro模型,成為全球開源大模型調用量冠軍,其薪資待遇也達到行業頂級水平。
除了這兩位明星研究員,DeepSeek還有多位技術骨干流失,甚至有準CTO級別高管離職創業。人才流失的背后,是AI行業頂尖人才爭奪戰的白熱化。字節、騰訊、小米等科技巨頭,以及智譜、MiniMax等已上市AI公司,紛紛開出巨額年薪+期權激勵的"天價籌碼",對核心人才展開瘋狂爭奪。
相比之下,DeepSeek過去雖提供較高現金薪資,但缺乏期權等長期激勵機制。隨著智譜、MiniMax等公司上市后產生的財富效應,核心員工更傾向于選擇有上市預期、能分享成長紅利的平臺。人才持續流失,直接導致DeepSeek研發進度放緩——原計劃2026年2月發布的下一代旗艦模型V4,因核心人員流失、工程問題復雜等原因多次推遲。
此次尋求融資,DeepSeek明確將"穩定核心團隊"列為重要用途,計劃通過更具競爭力的薪酬體系與股權激勵,留住關鍵人才。對這家技術驅動型公司而言,穩住人才基本盤,比補充資金更為迫切。
三、V4模型"跳票"與芯片突圍:國產適配的艱難轉型
產品迭代停滯,是DeepSeek當前面臨的另一重困境。自2025年初R1模型爆紅后,公司一直未能推出新一代重磅產品,而競爭對手卻在加速迭代。
原定于2026年2月發布的DeepSeekV4,是公司寄予厚望的旗艦模型,計劃推出超萬億參數完整版與2000億參數輕量版。但這款關鍵產品卻多次"跳票",核心原因并非模型研發本身,而是一場艱難的"芯片大遷移"。
此前,DeepSeek所有模型均基于英偉達芯片訓練與推理。但隨著美國出口管制持續收緊,英偉達高端芯片對華供應幾乎中斷。為突破芯片封鎖、實現算力自主可控,DeepSeek決定將V4模型全面適配華為昇騰芯片。
這一調整看似是技術路線選擇,實則是一場顛覆性重構。工程師團隊需要重寫底層代碼、調試分布式訓練框架、解決芯片間通信兼容性問題,尤其要確保模型在昇騰芯片上的精度與性能達到英偉達平臺的同等水平。過程中遭遇了訓練穩定性不足、大規模場景下頻繁崩潰等多重技術障礙,華為甚至派出工程師團隊現場支持,仍耗時良久。
盡管適配過程艱難,但戰略意義重大。一旦V4成功在昇騰芯片上規模化部署,不僅意味著DeepSeek徹底擺脫對美國芯片的依賴,更將推動國產AI芯片與大模型的深度融合,打破美國在AI領域的技術壟斷。黃仁勛曾公開警告,DeepSeek模型在華為平臺首發,對美國而言將是"可怕的結果",足見這一突破的全球影響力。
目前,V4模型已進入灰度測試階段,預計4月底發布。測試數據顯示,V4Lite版本推理速度提升30%,長文本信息召回率大幅提升。但這場"換芯"戰役,不僅拖慢了產品進度,更消耗了大量資金與人力,成為促使DeepSeek尋求融資的重要因素。
四、100億美元估值:融資挑戰與行業變局
盡管融資需求迫切,但DeepSeek的首次外部融資并非一帆風順,100億美元估值與外部環境都帶來了不確定性。
從估值來看,100億美元(約680億元人民幣)在全球AI行業處于中等水平。對比之下,OpenAI最新估值超8500億美元,Anthropic估值3800億美元;國內智譜、MiniMax上市后市值也達500億美元量級。但考慮到DeepSeek成立僅兩年多、尚未實現大規模商業化,100億美元估值已屬不低。
更大的挑戰來自國際資本市場。部分美國投資機構對投資DeepSeek態度謹慎,盡管美國國會曾提出質疑,但DeepSeek并未被納入貿易限制名單。國內資本則態度積極,金沙江創投等機構早已明確表示,若DeepSeek開放融資將積極參與。
更深層來看,DeepSeek的融資轉向,折射出全球AI行業的格局之變。過去兩年,AI行業從"百花齊放"進入"巨頭擠壓"階段。OpenAI、谷歌等美國巨頭憑借巨額資金持續加碼,國內字節、騰訊、百度等科技巨頭也投入千億級資源,對初創公司形成全方位擠壓。
曾經依靠"技術突破+低成本優勢"就能突圍的時代已經過去,如今AI競爭已演變為資金、人才、算力、生態的綜合實力較量。即便是DeepSeek這樣的技術黑馬,也難以僅憑自身力量對抗巨頭軍團,引入外部資本、整合產業資源成為必然選擇。
五、從"獨行"到"共生",中國AI的突圍之路
從拒絕融資到主動尋求資本,DeepSeek的轉變,是中國AI行業發展的一個縮影。這家曾憑借技術與勇氣打破國際壟斷的"黑馬",在經歷爆紅、沉寂、困境后,正以更務實的姿態重新出發。
100億美元融資背后,是資金壓力、人才危機、芯片封鎖、行業競爭的多重挑戰,也是中國AI企業從"技術突破"走向"規模化發展"的必經之路。對DeepSeek而言,融資不僅是補充"彈藥",更是調整戰略、穩定團隊、加速產品迭代的關鍵契機。
一旦融資落地,DeepSeek有望加大算力投入、推進V4模型研發、完善人才激勵機制,重新回到發展快車道。而其堅持的"國產芯片適配"路線,更將為中國AI突破技術封鎖、構建自主可控產業生態探索重要路徑。
從"自我供血"到"開放共生",DeepSeek的選擇,既是一家企業的生存智慧,也是中國AI產業在全球競爭中從追趕者邁向引領者的必然選擇。這場融資戰役的結果,不僅關乎一家公司的未來,更將影響全球AI格局的走向。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.