網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

月暗與DeepSeek的“聽(tīng)牌”時(shí)刻

2026-04-24 20:03:15　來(lái)源: 光子星球

北京舉報(bào)

分享至

撰文| 郝鑫

編輯| 吳先之

2023年初，關(guān)于“誰(shuí)是中國(guó)最有技術(shù)理想的人”這個(gè)問(wèn)題，十個(gè)投資人中大概有一半的回答是“Kimi（楊植麟）”。

彼時(shí)，楊植麟所創(chuàng)建的月之暗面（以下簡(jiǎn)稱“月暗”），跟他本人一樣神秘且不按常理出牌。在國(guó)內(nèi)大模型逐漸淪為“卷參數(shù)”的重災(zāi)區(qū)時(shí)，成立半年的月暗開(kāi)了第一場(chǎng)發(fā)布會(huì)，侃侃而談的主題是“長(zhǎng)文本”，瞄準(zhǔn)的方向是C端超級(jí)應(yīng)用。

月暗與DeepSeek的第一次“撞車”，發(fā)生在2025年春節(jié)前夕。同一天，間隔不到兩個(gè)小時(shí)，DeepSeek發(fā)布了R1，月暗發(fā)布了Kimi k1.5。盡管兩家模型在訓(xùn)練思路上有相似之處，但DeepSeek-R1憑借著模型放量、性能和開(kāi)源，火遍了全球。

R1火了，全世界的人都開(kāi)始打聽(tīng)，DeepSeek背后的梁文鋒是何許人也。《暗涌》2023年的一篇報(bào)道被翻了出來(lái)，在里面梁文鋒提到了“研究”“探索”“不求商業(yè)回報(bào)”等話題。“中國(guó)最有技術(shù)理想”的標(biāo)簽，由此被貼到了梁文鋒身上。

早期有投資人總結(jié)，月暗和DeepSeek兩家公司的相同點(diǎn)：靈魂人物、一流的技術(shù)團(tuán)隊(duì)和鼓勵(lì)創(chuàng)新文化。

就在不久前，月暗面截胡了V4，先一步發(fā)布并開(kāi)源了新模型K2.6。

緊接著傳出了DeepSeek尋求融資的消息，騰訊和阿里巴巴正就投資事宜展開(kāi)洽談，而這兩家也是月暗的股東。

據(jù)有關(guān)人士透露，DeepSeek將以月暗作為部分估值參照基準(zhǔn)。目前月暗的估值在180億美元，正在尋求上市。有消息稱，DeepSeek的目標(biāo)估值已從最初的至少100億美元上調(diào)至超200億美元，超過(guò)了月暗。

牌局未散，籌碼未涼。月暗與DeepSeek的故事，像極了麻將桌上的高手對(duì)壘。彼此盯著對(duì)方的牌，卻又各自按自己的牌型摸打。

而麻將的魅力正在于此，不到最后一張牌翻開(kāi)，誰(shuí)也不知道誰(shuí)會(huì)“點(diǎn)炮”，誰(shuí)會(huì)“自摸”。

登月的“背面”

去年底，楊植麟對(duì)內(nèi)展現(xiàn)出，公司發(fā)展健康，賬上資金相對(duì)充盈，不著急上市的坦然。

僅過(guò)去三個(gè)月，情況迎來(lái)180度轉(zhuǎn)彎，月之暗面被爆出“考慮赴港進(jìn)行首次公開(kāi)招股”的消息。

這一切實(shí)際有跡可循，據(jù)光子星球了解，去年的月暗內(nèi)部彌漫著焦慮的情緒。一方面是來(lái)自競(jìng)爭(zhēng)對(duì)手的壓力，面對(duì)智譜和MiniMax接連上市，部門員工難免士氣低落，因?yàn)楹芏嗳擞X(jué)得大模型的窗口期很短，上市的機(jī)會(huì)稍縱即逝。

另一方面則體現(xiàn)在商業(yè)化上，月暗手握的資金、人才在國(guó)內(nèi)屬于第一梯隊(duì)，但核心產(chǎn)品只有Kimi助手。這導(dǎo)致其收入來(lái)源極其有限，免費(fèi)用戶占絕大多數(shù)，付費(fèi)訂閱轉(zhuǎn)化率低，API調(diào)用量遠(yuǎn)不如專注于B端的公司。

有業(yè)內(nèi)人士告訴我們，因?yàn)榇饲暗恼`判，月暗卷入了與大廠的競(jìng)爭(zhēng)中，結(jié)果是在國(guó)內(nèi)沒(méi)有打過(guò)豆包，同時(shí)又錯(cuò)過(guò)了海外市場(chǎng)開(kāi)拓時(shí)間點(diǎn)。

“海外相對(duì)還是充分競(jìng)爭(zhēng)的市場(chǎng)，不僅僅有GPT和Gemini，如果有大量全球客戶愿意為國(guó)產(chǎn)大模型買單，仍是有很大的市場(chǎng)。在進(jìn)一步打開(kāi)市場(chǎng)的前提下，大模型和應(yīng)用的研發(fā)才能走向正向循環(huán)”。該業(yè)內(nèi)人士表示，目前有效出海的領(lǐng)域是AI視頻領(lǐng)域，類似于一些創(chuàng)業(yè)公司體量雖小，卻仍可與大廠抗衡。

DeepSeek R1給行業(yè)敲響了警鐘，包括月暗。

技術(shù)戰(zhàn)略上聚焦Agent方向，Agent賽道所需要具備的長(zhǎng)上下文記憶、任務(wù)拆解與規(guī)劃、底層模型推理能力，恰好與其技術(shù)儲(chǔ)備相吻合。

按楊植麟所說(shuō)，Kimi K2.5以后進(jìn)化邏輯，按照Token效率、長(zhǎng)上下文以及智能體集群，三個(gè)維度的協(xié)同推進(jìn)。他判斷，未來(lái)智能發(fā)展方向?qū)膯沃悄荏w向動(dòng)態(tài)生成的集群進(jìn)化，這也為K2.6埋下了伏筆。

盡管Kimi助手還可以免費(fèi)使用，但對(duì)高價(jià)值用戶篩選極其明顯。有很多用戶反映，在未充值會(huì)員的情況下，正常使用Kimi的速度明顯變慢，還經(jīng)常遇到高峰算力不足的問(wèn)題。事實(shí)上，這本身就是月暗的策略之一，在有限算力的情況下瞄準(zhǔn)能帶來(lái)付費(fèi)轉(zhuǎn)化的生產(chǎn)力用戶。

這種策略加速了Kimi商業(yè)化模型走向閉合。早期，Kimi沒(méi)有完全開(kāi)放收費(fèi)，僅推出了打賞功能，本質(zhì)是高峰期優(yōu)先使用權(quán)，更像是一種對(duì)免費(fèi)用戶的流量調(diào)節(jié)手段，而非真正的產(chǎn)品分層。

去年9月，隨著“OK Computer”功能推出，轉(zhuǎn)為49、99和199元/月三檔會(huì)員，開(kāi)始將深度研究、K2 Turbo、長(zhǎng)思考等能力打包，初步嘗試按能力付費(fèi)。

現(xiàn)在，其會(huì)員訂閱進(jìn)一步細(xì)分為四檔，價(jià)格帶大幅拉長(zhǎng)，最高檔接近700元/月，遠(yuǎn)超此前199元的上限，新增的高階權(quán)益明顯指向?qū)I(yè)用戶和企業(yè)級(jí)場(chǎng)景。

其定價(jià)邏輯不再基于能否使用，而是基于，用戶能調(diào)動(dòng)多少Agent、訪問(wèn)什么級(jí)別數(shù)據(jù)庫(kù)、獲得多少并行能力。這標(biāo)志著Kimi徹底放棄了與豆包等C端產(chǎn)品的流量競(jìng)爭(zhēng)，轉(zhuǎn)而深耕專業(yè)生產(chǎn)力市場(chǎng)，試圖從高價(jià)值用戶的付費(fèi)中獲取可持續(xù)收入。

K2.6是分水嶺

總體來(lái)看，此次K2.6的更新，對(duì)Agent“動(dòng)手”能力的增強(qiáng)，大于對(duì)“大腦”智力的加強(qiáng)。

K2.6的能力在搜索型Agent、長(zhǎng)鏈路編碼、工具協(xié)作這些需要執(zhí)行與檢索的任務(wù)上，已經(jīng)達(dá)到和GPT?5.4、Claude Opus 4.6同一水平線；但在純推理、純數(shù)學(xué)，這類更依賴內(nèi)部思維鏈與抽象邏輯的任務(wù)上，還有一些差距。

技術(shù)報(bào)告里展現(xiàn)了三項(xiàng)K2.6的核心能力。一是長(zhǎng)程編碼能力，能夠連續(xù)編碼13小時(shí)，編寫或修改超過(guò)4000行代碼，堪稱“編碼勞模”。官方實(shí)測(cè)中，用較為冷門Zig語(yǔ)言重構(gòu)AI模型推理，將速度從15 tokens/s提升至193 tokens/s。這是典型的“以執(zhí)行代推理”的優(yōu)勢(shì)體現(xiàn)。

二是從單兵到軍團(tuán)的Agent集群能力，這是增強(qiáng)“手”能力的集中體現(xiàn)。K2.6支持的Agent集群架構(gòu)，能調(diào)動(dòng)高達(dá)300個(gè)子Agent并行工作，完成4000個(gè)協(xié)作步驟。相比上一代，任務(wù)完成度和交付質(zhì)量都有提升。

三是Agent的自主執(zhí)行能力，模型能在主動(dòng)式Agent框架，如OpenClaw，中持續(xù)自主運(yùn)行長(zhǎng)達(dá)5天。這意味著它能作為7x24小時(shí)的后臺(tái)“數(shù)字員工”，處理復(fù)雜任務(wù)。

此次以K2.6為標(biāo)志的更新，清晰地揭示了月之暗面一次重大的戰(zhàn)略轉(zhuǎn)向：從“信息容器”徹底轉(zhuǎn)向“執(zhí)行引擎”，從追求對(duì)話智能，全面押注于能直接交付結(jié)果的Agentic智能。

回顧Kimi的一路來(lái)的升級(jí)，經(jīng)歷了3個(gè)階段。

早期的Kimi聚焦超長(zhǎng)文本和對(duì)話，就像一個(gè)知識(shí)淵博的圖書管理員，你問(wèn)什么，他告訴你在哪本書的哪一頁(yè)。這是一個(gè)信息容器，用戶把大量信息倒進(jìn)去，Kimi負(fù)責(zé)理解、檢索、總結(jié)。它不改變外部世界，只改變用戶對(duì)信息的獲取效率。

第2階段，也就是K2、K2.5時(shí)期，核心是增強(qiáng)代碼生成、數(shù)學(xué)推理、復(fù)雜指令遵循等能力。此時(shí)的模型從“讀”走向“算”，就像一個(gè)聰明的實(shí)習(xí)生，他能根據(jù)需求寫出可運(yùn)行的代碼，但需要你檢查、部署和整合。這背后，是模型開(kāi)始具備工作記憶與鏈?zhǔn)剿伎寄芰Γ辉僦皇潜粍?dòng)回答問(wèn)題，而是能主動(dòng)規(guī)劃多步驟的思維過(guò)程。

第3階段，也就是現(xiàn)在的K2.6，走向了多Agent協(xié)同執(zhí)行。核心是將一個(gè)復(fù)雜任務(wù)拆解為多個(gè)子任務(wù)，調(diào)度不同的“技能Agent”并行執(zhí)行，最后整合交付完整成果。K2.6從一個(gè)大腦變成了“一個(gè)項(xiàng)目經(jīng)理+一支數(shù)字員工團(tuán)隊(duì)”。

正是因?yàn)橹悄軒?lái)的生產(chǎn)力提升，帶來(lái)了月暗商業(yè)模式的轉(zhuǎn)變，從對(duì)功能收費(fèi)轉(zhuǎn)變?yōu)閳?zhí)行任務(wù)、成果交付的收費(fèi)。對(duì)月暗來(lái)說(shuō)，K2.6的商業(yè)價(jià)值高于技術(shù)價(jià)值。

這是一道分水嶺，是Kimi從“信息容器”邁向“執(zhí)行引擎”的拐點(diǎn)，也是Agent能承擔(dān)復(fù)雜工作的量產(chǎn)證明。

月之暗面官方在開(kāi)篇引用了Linux之父的一句經(jīng)典名言，“Talk is cheap. Show me the code”。或許，還應(yīng)該補(bǔ)上一句“Only results matter.”

V4狹路相逢

狼來(lái)了的故事終于有了結(jié)尾，DeepSeek-V4預(yù)覽版在K2.6之后，姍姍來(lái)遲。

根據(jù)官方信息，V4版本的更新核心是“普惠”。通過(guò)技術(shù)創(chuàng)新，讓頂尖的Agent能力、百萬(wàn)級(jí)超長(zhǎng)上下文和極致的推理性能，以更低的成本被每個(gè)人和企業(yè)方便地使用。

V4在成本效率上做出了極致優(yōu)化。采用MoE架構(gòu)，總參數(shù)達(dá)到1.6萬(wàn)億，但每次推理僅激活約490億參數(shù)，既保證了性能，又控制了成本。上下文窗口從前代的128K擴(kuò)展至100萬(wàn)Token，接近10倍的量級(jí)提升。同時(shí)，實(shí)現(xiàn)了在100萬(wàn)Token長(zhǎng)度下的97%信息召回率。

V4最具沖擊力的，可能不是其技術(shù)參數(shù)，而是在商業(yè)模式上對(duì)現(xiàn)有閉源巨頭的挑戰(zhàn)。

DeepSeek-V4的采取雙版本定價(jià)策略，一端是面向個(gè)人開(kāi)發(fā)者的V4-Flash，每百萬(wàn)tokens輸入是0.2元，輸出是2元；V4-Pro每百萬(wàn)tokens輸入是1元，輸出是12元。粗略估算，以O(shè)penAI和Anthropic當(dāng)前最強(qiáng)的旗艦?zāi)Ｐ蜑榛鶞?zhǔn)，其價(jià)格大約是V4-Pro的16-25倍。

Deepseek表示，受限于高端算力，目前Pro的服務(wù)吞吐十分有限，預(yù)計(jì)下半年昇騰950超節(jié)點(diǎn)批量上市后，Pro的價(jià)格還會(huì)大幅下調(diào)。

關(guān)鍵是，V4-Pro并非廉價(jià)替代品。其在Agentic Coding評(píng)測(cè)中已達(dá)開(kāi)源最佳，其使用體驗(yàn)優(yōu)于Sonnet 4.5，交付質(zhì)量接近Claude Opus 4.6的非思考模式。

同樣是Agent，DeepSeek V4與Kimi K2.6的本質(zhì)區(qū)別，在于它們優(yōu)化Agent能力視角截然不同：一種是微觀智能驅(qū)動(dòng)力，一種是宏觀集群執(zhí)行力。

DeepSeek的內(nèi)在哲學(xué)是模型即Agent，側(cè)重于單兵為王，通過(guò)提升模型自身的智能與效率，使單個(gè)Agent能力最大化。V4假設(shè)單個(gè)模型的能力做到天花板，那么基于其構(gòu)建的Agent自然就是最強(qiáng)的，用戶不需要復(fù)雜的集群調(diào)度，一個(gè)Agent就能完成大多數(shù)任務(wù)。

Kimi K2.6則更偏重于Agent即系統(tǒng)，將Agent擰成一股繩，核心能力源于多Agent Swarm集群的協(xié)同能力。K2.6認(rèn)為現(xiàn)實(shí)中的復(fù)雜任務(wù)，靠一個(gè)Agent串行完成太慢、太容易出錯(cuò)。不如拆成幾百個(gè)小任務(wù)，讓上百個(gè)Agent并行一起做，最后匯總。即使每個(gè)Agent的智商不是頂尖，團(tuán)隊(duì)協(xié)作的效率也遠(yuǎn)超單兵。

這兩種路線并非對(duì)立，而是互相補(bǔ)充。前者拼智商，后者拼協(xié)作。前者是深度，后者是廣度。因?yàn)橐粋€(gè)理想的Agent系統(tǒng)，可以用DeepSeek V4作為子Agent的“大腦”，再用Kimi的集群框架將這些子Agent組織起來(lái)。

從種種跡象來(lái)看，DeepSeek正在向資本和商業(yè)化靠攏，而且無(wú)法避免地將月暗拉進(jìn)了這場(chǎng)風(fēng)暴。

智譜與MiniMax已經(jīng)上市，從團(tuán)隊(duì)基因、技術(shù)能力、融資能力等多個(gè)因素綜合考慮，月暗成為了DeepSeek錨定估值的最佳標(biāo)的。

目前，月暗的核心敘事是“長(zhǎng)上下文本+Agent集群智能”，以此支撐起180億美元的估值。DeepSeek此時(shí)以200億美元甚至更高的目標(biāo)估值去參照月暗，直接挑戰(zhàn)了其估值的合理性。

投資者天然會(huì)進(jìn)行同類比較，更何況月暗與DeepSeek本來(lái)就有相似的地方。當(dāng)月暗從唯一的選擇變成了可替代的選項(xiàng)之一，估值邏輯就從稀缺性溢價(jià)，就切換為可替代性折價(jià)。

DeepSeek這局牌打得極兇，技術(shù)一把梭哈，定價(jià)直接“截胡”，估值有機(jī)會(huì)反超月暗。

可它的軟肋也很明顯，開(kāi)源是把雙刃劍，容易養(yǎng)大了對(duì)手餓死了自己。其長(zhǎng)期以AI實(shí)驗(yàn)室自居，以研究為導(dǎo)向，無(wú)法保證更新頻率的穩(wěn)定性。V3版本發(fā)布于2024年12月，V4版本頻頻跳票，市場(chǎng)等得心焦。

因?yàn)閳?jiān)持開(kāi)源，DeepSeek難以通過(guò)模型授權(quán)收費(fèi)，收入來(lái)源現(xiàn)在只有微薄的API調(diào)取費(fèi)用。商業(yè)模式尚未建立，仍要面臨算力、人才爭(zhēng)奪和基建建設(shè)等高昂的成本支出。

月暗雖被“截胡”，卻還攥著幾張暗牌，比如Agent集群的工程成熟度、垂直行業(yè)的深耕、初步有成效的Agent商業(yè)模式，這些DeepSeek短期難以超越。

誰(shuí)能把手里的牌打成“自摸”，看的不是誰(shuí)嗓門大，而是誰(shuí)能在商業(yè)化這張牌桌上，把技術(shù)真正換成籌碼。

DeepSeek摸到了“聽(tīng)牌”的資格，月暗也還有“改聽(tīng)”的機(jī)會(huì)。只是這張牌桌，從此再無(wú)輕松的牌可打。

微信號(hào)｜TMTweb

公眾號(hào)｜光子星球

別忘了掃碼關(guān)注我們！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.