撰文| 郝 鑫
編輯| 吳先之
2023年初,關(guān)于“誰(shuí)是中國(guó)最有技術(shù)理想的人”這個(gè)問(wèn)題,十個(gè)投資人中大概有一半的回答是“Kimi(楊植麟)”。
彼時(shí),楊植麟所創(chuàng)建的月之暗面(以下簡(jiǎn)稱“月暗”),跟他本人一樣神秘且不按常理出牌。在國(guó)內(nèi)大模型逐漸淪為“卷參數(shù)”的重災(zāi)區(qū)時(shí),成立半年的月暗開(kāi)了第一場(chǎng)發(fā)布會(huì),侃侃而談的主題是“長(zhǎng)文本”,瞄準(zhǔn)的方向是C端超級(jí)應(yīng)用。
月暗與DeepSeek的第一次“撞車”,發(fā)生在2025年春節(jié)前夕。同一天,間隔不到兩個(gè)小時(shí),DeepSeek發(fā)布了R1,月暗發(fā)布了Kimi k1.5。盡管兩家模型在訓(xùn)練思路上有相似之處,但DeepSeek-R1憑借著模型放量、性能和開(kāi)源,火遍了全球。
R1火了,全世界的人都開(kāi)始打聽(tīng),DeepSeek背后的梁文鋒是何許人也。《暗涌》2023年的一篇報(bào)道被翻了出來(lái),在里面梁文鋒提到了“研究”“探索”“不求商業(yè)回報(bào)”等話題。“中國(guó)最有技術(shù)理想”的標(biāo)簽,由此被貼到了梁文鋒身上。
早期有投資人總結(jié),月暗和DeepSeek兩家公司的相同點(diǎn):靈魂人物、一流的技術(shù)團(tuán)隊(duì)和鼓勵(lì)創(chuàng)新文化。
就在不久前,月暗面截胡了V4,先一步發(fā)布并開(kāi)源了新模型K2.6。
![]()
緊接著傳出了DeepSeek尋求融資的消息,騰訊和阿里巴巴正就投資事宜展開(kāi)洽談,而這兩家也是月暗的股東。
據(jù)有關(guān)人士透露,DeepSeek將以月暗作為部分估值參照基準(zhǔn)。目前月暗的估值在180億美元,正在尋求上市。有消息稱,DeepSeek的目標(biāo)估值已從最初的至少100億美元上調(diào)至超200億美元,超過(guò)了月暗。
牌局未散,籌碼未涼。月暗與DeepSeek的故事,像極了麻將桌上的高手對(duì)壘。彼此盯著對(duì)方的牌,卻又各自按自己的牌型摸打。
而麻將的魅力正在于此,不到最后一張牌翻開(kāi),誰(shuí)也不知道誰(shuí)會(huì)“點(diǎn)炮”,誰(shuí)會(huì)“自摸”。
登月的“背面”
去年底,楊植麟對(duì)內(nèi)展現(xiàn)出,公司發(fā)展健康,賬上資金相對(duì)充盈,不著急上市的坦然。
僅過(guò)去三個(gè)月,情況迎來(lái)180度轉(zhuǎn)彎,月之暗面被爆出“考慮赴港進(jìn)行首次公開(kāi)招股”的消息。
這一切實(shí)際有跡可循,據(jù)光子星球了解,去年的月暗內(nèi)部彌漫著焦慮的情緒。一方面是來(lái)自競(jìng)爭(zhēng)對(duì)手的壓力,面對(duì)智譜和MiniMax接連上市,部門員工難免士氣低落,因?yàn)楹芏嗳擞X(jué)得大模型的窗口期很短,上市的機(jī)會(huì)稍縱即逝。
另一方面則體現(xiàn)在商業(yè)化上,月暗手握的資金、人才在國(guó)內(nèi)屬于第一梯隊(duì),但核心產(chǎn)品只有Kimi助手。這導(dǎo)致其收入來(lái)源極其有限,免費(fèi)用戶占絕大多數(shù),付費(fèi)訂閱轉(zhuǎn)化率低,API調(diào)用量遠(yuǎn)不如專注于B端的公司。
有業(yè)內(nèi)人士告訴我們,因?yàn)榇饲暗恼`判,月暗卷入了與大廠的競(jìng)爭(zhēng)中,結(jié)果是在國(guó)內(nèi)沒(méi)有打過(guò)豆包,同時(shí)又錯(cuò)過(guò)了海外市場(chǎng)開(kāi)拓時(shí)間點(diǎn)。
“海外相對(duì)還是充分競(jìng)爭(zhēng)的市場(chǎng),不僅僅有GPT和Gemini,如果有大量全球客戶愿意為國(guó)產(chǎn)大模型買單,仍是有很大的市場(chǎng)。在進(jìn)一步打開(kāi)市場(chǎng)的前提下,大模型和應(yīng)用的研發(fā)才能走向正向循環(huán)”。該業(yè)內(nèi)人士表示,目前有效出海的領(lǐng)域是AI視頻領(lǐng)域,類似于一些創(chuàng)業(yè)公司體量雖小,卻仍可與大廠抗衡。
DeepSeek R1給行業(yè)敲響了警鐘,包括月暗。
技術(shù)戰(zhàn)略上聚焦Agent方向,Agent賽道所需要具備的長(zhǎng)上下文記憶、任務(wù)拆解與規(guī)劃、底層模型推理能力,恰好與其技術(shù)儲(chǔ)備相吻合。
按楊植麟所說(shuō),Kimi K2.5以后進(jìn)化邏輯,按照Token效率、長(zhǎng)上下文以及智能體集群,三個(gè)維度的協(xié)同推進(jìn)。他判斷,未來(lái)智能發(fā)展方向?qū)膯沃悄荏w向動(dòng)態(tài)生成的集群進(jìn)化,這也為K2.6埋下了伏筆。
盡管Kimi助手還可以免費(fèi)使用,但對(duì)高價(jià)值用戶篩選極其明顯。有很多用戶反映,在未充值會(huì)員的情況下,正常使用Kimi的速度明顯變慢,還經(jīng)常遇到高峰算力不足的問(wèn)題。事實(shí)上,這本身就是月暗的策略之一,在有限算力的情況下瞄準(zhǔn)能帶來(lái)付費(fèi)轉(zhuǎn)化的生產(chǎn)力用戶。
這種策略加速了Kimi商業(yè)化模型走向閉合。早期,Kimi沒(méi)有完全開(kāi)放收費(fèi),僅推出了打賞功能,本質(zhì)是高峰期優(yōu)先使用權(quán),更像是一種對(duì)免費(fèi)用戶的流量調(diào)節(jié)手段,而非真正的產(chǎn)品分層。
去年9月,隨著“OK Computer”功能推出,轉(zhuǎn)為49、99和199元/月三檔會(huì)員,開(kāi)始將深度研究、K2 Turbo、長(zhǎng)思考等能力打包,初步嘗試按能力付費(fèi)。
現(xiàn)在,其會(huì)員訂閱進(jìn)一步細(xì)分為四檔,價(jià)格帶大幅拉長(zhǎng),最高檔接近700元/月,遠(yuǎn)超此前199元的上限,新增的高階權(quán)益明顯指向?qū)I(yè)用戶和企業(yè)級(jí)場(chǎng)景。
![]()
其定價(jià)邏輯不再基于能否使用,而是基于,用戶能調(diào)動(dòng)多少Agent、訪問(wèn)什么級(jí)別數(shù)據(jù)庫(kù)、獲得多少并行能力。這標(biāo)志著Kimi徹底放棄了與豆包等C端產(chǎn)品的流量競(jìng)爭(zhēng),轉(zhuǎn)而深耕專業(yè)生產(chǎn)力市場(chǎng),試圖從高價(jià)值用戶的付費(fèi)中獲取可持續(xù)收入。
K2.6是分水嶺
總體來(lái)看,此次K2.6的更新,對(duì)Agent“動(dòng)手”能力的增強(qiáng),大于對(duì)“大腦”智力的加強(qiáng)。
![]()
K2.6的能力在搜索型Agent、長(zhǎng)鏈路編碼、工具協(xié)作這些需要執(zhí)行與檢索的任務(wù)上,已經(jīng)達(dá)到和GPT?5.4、Claude Opus 4.6同一水平線;但在純推理、純數(shù)學(xué),這類更依賴內(nèi)部思維鏈與抽象邏輯的任務(wù)上,還有一些差距。
技術(shù)報(bào)告里展現(xiàn)了三項(xiàng)K2.6的核心能力。一是長(zhǎng)程編碼能力,能夠連續(xù)編碼13小時(shí),編寫或修改超過(guò)4000行代碼,堪稱“編碼勞模”。官方實(shí)測(cè)中,用較為冷門Zig語(yǔ)言重構(gòu)AI模型推理,將速度從15 tokens/s提升至193 tokens/s。這是典型的“以執(zhí)行代推理”的優(yōu)勢(shì)體現(xiàn)。
二是從單兵到軍團(tuán)的Agent集群能力,這是增強(qiáng)“手”能力的集中體現(xiàn)。K2.6支持的Agent集群架構(gòu),能調(diào)動(dòng)高達(dá)300個(gè)子Agent并行工作,完成4000個(gè)協(xié)作步驟。相比上一代,任務(wù)完成度和交付質(zhì)量都有提升。
三是Agent的自主執(zhí)行能力,模型能在主動(dòng)式Agent框架,如OpenClaw,中持續(xù)自主運(yùn)行長(zhǎng)達(dá)5天。這意味著它能作為7x24小時(shí)的后臺(tái)“數(shù)字員工”,處理復(fù)雜任務(wù)。
此次以K2.6為標(biāo)志的更新,清晰地揭示了月之暗面一次重大的戰(zhàn)略轉(zhuǎn)向:從“信息容器”徹底轉(zhuǎn)向“執(zhí)行引擎”,從追求對(duì)話智能,全面押注于能直接交付結(jié)果的Agentic智能。
回顧Kimi的一路來(lái)的升級(jí),經(jīng)歷了3個(gè)階段。
早期的Kimi聚焦超長(zhǎng)文本和對(duì)話,就像一個(gè)知識(shí)淵博的圖書管理員,你問(wèn)什么,他告訴你在哪本書的哪一頁(yè)。這是一個(gè)信息容器,用戶把大量信息倒進(jìn)去,Kimi負(fù)責(zé)理解、檢索、總結(jié)。它不改變外部世界,只改變用戶對(duì)信息的獲取效率。
第2階段,也就是K2、K2.5時(shí)期,核心是增強(qiáng)代碼生成、數(shù)學(xué)推理、復(fù)雜指令遵循等能力。此時(shí)的模型從“讀”走向“算”,就像一個(gè)聰明的實(shí)習(xí)生,他能根據(jù)需求寫出可運(yùn)行的代碼,但需要你檢查、部署和整合。這背后,是模型開(kāi)始具備工作記憶與鏈?zhǔn)剿伎寄芰Γ辉僦皇潜粍?dòng)回答問(wèn)題,而是能主動(dòng)規(guī)劃多步驟的思維過(guò)程。
第3階段,也就是現(xiàn)在的K2.6,走向了多Agent協(xié)同執(zhí)行。核心是將一個(gè)復(fù)雜任務(wù)拆解為多個(gè)子任務(wù),調(diào)度不同的“技能Agent”并行執(zhí)行,最后整合交付完整成果。K2.6從一個(gè)大腦變成了“一個(gè)項(xiàng)目經(jīng)理+一支數(shù)字員工團(tuán)隊(duì)”。
正是因?yàn)橹悄軒?lái)的生產(chǎn)力提升,帶來(lái)了月暗商業(yè)模式的轉(zhuǎn)變,從對(duì)功能收費(fèi)轉(zhuǎn)變?yōu)閳?zhí)行任務(wù)、成果交付的收費(fèi)。對(duì)月暗來(lái)說(shuō),K2.6的商業(yè)價(jià)值高于技術(shù)價(jià)值。
這是一道分水嶺,是Kimi從“信息容器”邁向“執(zhí)行引擎”的拐點(diǎn),也是Agent能承擔(dān)復(fù)雜工作的量產(chǎn)證明。
月之暗面官方在開(kāi)篇引用了Linux之父的一句經(jīng)典名言,“Talk is cheap. Show me the code”。或許,還應(yīng)該補(bǔ)上一句“Only results matter.”
V4狹路相逢
狼來(lái)了的故事終于有了結(jié)尾,DeepSeek-V4預(yù)覽版在K2.6之后,姍姍來(lái)遲。
根據(jù)官方信息,V4版本的更新核心是“普惠”。通過(guò)技術(shù)創(chuàng)新,讓頂尖的Agent能力、百萬(wàn)級(jí)超長(zhǎng)上下文和極致的推理性能,以更低的成本被每個(gè)人和企業(yè)方便地使用。
V4在成本效率上做出了極致優(yōu)化。采用MoE架構(gòu),總參數(shù)達(dá)到1.6萬(wàn)億,但每次推理僅激活約490億參數(shù),既保證了性能,又控制了成本。上下文窗口從前代的128K擴(kuò)展至100萬(wàn)Token,接近10倍的量級(jí)提升。同時(shí),實(shí)現(xiàn)了在100萬(wàn)Token長(zhǎng)度下的97%信息召回率。
V4最具沖擊力的,可能不是其技術(shù)參數(shù),而是在商業(yè)模式上對(duì)現(xiàn)有閉源巨頭的挑戰(zhàn)。
DeepSeek-V4的采取雙版本定價(jià)策略,一端是面向個(gè)人開(kāi)發(fā)者的V4-Flash,每百萬(wàn)tokens輸入是0.2元,輸出是2元;V4-Pro每百萬(wàn)tokens輸入是1元,輸出是12元。粗略估算,以O(shè)penAI和Anthropic當(dāng)前最強(qiáng)的旗艦?zāi)P蜑榛鶞?zhǔn),其價(jià)格大約是V4-Pro的16-25倍。
Deepseek表示,受限于高端算力,目前Pro的服務(wù)吞吐十分有限,預(yù)計(jì)下半年昇騰950超節(jié)點(diǎn)批量上市后,Pro的價(jià)格還會(huì)大幅下調(diào)。
關(guān)鍵是,V4-Pro并非廉價(jià)替代品。其在Agentic Coding評(píng)測(cè)中已達(dá)開(kāi)源最佳,其使用體驗(yàn)優(yōu)于Sonnet 4.5,交付質(zhì)量接近Claude Opus 4.6的非思考模式。
同樣是Agent,DeepSeek V4與Kimi K2.6的本質(zhì)區(qū)別,在于它們優(yōu)化Agent能力視角截然不同:一種是微觀智能驅(qū)動(dòng)力,一種是宏觀集群執(zhí)行力。
DeepSeek的內(nèi)在哲學(xué)是模型即Agent,側(cè)重于單兵為王,通過(guò)提升模型自身的智能與效率,使單個(gè)Agent能力最大化。V4假設(shè)單個(gè)模型的能力做到天花板,那么基于其構(gòu)建的Agent自然就是最強(qiáng)的,用戶不需要復(fù)雜的集群調(diào)度,一個(gè)Agent就能完成大多數(shù)任務(wù)。
Kimi K2.6則更偏重于Agent即系統(tǒng),將Agent擰成一股繩,核心能力源于多Agent Swarm集群的協(xié)同能力。K2.6認(rèn)為現(xiàn)實(shí)中的復(fù)雜任務(wù),靠一個(gè)Agent串行完成太慢、太容易出錯(cuò)。不如拆成幾百個(gè)小任務(wù),讓上百個(gè)Agent并行一起做,最后匯總。即使每個(gè)Agent的智商不是頂尖,團(tuán)隊(duì)協(xié)作的效率也遠(yuǎn)超單兵。
這兩種路線并非對(duì)立,而是互相補(bǔ)充。前者拼智商,后者拼協(xié)作。前者是深度,后者是廣度。因?yàn)橐粋€(gè)理想的Agent系統(tǒng),可以用DeepSeek V4作為子Agent的“大腦”,再用Kimi的集群框架將這些子Agent組織起來(lái)。
從種種跡象來(lái)看,DeepSeek正在向資本和商業(yè)化靠攏,而且無(wú)法避免地將月暗拉進(jìn)了這場(chǎng)風(fēng)暴。
![]()
智譜與MiniMax已經(jīng)上市,從團(tuán)隊(duì)基因、技術(shù)能力、融資能力等多個(gè)因素綜合考慮,月暗成為了DeepSeek錨定估值的最佳標(biāo)的。
目前,月暗的核心敘事是“長(zhǎng)上下文本+Agent集群智能”,以此支撐起180億美元的估值。DeepSeek此時(shí)以200億美元甚至更高的目標(biāo)估值去參照月暗,直接挑戰(zhàn)了其估值的合理性。
投資者天然會(huì)進(jìn)行同類比較,更何況月暗與DeepSeek本來(lái)就有相似的地方。當(dāng)月暗從唯一的選擇變成了可替代的選項(xiàng)之一,估值邏輯就從稀缺性溢價(jià),就切換為可替代性折價(jià)。
DeepSeek這局牌打得極兇,技術(shù)一把梭哈,定價(jià)直接“截胡”,估值有機(jī)會(huì)反超月暗。
可它的軟肋也很明顯,開(kāi)源是把雙刃劍,容易養(yǎng)大了對(duì)手餓死了自己。其長(zhǎng)期以AI實(shí)驗(yàn)室自居,以研究為導(dǎo)向,無(wú)法保證更新頻率的穩(wěn)定性。V3版本發(fā)布于2024年12月,V4版本頻頻跳票,市場(chǎng)等得心焦。
因?yàn)閳?jiān)持開(kāi)源,DeepSeek難以通過(guò)模型授權(quán)收費(fèi),收入來(lái)源現(xiàn)在只有微薄的API調(diào)取費(fèi)用。商業(yè)模式尚未建立,仍要面臨算力、人才爭(zhēng)奪和基建建設(shè)等高昂的成本支出。
月暗雖被“截胡”,卻還攥著幾張暗牌,比如Agent集群的工程成熟度、垂直行業(yè)的深耕、初步有成效的Agent商業(yè)模式,這些DeepSeek短期難以超越。
誰(shuí)能把手里的牌打成“自摸”,看的不是誰(shuí)嗓門大,而是誰(shuí)能在商業(yè)化這張牌桌上,把技術(shù)真正換成籌碼。
DeepSeek摸到了“聽(tīng)牌”的資格,月暗也還有“改聽(tīng)”的機(jī)會(huì)。只是這張牌桌,從此再無(wú)輕松的牌可打。
微信號(hào)|TMTweb
公眾號(hào)|光子星球
別忘了掃碼關(guān)注我們!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.