它們搶的是Claude Code下面那層市場:更便宜、更寬額度、更容易接入現(xiàn)有工具鏈的第二模型。
Kimi想證明自己能多跑幾步
Kimi K2.7 Code的發(fā)布聲量很大。

月之暗面在6月12日發(fā)布Kimi-K2.7-Code。MarkTechPost對這次發(fā)布的整理里提到,月之暗面官方稱它在Kimi
Code Bench v2、Program Bench、MLS
Bench Lite上都有提升,推理token使用量降低約30%。
這些成績來自官方口徑,詳細(xì)的獨(dú)立評測還沒完全跟上。但月之暗面要講的方向很明確:讓代碼任務(wù)跑得更省。
AI編程真正燒錢的地方,經(jīng)常發(fā)生在一串連續(xù)動作里。模型要讀上下文,要決定下一步,要改文件,要看運(yùn)行結(jié)果,再決定怎么修。少繞一輪彎路,少吃一截token,最后都可能變成實(shí)際成本差異。 這個方向已經(jīng)有海外開發(fā)者感覺到了,Julian
Goldie在X上的說法很直白:Kimi
K2.7 Code像個干活的,不像個聊天的。
Kimi還在往工具層走。
Kimi Developers賬號近期介紹Kimi
Code升級時,提到一行命令安裝、視頻作為上下文、插件、ACP協(xié)議、JetBrains和Zed集成、自定義hooks。這些單點(diǎn)功能不用都記住,讀者只要看到一個方向:Kimi也想提供一個AI編程助手入口。
在任務(wù)工作流里,它和Claude Code的關(guān)系就是:誰能接活,誰能多跑幾步。
GLM搶的是工具入口
GLM-5.2的路數(shù)更直接。
它的重點(diǎn)不只是"我跑分多少",而是GLM
Coding Plan。

MarkTechPost 6月14日的報道提到,GLM-5.2的重點(diǎn)包括1M
token上下文、High
/ Max兩種思考強(qiáng)度、Anthropic-compatible
endpoint,以及發(fā)布時沒有公開跑分。
沒有公開跑分。討論自然就落到了工具鏈和長任務(wù)體驗(yàn)上。
Claude Code強(qiáng)的地方,是它能圍繞一個項(xiàng)目連續(xù)行動。 項(xiàng)目越大,越需要看更多文件,記住更多上下文,也越容易被成本和額度卡住。GLM-5.2如果能把長上下文和兼容入口做穩(wěn)定,它拿到的就是開發(fā)者實(shí)際干活時的一個后端選擇。
Z.ai自家的編程工具ZCode走的也是這個路子。它最近一條宣傳帖把賣點(diǎn)擺得很直白:150%配額、5天免費(fèi)試用、每天500萬token。
翻譯成人話就是:你可以拿它多跑一點(diǎn)。
先看兩場同題測試
官方發(fā)布講的是能力,開發(fā)者演示講的是體感。
外網(wǎng)已經(jīng)有人把GLM-5.2和Kimi
K2.7放進(jìn)同類任務(wù)里試。
notjazii做的是一個類似Minecraft
/ 體素世界的生成任務(wù),同一個任務(wù)、同一套設(shè)置,分別交給GLM-5.2和Kimi
K2.7。按他的記錄,GLM-5.2大約35分鐘一次完成;Kimi
K2.7大約30分鐘,但后面還需要額外提示去修移動和bug。

這個小測試說明不了誰更強(qiáng),但能看出"長任務(wù)"里的差別:一個模型快一點(diǎn),但需要繼續(xù)返工;另一個慢一點(diǎn),但一次交付更完整。 真正花錢的時候,開發(fā)者算的往往就是這種賬。
另一個合同審查產(chǎn)品需求文檔的三方測試,也把問題放在具體任務(wù)里。測試者讓GLM、Kimi、Claude
Opus做同一份AI合同審查產(chǎn)品需求文檔,看它們完成速度、步驟數(shù)和輸出質(zhì)量。
那張表里的結(jié)果沒有反轉(zhuǎn):Claude仍然最快、質(zhì)量最高;GLM的質(zhì)量接近,但速度慢;Kimi更快,不過步驟更多,質(zhì)量低一些。
這就夠了。Claude仍然是那根標(biāo)尺,Kimi和GLM開始在不同位置靠近它。
便宜不等于放心交活
"替代"兩個字要謹(jǐn)慎。
開發(fā)者已經(jīng)開始試了。但試出來的結(jié)果,不全是好消息。
只看官方發(fā)布和演示,會覺得國產(chǎn)模型已經(jīng)在替代Claude
Code。第一批動手試的人,看到的沒那么漂亮。
BridgeMind的Matthew
Miller在6月15日發(fā)了一條Kimi負(fù)評。他說自己買了Kimi相關(guān)的39美元和99美元方案,"30分鐘就把額度燒完了";幾個生成任務(wù)效果也不理想,比如恐怖游戲跑不起來,Minecraft克隆版不可玩,Remotion視頻像PPT。

這個測試有局限。它偏創(chuàng)意演示和隨手做項(xiàng)目,但它仍提醒我們:便宜、開源、高熱,不等于可以放心交活。
月之暗面說的是模型層面的推理token使用下降,用戶吐槽的是套餐和額度體感。模型更省,不等于用戶馬上覺得更便宜;如果配額設(shè)得緊,或者任務(wù)本身會反復(fù)試錯,省下來的token可能還沒來得及被用戶感知到。
GLM這邊也一樣。有人看好它的長上下文和工具入口,也有人試過后覺得它還不會替代自己的Claude
coding plan。這樣的反饋不能寫成大趨勢,但足以提醒我們:"進(jìn)入候選池"和"用戶開始遷移"不是一回事。
所以問題不在"替代",而在"分工"。Kimi和GLM正在變成Claude
Code之外的第二選擇。
復(fù)雜架構(gòu)判斷、難度高的重構(gòu)、需要穩(wěn)定工具體驗(yàn)的任務(wù),很多開發(fā)者可能仍然愿意交給Claude。另一類任務(wù)就會開始算賬:前端演示、項(xiàng)目掃描、批量修改、測試修補(bǔ),這些如果全都交給最貴的模型,賬單和額度都會變成壓力。
國產(chǎn)模型切進(jìn)去的,正是這個位置。
它們爭的是一個具體工作位:讓開發(fā)者把更多長任務(wù),先交給更便宜的模型跑起來。
便宜本身成了能力
AI編程模型過去常被放在榜單里比較。
誰的SWE-bench更高,誰的工具調(diào)用更好,誰的代碼題更強(qiáng),這些當(dāng)然重要。但Claude
Code讓另一個問題變得更顯眼:模型會被拿去干活。
這個"便宜"不能只停在感覺上。
三者的定價模式不同:訂閱額度、API單價、工具套餐,各算各的。直接比價格沒意義,但可以看方向。
Claude幫助頁顯示,Claude Pro每月20美元,Max從100美元起,Claude Code和Claude共用額度,碰到上限后,要么等額度重置,要么升級,要么切到按量付費(fèi)。
Kimi K2.7 Code的官方API價格頁按百萬token計費(fèi):普通版緩存命中輸入0.19美元、緩存未命中輸入0.95美元、輸出4美元。

GLM Coding Plan的FAQ寫到,Lite海外版每月18美元,每5小時約80次請求,差不多是Claude Pro的3倍。

但一旦模型開始干活,便宜就不再只是價格標(biāo)簽。
便宜意味著你敢讓它多試幾次,敢讓它跑更長的任務(wù),敢在不確定時先丟一個副本給它處理。額度更寬,意味著它可以讀更多文件,走更完整的流程。兼容Claude
Code、Cline、OpenClaw這類入口,意味著你不用完全重建工作方式。
當(dāng)然這有個前提:模型本身得能干活。 如果每次都跑偏,便宜只會帶來更多無效等待,談不上更多嘗試機(jī)會。Kimi和GLM現(xiàn)在的位置,恰好就在這條線附近:有些任務(wù)已經(jīng)可以試,有些任務(wù)還得謹(jǐn)慎。
Kimi和GLM還沒有把Claude
Code拉下去,也沒有證明自己能在所有任務(wù)上贏。
但它們已經(jīng)把國產(chǎn)模型帶進(jìn)了一個更具體的位置:進(jìn)入開發(fā)者的工作流,參與"哪些任務(wù)值得用最貴模型,哪些任務(wù)可以交給便宜副手"的分工。
對非開發(fā)者來說,這件事的意義也不只在代碼。
今天是AI寫代碼,明天可能是AI做表格、剪視頻、整理資料、寫報告。只要一個AI工具從聊天變成持續(xù)干活,成本和額度就會變成體驗(yàn)的一部分。
所以回到開頭那個問題:這個任務(wù),一定要用Claude嗎?
現(xiàn)在的答案更像是:看任務(wù)。
復(fù)雜架構(gòu)、難重構(gòu)、關(guān)鍵交付,Claude仍然更穩(wěn)。簡單的、長的、重復(fù)的、可以容忍試錯的任務(wù),Kimi和GLM已經(jīng)開始提供別的選擇。
Claude Code先把路走出來了。Kimi和GLM現(xiàn)在卷的,是把這套用法變便宜,便宜到更多人能把它當(dāng)成日常工具。