文 | 超前實驗室,作者|青蘋吹果
不再依賴Claude算長大嗎?算Cursor熹妃回宮!
最近,Cursor正式發布了他們迄今為止最強的自研模型——Composer 2.5,上演AI編程圈的“絕地反殺”,價格是友商們的十分之一,性能硬剛行業頂流Claude和GPT。
曾經被Claude Code按在地上摩擦的Cursor,掀桌了!
馬斯克也親自下場轉發,吆喝大家:“都去試試!”
![]()
這波操作,簡直戲劇效果拉滿。
為啥這么說?因為就在不久之前,Cursor的日子過得那叫一個“憋屈”。
曾經的江湖大哥,被Claude Code這個后起之秀追著打,甚至陷入了“一邊被競爭對手搶用戶,一邊還要給競爭對手付錢”的魔幻循環。
3月份Composer 2發布時,還因為隱瞞了Kimi的底座被噴成了篩子。
和英偉達的融資談得好好的,就要敲定的時候,馬斯克橫插一腳,宣布以?600億美收購Cursor的獨家期權,Cursor直接淪為SpaceX的“打工人”。
都說欲揚要先抑,Cursor咬牙撐過了這段“甘露寺”時期,如今終于帶著Composer 2.5殺回來了!
今天咱們拆一拆,Cursor這套“自研反擊戰”到底是王者歸來,還是強行挽尊?又給AI編程這個賽道劃下了什么道?
曾經的“老大哥”被后浪拍在沙灘上
回想2025年初,Cursor那可是AI編程圈的頂流,誰用了都得豎個大拇指。
那種“智能完形填空”般的爽感,讓無數程序員覺得生產力原地飛升。
可惜,天道好輪回,蒼天饒過誰~
這才過去不到一年,江湖地位就松動了。
攪局的,就是Anthropic的親兒子,Claude Code。
這玩意兒有多猛呢?這里有幾組數據:
2025年11月Claude Code的年化收入沖破10億美元,到2026年2月直接蹦到了25億美元。半年多掙25億美金,這在商業軟件史上都是極其罕見的閃電速度。
全球財富500強,一半以上都為TA掏了錢,連摩根大通和高盛都在用自己的方式試水這類工具。
更嚇人的是,據說全球GitHub上大約4%的代碼提交,都有Claude Code的身影。
Anthropic自己還敢放話:年底要超20%!
這意味著什么?意味著Claude Code根本不是個玩具,它就像水一樣,無聲無息地滲透進了真實世界的每一行代碼里。
那這跟Cursor有啥關系?
關系大了!當年Cursor能火,靠的就是“站在巨人的肩膀上”——Claude的API。
這就好像Cursor開著Claude牌發動機,跑得飛快。
結果一回頭,Claude自己造了輛Claude Code牌整車,還比你便宜、比你猛,直接來搶你客戶了!
上游供應商一夜之間變成了直接競爭對手。換誰誰不難受?
更難受的是,Cursor想對標Claude Code,還得繼續給Anthropic付API調用費。
每天一邊被對手搶飯碗,一邊還得乖乖給對手交“保護費”。
也難怪Cursor要咬牙搞自研了。與其把命門交到別人手里,不如自己下場搏一把。
Composer 2.5,就是在這樣一個“不得不拼”的背景下誕生的。
重生歸來后,用硬核數據說話
不吹不黑,咱們直接看跑分。
Cursor在官方公告里把Composer 2.5和市面上的幾款頂尖模型做了橫向對比。
![]()
我這里挑最關鍵的幾個來講:
Terminal-Bench 2.0(終端復雜操作測試):Composer 2.5拿下了69.3%,Claude Opus4.7成績是69.4%。四舍五入就是打平。
SWE-Bench Multilingual(跨語言工程能力測試):Composer 2.5交出了79.8%,Claude Opus 4.7是80.5%。差0.7%,基本一個水平線。
Cursor自己的高難度任務集CursorBench v3.1:Composer 2.5得分63.2%,而GPT-5.5同檔次跑的是59.2%。嘿,反超4個點!
說白了,在幾個關鍵的技術能力維度上,Composer2.5已經穩穩擠進了全球AI編程模型的第一梯隊,和Claude Opus4.7、GPT-5.5這些“天花板玩家”肩并肩了。
但真正讓我驚訝的其實還不是這幾個得分,而是價格。
Cursor發了一張靈魂曲線圖:橫軸是“一次任務的成本”,縱軸是“能力得分”。
![]()
Claude Opus4.7每跑一次復雜任務大約要燒掉7到11美元;GPT-5.5的默認檔也要花大概2美元上下。
而Composer 2.5呢?
基礎版API定價是每百萬輸入Token 0.5美元,每百萬輸出Token 2.5美元。
平均下來,每次任務不到1美元。
這邊Claude Opus 4.7完成任務要掏7美元甚至11美元的時候,Cursor這邊可能只需要1美元。
相當于開豪車,一腳油門一塊錢;現在你花共享單車的錢,差不多也能體驗到豪車的速度和底盤質感。
這已經不是性價比了,這是降維打擊龍。
一個天天跑Agent的開發者,用Claude一天賬單可能三四十美元;換Composer 2.5,三五美元搞定。對于團隊和企業來說,這賬算得非常清楚。
底座是Kimi,但“靈魂”是Cursor
這個時候可能就有人要說了:“跑分再高,價格再低,不還是套殼Kimi?”
的確,用了人家Kimi的底座確實是不爭的事實,而且這次Cursor學聰明了,直接“自曝家底”。
公告里寫得明明白白:底層確實用了月之暗面的Kimi K2.5開源模型做底座。
但重點在后面:Kimi的基礎訓練只占7.5%+7.5%,剩下的85%。
這相當于在Kimi那里買了個“毛坯房”,但“精裝修、全屋智能、家電家具”,全是Cursor自己一磚一瓦搞定的!
![]()
技術上,Cursor這次主要做了三個層面的深入改造:
第一,邊干活邊挨罵,長記性了。
以前的訓練是“做完題再打分”,模型錯了也不知道錯在哪步。而Cursor現在是,如果在推理過程中某一步突然出現了不存在的工具調用,系統立刻跳出來,當場糾正。
它知道在哪個步驟出了錯,并且針對性地修正,而不是從頭再來一遍。這種“邊做邊反饋”的訓練方式,專治長任務“腦子斷片”。
![]()
第二,自己給自己出題,出變態題。
怕模型刷題庫刷成“高分低能”,于是Cursor就自己造題。
有個騷操作叫“功能刪除”,從正常代碼庫里故意刪掉一個功能,讓模型想辦法恢復,再自動跑測試驗證。結果模型被逼急了,甚至學會了逆向分析Python類型檢查緩存,甚至反編譯Java字節碼來重建被刪的API。
雖然有點“野”,但這智商,絕了。
![]()
第三,底層優化,快到飛起。
在底層工程上,Cursor采用了分布式Muon優化器和雙網格HSDP架構,在萬億參數級別的模型上做到優化器每一步只需要0.2秒。在優化器計算與網絡通信之間實現了異步重疊處理,大幅提升了訓練效率。
看不懂沒關系,你只需要知道,這背后是一堆工程大佬在瘋狂“榨干”算力。
Cursor與馬斯克的“愛恨情仇”
技術和產品說完了,咱來吃點商業瓜。
Composer 2.5還沒發布,馬斯克和Cursor之間就已經上演了一出“硅谷甄嬛傳”。
就在今年4月22日,SpaceX突然甩出一張王炸:拿下Cursor 600億美元的收購期權。條款賊霸道,要么年底以這個價買下Cursor,要么你賠我100億美元“合作費”。
更損的是,時間點剛好卡在Cursor談著一輪估值500億、由a16z和英偉達領投的融資。馬斯克這一腳,直接給人家截胡了。
這哪里是合作合同,這分明是霸王硬上弓啊。
誰曾想呢,到了Composer 2.5發布這天,馬斯克的態度竟一百八十度大轉彎,親自轉發推文站臺。這變臉也太快了。
其實扒開來看,就能清楚其中的邏輯。
馬斯克旗下xAI的Colossus 2超級計算集群有相當于百萬張H100的算力,這是全球頂級的AI訓練基礎設施之一。
但他缺一個能把這些算力高效轉化成變成“印鈔機”的應用出口。
Cursor有什么?有百萬級日活開發者、20億+美元年收入、半數財富500強客戶。
一個有算力沒場景,一個有場景缺算力,倆人一拍即合,各取所需。
但話說回來,這也意味著Cursor從一個坑跳進了另一個可能更深的坑,之前大命門捏在Anthropic手里,現在的命門捏在馬斯克這個不好伺候的“瘋王”手里。
這筆賬,是賺是賠,日后自會見分曉。
從依賴Claude,到被Claude Code圍剿,再到咬牙自研、跟馬斯克“聯姻”,Cursor這幾年的經歷,要是濃縮成一部硅谷創業劇,那是全程無尿點。
但說句實在話,Cursor當下的處境也挺擰巴的。
一邊要跟Claude、GitHub Copilot搶開發者,一邊還要從零到一養一個自研模型。
兩條戰線同時開打,壓力山大。
但Composer 2.5的發布,至少證明了一件事:AI編程工具的性價比天花板,被狠狠地往上推了一大截。
未來的看點有兩個:
一是Composer 2.5接下來幾周在真實開發場景里的表現會不會“翻車”?
二是Cursor和xAI下一代“十倍算力”的合訓模型,到底能整出什么花活?
不管最終結果如何,Cursor走通的那條路——用廉價、高效、輕量化的模型來服務具體的IDE場景,已經給整個行業投下了一顆深水炸彈。
漣漪擴散開來,未必只是一個人或一家公司的悲喜劇,而是整個AI編程走向下一個節點的歷程。
這場仗或許會比我們想象的,要熱鬧得多。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.