<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      Cursor新模型,你怎么還在套Kimi?馬斯克你怎么還吆喝上了??

      0
      分享至

      Cursor模型更新,最新版本已來到Composer 2.5

      稍微一翻Cursor公告,兩件事挺有意思:

      一是Cursor這回學老實了,新模型“套”了Kimi不再藏著掖著,連具體用了多少都標的清清楚楚

      (Cursor:Kimi打底,自家額外訓練+RL占了85%的總算力)



      二是馬斯克原地上演變臉,之前Cursor陷入“套殼風波”時他在旁邊煽風點火,現在卻十分賣力地幫忙站臺

      都給我去用Cursor新模型。

      網友:老馬你讓我感到陌生(doge)。





      別想多了,其實這是因為Cursor和馬斯克達成了算力合作——

      Composer 2.5部分訓練是在Colossus 2上完成的,以及Cursor正在和SpaceXAI合作,從零開始訓練一個規模明顯更大的模型。



      好好好,新模型剛來,下一代模型的“餅”又吃上了,看來Cursor真是鉚足了勁想搞自研(具體原因下文詳聊)。

      不過遠的咱是夠不著了,先看眼前這個實在的——Composer 2.5本身亮點也很足。

      1/10成本、Opus 4.7級表現,而且發布后首周還給你雙倍用量

      好家伙,這幾個詞一甩出來,經常用模型的朋友誰不沸騰了。

      但問題是,Cursor新模型真有這么頂嗎??

      1/10成本、Opus 4.7級表現

      頂不頂目前咱不好說,反正測評成績挺亮眼。

      據Cursor介紹,“它更擅長在長時間運行的任務中持續工作,更可靠地遵循復雜指令,協作體驗也更加順暢”

      這些表現反映到具體數字上就是,其性能水平整體接近Claude Opus 4.7。

      • Terminal-Bench 2.0(終端/命令行任務):69.3% VS 69.4%,幾乎持平;
      • SWE-Bench Multilingual(多語言工程問題):79.8% VS 80.5%,差距微弱;
      • CursorBench v3.1(高難度編程任務):63.2% VS 最高配64.8%,差距微弱。



      能和Opus 4.7相提并論,常用模型的人都知道這里頭的含金量了。



      而且除了在更高難度的任務上訓練之外,他們還改進了模型在溝通風格和投入級別校準(什么時候該出多大力)等行為層面的表現。

      聽起來有點抽象,但Cursor表示:

      這些維度很難通過現有基準充分反映,但我們發現,它們對實際使用效果非常重要。

      那么,Composer 2.5真實能力如何呢?

      鑒于目前Cursor免費用戶只能體驗Auto模式(雖然上架了但是選不了),所以咱先看一波網友的反饋。

      先插一嘴,Composer模型速度是真快啊,甭管是哪一個版本,用起來歘歘歘的。



      OK,回歸正題。

      目前一圈扒下來,感覺Composer 2.5反饋還不錯??

      Snapchat前機器學習工程師激情發帖稱,自從Composer 2發布后,她就把絕大多數開發工作搬到了Cursor上面。

      而且還甩出了一句頗有暴論味道的話:

      如果你在使用AI進行開發,卻仍然默認使用成本最高的模型來完成每一項任務,那么你80%的工作都是在浪費錢



      圖像生成初創公司LetzAI的CEO也有類似感受,他在體驗新模型幾小時后表示:

      以前可能會對AI的方案挑三揀四、反復修改,但這次因為Composer 2.5做得太好太快,自己直接“躺平認了”。

      沒什么可挑剔的,就這么辦吧。



      想必你也發現了,除了模型能力之外,他們提到了另一個重要關鍵詞:價格

      Composer 2.5的價格為每百萬輸入token 0.50美元、每百萬輸出token 2.50美元。

      此外,還有一個智能水平相同但速度更快的變體,價格為每百萬輸入token 3.00美元、每百萬輸出token 15.00美元。

      p.s. 與Composer 2一樣,fast是默認選項。

      這個價格怎么說呢?也就是Opus 4.7的1/10吧。



      1/10成本、Opus 4.7級表現,如果效果真如測評和網友所言,那絕對是真香了。

      Kimi打底,還做了這些訓練改進

      那么Composer 2.5這次是如何實現性能“飛躍”(至少是表面上)的呢?

      雖說是有Kimi打底,但好歹貼的是“Cursor自研模型”的標簽,這背后多多少少總得有自研吧。

      Cursor:別說我還真有。



      回到模型本身,Cursor這回在訓練棧上做了不少改進,主要圍繞兩個方向:

      模型智能易用性

      具體則有三點:

      第一,給RL訓練加了“定向反饋”

      以前RL獎勵是基于整條軌跡算的,rollout動輒幾十萬token,模型很難知道自己究竟是哪一步搞砸了——最終獎勵只能告訴你“出問題了”,但具體錯哪兒,信號噪聲特別大。

      Cursor的解法是:哪里不對就在哪里直接喂反饋

      舉個例子,模型在某一輪調用了一個不存在的工具,收到報錯后繼續干別的。幾百次調用里就這一次錯,對最終獎勵基本沒影響。

      但Cursor會在出錯那一輪的上下文里插一句“Reminder: Available tools…”并附上可用工具列表,由此得到一個新的“教師”概率分布。

      如此一來,錯誤工具的概率被壓下去,有效替代項的概率被抬上來,然后讓學生模型向這個分布靠攏就行。

      這套方法在Composer 2.5里被用在了多種行為上,從編碼風格到溝通方式都有。



      第二,合成數據規模翻了25倍

      RL訓練幾輪下來,Composer已經能解決大部分訓練題了,怎么繼續提升?

      答案是動態生成更難的任務

      其中一個玩法叫“功能刪除”——給智能體一個帶測試的代碼庫,讓它刪掉某個特定功能但保證代碼庫還能跑,然后任務就是把這個功能重新實現出來,測試就是獎勵信號。

      不過任務一多,獎勵作弊也跟著來了。

      Cursor發現Composer 2.5會整一些離譜操作,比如逆向Python類型檢查緩存找出被刪的函數簽名,甚至反編譯Java字節碼重建第三方API。

      好在都被監控工具抓到了,但也算提了個醒——大規模RL得更小心。



      第三,底層訓練做了優化

      Cursor用的是帶分布式正交化的Muon,并把通信做成異步——一個任務等通信時,優化器接著推進其他任務,讓網絡和計算重疊起來。

      最終在1T模型上,優化器每步只要0.2秒

      另外針對MoE模型,他們把非專家權重和專家權重的HSDP布局拆開了:非專家權重小,FSDP組就窄一點,單節點內搞定;專家權重大,就用更寬的分片網格。

      這樣彼此獨立的并行維度也能重疊,比如CP=2和EP=8可以在8個GPU上跑,而不用占16個。

      總之,從訓練信號到數據規模再到底層并行,Cursor這次是全棧都動了一遍。

      One More Thing

      Cursor為啥這么拼搞自研?其實從它和Anthropic的微妙關系里就能管中窺豹。

      剛好最近看了姚順宇(不是騰訊那個)做客張小珺播客的那期節目,這位Anthropic前員工的觀察,正好能說明問題:

      Cursor最早是踩著Claude的肩膀火起來的。開發者社區里口口相傳的好用,背后很大一部分功勞來自Claude模型本身。那段時間Cursor和Anthropic是典型的“魚水關系”,一個出模型一個出產品,各賺各的錢。

      但Claude Code一出來,畫風就變了。

      Anthropic自己下場做編程產品,等于直接殺進了Cursor的腹地。原本的“上游供應商”瞬間變成了“正面對手”,再繼續把身家性命押在對方的API上,顯然不是個安全的選擇。

      所以Cursor走上自研這條路,與其說是想成為下一個Anthropic,不如說是被推著不得不走——

      模型握在自己手里,命才在自己手里

      說到這里我很好奇一個問題:在自研模型成功之前,Cursor現在的模式難道真的不具有護城河嗎?

      至少對我這種非專業開發者而言,聽起來好像Cursor還不錯——有多款前沿模型可選,價格還更便宜。

      帶著好奇,我看到X上有人給出了一種解讀,挺有意思:

      Cursor的護城河從來都不是基礎模型,而是RL訓練流程+開發者工作流數據。現在他們正在證明:只要經過足夠的微調,開源基礎模型在特定任務上也能與前沿模型相媲美。



      仔細想想這話也不算太夸張。

      Composer 2.5的訓練里,85%的算力都花在了Kimi基模之外的后訓練和RL上——Kimi K2.5只是個起點,真正讓它在編程任務上能打的,是Cursor自己那套圍繞真實IDE場景做出來的訓練管線。

      這個打法也解釋了為啥它能把價格壓到Opus的十分之一。因為,開源基模省掉了從零預訓練那筆最貴的錢,剩下的全砸在編程這一件事上做精細化訓練。

      模型只為Cursor的IDE場景服務,沒必要為通用能力買單。

      至于為啥這次牽手的是馬斯克的SpaceXAI(畢竟老馬上次表現得并不友好),邏輯貌似也不復雜。

      OpenAI有Codex、Anthropic有Claude Code、Google有Gemini Code Assist,這幾家自己都在做編程產品,跟Cursor都是潛在對手,算力上指望不上。

      剩下能拿出世界級算力集群、又不跟Cursor在編程賽道正面沖突的玩家,掰著指頭數也沒幾個了——

      老馬的Colossus 2剛好是現成的。



      而且如果把時間線拉長看,你會發現馬斯克和Cursor之間,已經遠不只是單純的“算力合作”。

      今年3月,xAI內部動蕩之際,馬斯克先從Cursor挖走了兩位核心工程負責人。

      緊接著4月,更大的動作來了。SpaceX宣布與Cursor達成合作,由Colossus超算為Cursor訓練模型。

      但真正關鍵的不是算力,而是協議本身。

      按照網上披露的條款,SpaceX獲得了未來以600億美元收購Cursor的優先權。即便最終不收購,Cursor也需要支付100億美元“合作費”。

      耐人尋味的是,據TechCrunch披露,這份協議官宣前幾小時,Cursor原本正要敲定一輪20億美元、估值500億的融資,參投方包括a16z、英偉達、Thrive等一線機構。

      結果老馬一腳插進來,把這單給截胡了。

      所以某種程度上而言,這其實是一次非常典型的“馬斯克式綁定”

      要么賣給我,要么給我100億,不管怎樣先提前把Cursor的命運鎖進了自己的版圖。

      至于他前腳煽風點火、后腳賣力站臺的變臉速度嘛——硅谷的故事,向來如此。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      雨又來了!北京今夜起有陣雨,明天偏涼

      雨又來了!北京今夜起有陣雨,明天偏涼

      魯中晨報
      2026-05-19 13:15:39
      京東官宣今年618從5月30日晚8點開始,未來有望實現包裹全流程無人配送直達用戶手中

      京東官宣今年618從5月30日晚8點開始,未來有望實現包裹全流程無人配送直達用戶手中

      極目新聞
      2026-05-18 16:25:23
      心碎時刻,巴西公布名單時,佩德羅一大家子聚在一起看直播

      心碎時刻,巴西公布名單時,佩德羅一大家子聚在一起看直播

      懂球帝
      2026-05-19 14:48:23
      嫁法國老頭后癱瘓?42歲李宇春近況曝光,真相背后隱情惹人流淚

      嫁法國老頭后癱瘓?42歲李宇春近況曝光,真相背后隱情惹人流淚

      借你一生
      2026-05-15 19:25:13
      楊子新歡產子僅 1 個月,公司被證監會立案,原來和趙薇是一類人

      楊子新歡產子僅 1 個月,公司被證監會立案,原來和趙薇是一類人

      橙星文娛
      2026-05-19 09:06:58
      北京市通州區委原書記王云峰受賄案一審宣判

      北京市通州區委原書記王云峰受賄案一審宣判

      環球網資訊
      2026-05-19 11:06:06
      澤連斯基很生氣!打向基輔的俄導彈,竟能拆出一百多種西方零件!

      澤連斯基很生氣!打向基輔的俄導彈,竟能拆出一百多種西方零件!

      青青子衿
      2026-05-18 02:26:44
      白天住院晚上回家睡結束了!全國統一執行,違規全額自費還重罰

      白天住院晚上回家睡結束了!全國統一執行,違規全額自費還重罰

      小怪吃美食
      2026-05-19 00:58:43
      好消息,1800萬教師或將迎來紅利,教師法正式進入審議階段!

      好消息,1800萬教師或將迎來紅利,教師法正式進入審議階段!

      小談食刻美食
      2026-05-19 07:40:13
      “脖子被死死壓住,根本無法開口呼救,硬生生扯出來的……”男子在健身房臥推145kg杠鈴突發意外

      “脖子被死死壓住,根本無法開口呼救,硬生生扯出來的……”男子在健身房臥推145kg杠鈴突發意外

      揚子晚報
      2026-05-18 12:39:36
      阿爽因比賽服太“暴露”被網暴5年,回應穿衣自由!

      阿爽因比賽服太“暴露”被網暴5年,回應穿衣自由!

      馬拉松跑步健身
      2026-05-18 21:38:13
      《主角》7位小演員個個都有來頭,楊紫“女兒”,張嘉益“兒子”

      《主角》7位小演員個個都有來頭,楊紫“女兒”,張嘉益“兒子”

      八斗小先生
      2026-05-15 17:40:06
      還是忘不了!特朗普又曬檢閱解放軍儀仗隊照片,還展示自己軍裝照

      還是忘不了!特朗普又曬檢閱解放軍儀仗隊照片,還展示自己軍裝照

      阿龍聊軍事
      2026-05-17 21:08:17
      1959年杜聿明被特赦,老蔣得知大驚道:快讓他老婆從美國回來!

      1959年杜聿明被特赦,老蔣得知大驚道:快讓他老婆從美國回來!

      云霄紀史觀
      2026-05-16 15:47:57
      巴西足協主席:我也驚訝內馬爾入選,這方面安帥有完全自主權

      巴西足協主席:我也驚訝內馬爾入選,這方面安帥有完全自主權

      懂球帝
      2026-05-19 07:25:21
      巴西世界杯26人名單:內馬爾在列!維尼修斯領銜 切爾西前鋒落選

      巴西世界杯26人名單:內馬爾在列!維尼修斯領銜 切爾西前鋒落選

      念洲
      2026-05-19 05:29:55
      24人被擊斃,菲軍方開火,菲副總統被彈劾,杜特爾特家族開始反擊

      24人被擊斃,菲軍方開火,菲副總統被彈劾,杜特爾特家族開始反擊

      鐵錘簡科
      2026-05-19 11:26:22
      突然動手!菲律賓參議院“紅袍”開庭,莎拉·杜特爾特遭彈劾

      突然動手!菲律賓參議院“紅袍”開庭,莎拉·杜特爾特遭彈劾

      菁菁子衿
      2026-05-19 11:20:35
      3年!一個江蘇人,把一家破產韓國船廠,干成全球第一

      3年!一個江蘇人,把一家破產韓國船廠,干成全球第一

      華商韜略
      2026-05-19 10:41:47
      “黃金腰臀比”魏秋月:運動員時因技術出名,后來靠身材出圈!

      “黃金腰臀比”魏秋月:運動員時因技術出名,后來靠身材出圈!

      拳擊時空
      2026-05-19 06:09:56
      2026-05-19 15:51:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12655文章數 176465關注度
      往期回顧 全部

      科技要聞

      馬斯克敗訴,法院判他起訴OpenAI太晚了

      頭條要聞

      賴清德"偷渡式"竄訪非洲國家被中國"踢出群" 大使發聲

      頭條要聞

      賴清德"偷渡式"竄訪非洲國家被中國"踢出群" 大使發聲

      體育要聞

      文班亞馬1比0雷霆:凌駕MVP的史詩價值

      娛樂要聞

      姚晨刪博難平眾怒,為什么她還能蹦噠

      財經要聞

      從賣流量到賣Token,運營商算力生意破局

      汽車要聞

      德味操控+聰明大腦,與眾07不輸新勢力

      態度原創

      數碼
      旅游
      本地
      藝術
      公開課

      數碼要聞

      優派上架LX720-4KC Ultra投影儀

      旅游要聞

      棗莊:碧水青山相映趣 靈芝湖畔好風光

      本地新聞

      別搜晉江小說了,去看真的晉江

      藝術要聞

      蔣萬安手寫賀卡成焦點!網友:字軟人弱!練書法3年,該如何提高

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美精品xxx| 国产精品青青青高清在线| 97精品国产高清自在线看超| 欧美色欧美亚洲高清在线视频| 天天干天天干| 久久av高潮av| 中文字幕天天色色干干| 亚洲欧美另类精品久久久| 久久99热这里只有精品6国产| 国内熟妇与亚洲洲熟妇妇| 亚洲精品成人网| 免费观看性欧美大片无片| 在线成人H网| 亚洲综合国产成人av| 超碰?另类?国产| 69天堂人成无码免费视频| 日韩有码中文字幕国产| 老女老肥熟国产在线视频| 颍上县| 亚洲精品国产电影午夜在线观看| 成人深夜视频| 亚洲欧洲中文日韩久久av乱码| 亚洲国产精品久久无人区 | 偷拍亚洲综合| 亚洲国产一区二区毛片| 中文字幕一区二区人妻性色| 又爽又黄又无遮掩的免费视频| 欧洲亚洲成av人片天堂网| 26uuu亚洲| 在线观看免费人成视频色9| 中文字幕人妻一区二区三| 无码一区二区三区AV免费蜜桃| 久久久久国产成人精品电影| 中国帅小伙gaysextubevideo| 久久久久噜噜噜亚洲熟女综合| 人妻综合网| 秋霞鲁丝片av无码少妇| 佛坪县| 国产尻逼视频| 永久免费在线成人大片| 韩国精品久久久久久无码|