<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      16 個月后,DeepSeek 已不是孤身走暗巷

      0
      分享至

        

         作者 | 周一笑
      郵箱 | zhouyixiao@pingwest.com

        原本預計在 2026 年春節上演的中國 AI 大戲,延遲到了五一假期前。

        這周五,DeepSeek V4 千呼萬喚始出來。

        同樣在這周,Qwen、Kimi、小米、騰訊都不約而同拿出了自己最新的代表作。

        

        從 Artificial Analysis 最新放榜的開源模型智能指數看,開源模型的前幾名已經都是中國模型。

        其中,TOP2 都是這周發布的。他們也是這幾天 OpenRouter 真實調用量上擠入全球 TOP5 的兩家公司。

        

        這已經不是 DeepSeek 和 Kimi 這么默契了。往回看看前面幾次。

        2025 年 1 月,DeepSeek R1 和 Kimi K1.5 前后兩個小時內發布,都把目標指向 OpenAI o1。

        一個月后,DeepSeek NSA 和 Kimi MoBA 幾乎同時出現,都在改造 Transformer 最核心的注意力機制。

        2025 年 4 月,Kimi 的 Kimina Prover Preview 和 DeepSeek-Prover-V2 先后發布,都在向形式化數學推理和定理證明方向推進。

        時隔一年,現在,又一次,Kimi K2.6 和 DeepSeek V4 在同一周先后發布,兩個萬億參數的開源模型,前后腳擺到了桌面上。

        發力相同的技術方向,幾乎同時到達同一個路口。這已經不像巧合了。

        1

        這次又撞了什么

        先看這一輪各自拿出了什么。

        DeepSeek V4 是一個 1.6 萬億參數的 MoE 模型,49B 激活參數,原生支持 100 萬 token 上下文。它的核心敘事是效率革命,相比上一代 V3.2,單 token 推理算力需求下降了 73%,KV cache 壓縮到原來的十分之一。

        簡單說,同樣的硬件能處理多得多的請求,同樣長度的文本花的錢少得多。

        與此同時,V4 完成了對華為昇騰芯片的深度適配,從英偉達 CUDA 生態向華為 CANN 架構做了底層代碼遷移,也讓這一輪發布多了一層國產算力遷移的意味。

        Kimi K2.6 是一個萬億參數的 MoE 多模態模型,32B 激活參數,256K 上下文。它的核心敘事不是更大或更便宜,而是更持久。

        在測試中,K2.6 可以不間斷編碼 13 小時,處理超過 4000 次工具調用,修改 4000 多行代碼,完成一個接近性能極限的開源金融撮合引擎的深度重構。

        這不是普通的“代碼能力提升”,而是在測試模型能不能從一次性回答,進入長時間、多工具、多 Agent 協作的工作狀態。

        K2.6 還引入了 Agent 集群架構,支持 300 個子 Agent 并行協作。月之暗面的 RL 基礎設施團隊已經用 K2.6 驅動的 Agent 連續自主運行了 5 天,負責監控、故障響應和系統運維。

        

        它們總在同一個路口相遇,但開出去的方向并不一樣。至少在這一輪,一個更像是在重寫模型基礎設施的成本結構,另一個更像是在驗證模型能否進入更長周期的真實任務。方向不同,但在同一周發布這件事本身,已經足夠讓人截圖發群了。

        但兩家也有高度一致的選擇,萬億參數的 MoE 架構、開源、繼續相信 Scaling Law。截至目前,它們也是中國僅有的兩個已開源的萬億參數模型。

        1

        比撞車更有意思的事

        多次撞車是一個好段子,但它背后有一個更值得注意的現象,兩家的技術路線正在相互啟發。

        上一次,是 Kimi K2 借鑒了 DeepSeek V3 帶火的 MLA 注意力機制。MLA 是一種壓縮注意力計算和 KV 緩存以提升效率的方案,DeepSeek V3 讓它成為中國開源模型技術棧里的顯性選項。

        這一次,是 DeepSeek V4 把 Muon 優化器作為模型架構層的三大更新之一。Muon 是一種二階優化器,解決的是訓練階段參數更新的效率和穩定性問題,用來取代已經用了 10 年的 Adam。Kimi 是最早把 Muon 系優化器推到萬億參數級訓練并系統公開經驗的團隊之一,楊植麟在 GTC 2026 演講中稱其可以帶來 2 倍的 token 效率提升。而 V4 也跟進使用 Muon 優化器,用來提升收斂效率和訓練穩定性。

        

        換句話說,MLA 省的是推理時的錢,Muon 省的是訓練時的路。而這兩條路,已經在兩家之間來回走了一遍。

        這就讓“撞車”不再只是發布時間上的巧合,而變成了技術棧層面的回聲。更像是兩家公司一邊競爭,一邊把對方探索過的技術思路變成自己下一輪實驗的參考坐標。

        這種相互啟發還在繼續延伸。在注意力機制上,DeepSeek 探索的是稀疏注意力,Kimi 下一代模型探索的是線性注意力,路徑不同但要回答的問題一致,都是長上下文怎么不被全注意力的計算復雜度拖垮。

        在殘差連接上,DeepSeek 做 mHC,Kimi 做注意力殘差,同樣是不同方案指向同一個目標,讓模型變深之后訓練依然穩定。

        

        這件事之所以值得說,是因為放在更大的行業背景里看,它其實是反常的。硅谷頭部公司正在變得越來越封閉,OpenAI 早已不再公開訓練細節,Anthropic 和 Google 的核心方法同樣諱莫如深,社區只能靠猜測和拼湊來推斷它們的技術路線。連在舞臺上握手都不太可能了

        

        而在 Kimi 和 DeepSeek 之間,技術報告和開源代碼的可見度讓技術擴散的鏈條明顯縮短了。多次撞車之所以能被看到、被討論、被放在一起比較,前提恰恰是兩家都選擇了把東西攤在桌面上。

        中國開源模型的技術擴散速度,正在變得比過去快得多。這可能才是頻繁撞車真正說明的事情。

        1

        全球技術圈都在看它們撞車

        這種“撞車”的敘事,最早當然是中文科技圈的發明。但海外開發者社區也在用自己的方式確認這件事。

        K2.6 發布后,AI 領域最有影響力的 newsletter 之一 Latent Space 直接把 Kimi 放進了“DeepSeek 沉默期后中國開源模型實驗室領跑者”的位置。幾天后 V4 發布,海外開發者社區又立刻把 V4、K2.6、GLM 5.1 放到同一張表格里比較參數、價格、上下文長度和 Agent 能力。

        

        英偉達 GTC 2026 上用來展示下一代芯片推理性能的中國模型,是這兩家。

        

        在海外開發者社區里,當人們討論中國開源模型時,Kimi 和 DeepSeek 的確越來越頻繁地被放進同一張表里。

        1

        它們撞上的不是彼此

        這也讓 DeepSeek 和 Kimi 的關系變得有點微妙。它們當然是競爭對手,但在更大的模型生態里,又共同把中國開源模型推到了一個更難被忽視的位置。

        它們對閉源模型的壓力,不只來自某一次 benchmark,而來自成本、可部署性、開源權重和技術擴散速度這些更慢、更底層的變量。

        所以,Kimi 到底有沒有在故意撞車 DeepSeek?

        大概率沒有。萬億參數的 MoE 要做,長上下文的注意力機制要改,訓練效率的優化器要換,國產芯片的適配要啃,開源要開得真誠而不是做防御性姿態。這些不是“選項”,而是“必經之路”。

        兩家公司都在認真地做底層技術,也都選擇把關鍵進展放到公開語境里,于是就一次又一次地在同一個十字路口碰面。

        不是它們太默契,是路太窄了。

        至于下一次“撞車”,大概已經在路上了。

        如果沒猜錯的話,Kimi 讓大模型的文本和視覺能力齊頭并進的技術方案,將啟發更多中國開源純文本模型長出“眼睛”,一起看到更遠、更大的世界。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      恐怖游輪內幕曝光!船長說是自然死亡,大家都去擁抱了死者的妻子,然后她也死了

      恐怖游輪內幕曝光!船長說是自然死亡,大家都去擁抱了死者的妻子,然后她也死了

      一刻talks丨硬科技趣思想
      2026-05-11 20:36:58
      李湘瘦成了水蛇腰,臉整整小了一圈,女兒反倒胖了一圈

      李湘瘦成了水蛇腰,臉整整小了一圈,女兒反倒胖了一圈

      鄉野小珥
      2026-05-10 13:06:04
      一個被低估的國產降脂藥,既能清血脂,又能護血管,他汀都做不到

      一個被低估的國產降脂藥,既能清血脂,又能護血管,他汀都做不到

      中醫燕麗娜醫生
      2026-05-09 16:58:51
      一男子在35樓大廈擦玻璃被男孩割斷安全繩,父母看到孩子死相崩潰

      一男子在35樓大廈擦玻璃被男孩割斷安全繩,父母看到孩子死相崩潰

      懸案解密檔案
      2025-05-10 11:18:43
      浙江15歲少女因為好奇接觸笑氣,整個人都“癱”了,媽媽崩潰:以為是感冒!

      浙江15歲少女因為好奇接觸笑氣,整個人都“癱”了,媽媽崩潰:以為是感冒!

      環球網資訊
      2026-05-11 14:09:10
      眾議院255票彈劾莎拉,參議院同日換帥,杜特爾特陣營權力重組

      眾議院255票彈劾莎拉,參議院同日換帥,杜特爾特陣營權力重組

      生活魔術專家
      2026-05-11 18:49:32
      “見過最廉價的兜底”,一份山姆燒雞,讓低認知母子淪為全網笑柄

      “見過最廉價的兜底”,一份山姆燒雞,讓低認知母子淪為全網笑柄

      妍妍教育日記
      2026-04-15 09:30:09
      九十年代讓珠三角談之色變的麻陽苗幫,張治成特大犯罪團伙覆滅記

      九十年代讓珠三角談之色變的麻陽苗幫,張治成特大犯罪團伙覆滅記

      顧氏造船廠廠長
      2024-06-02 08:00:47
      75歲姜昆近況曝光,與46歲單身愛女相依為命,晚年日子太讓人羨慕

      75歲姜昆近況曝光,與46歲單身愛女相依為命,晚年日子太讓人羨慕

      橙星文娛
      2026-04-01 16:32:42
      伊朗最高領袖向武裝部隊司令下達新指導方針,伊朗警方逮捕7名涉嫌與敵對網絡進行情報合作人員

      伊朗最高領袖向武裝部隊司令下達新指導方針,伊朗警方逮捕7名涉嫌與敵對網絡進行情報合作人員

      每日經濟新聞
      2026-05-11 09:15:11
      7架C-17!540噸物資!特朗普訪華狂搬500噸家當,這哪是國事出訪

      7架C-17!540噸物資!特朗普訪華狂搬500噸家當,這哪是國事出訪

      Ck的蜜糖
      2026-05-11 15:54:38
      人類意志能扛住酷刑嗎?真相遠比想象殘酷

      人類意志能扛住酷刑嗎?真相遠比想象殘酷

      三農老歷
      2026-05-11 09:19:46
      軍委副主席趕往江蘇給鐘期光掃墓,皺眉批評:你們工作只看職務?

      軍委副主席趕往江蘇給鐘期光掃墓,皺眉批評:你們工作只看職務?

      興趣知識
      2026-05-10 21:10:02
      這6種食物不能“二次加熱”,吃不完就倒掉,別為節省,害了自己

      這6種食物不能“二次加熱”,吃不完就倒掉,別為節省,害了自己

      所食所想
      2026-04-01 10:30:32
      美國衛星:中國“羚羊礁”快變成西沙最大“填島”

      美國衛星:中國“羚羊礁”快變成西沙最大“填島”

      世家寶
      2026-05-11 10:25:10
      霸氣!吳前妻子炮轟浙江:一直很Respect!少上我理解完全不上就離譜

      霸氣!吳前妻子炮轟浙江:一直很Respect!少上我理解完全不上就離譜

      818體育
      2026-05-11 22:26:13
      5月11日31股成交額超過百億,包括新易盛、中際旭創、寒武紀、瀾起科技、勝宏科技等

      5月11日31股成交額超過百億,包括新易盛、中際旭創、寒武紀、瀾起科技、勝宏科技等

      金融界
      2026-05-11 16:02:16
      首個退群北約的國家來了:已走程序,退意已決!

      首個退群北約的國家來了:已走程序,退意已決!

      福建睿平
      2026-04-27 11:46:08
      孫宏斌現狀:公司負債大幅減少,63歲愁白了頭,兒子成了他的驕傲

      孫宏斌現狀:公司負債大幅減少,63歲愁白了頭,兒子成了他的驕傲

      洲洲影視娛評
      2026-04-20 15:16:52
      破防!孫穎莎拿下MVP,緊抱王曼昱歸功給她,馬琳和國乒眾將落淚

      破防!孫穎莎拿下MVP,緊抱王曼昱歸功給她,馬琳和國乒眾將落淚

      做一個合格的吃瓜群眾
      2026-05-11 08:06:20
      2026-05-12 03:20:49
      硅星人 incentive-icons
      硅星人
      硅(Si)是創造未來的基礎,歡迎來到這個星球。
      3070文章數 10497關注度
      往期回顧 全部

      科技要聞

      黃仁勛:你們趕上了一代人一次的大機會

      頭條要聞

      母女二人一年用水量高達400多噸 警方發現背后隱情

      頭條要聞

      母女二人一年用水量高達400多噸 警方發現背后隱情

      體育要聞

      梁靖崑:可能是最后一屆了,想讓大家記住這個我

      娛樂要聞

      “孕婦墜崖案”王暖暖稱被霸凌協商解約

      財經要聞

      宗馥莉罷免銷售負責人 部分業務將外包

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      游戲
      本地
      親子
      公開課
      軍事航空

      LOL第一支MSI戰隊出爐,TSW確定晉級季中賽!BLG已鎖定淘汰賽名額

      本地新聞

      用蘇繡的方式,打開江西婺源

      親子要聞

      你們都喜歡哪些科目?。?/h3>

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普:伊朗的回應“完全不可接受”

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产成人AV| 美女mm131爽爽爽午夜| 女人天堂av| 九九热在线观看视频免费| 夜夜?久久?狠狠| 18岁以下禁止看很黄的视频在线观看| 精品久久人人妻人人做精品 | 欧美 亚洲 中文 国产 综合| 四虎视频在线观看| 久草导航| 亚洲精品香蕉婷婷在线观看| 欧美性XXXX极品HD欧美风情| 极品少妇无套内射视频| 亚洲中文字幕日产喷水| 国内av网站| 亚洲国产成人久久一区WWW| 中文字幕在线第一页| 欧美寡妇xxxx黑人猛交| 国内自拍第一区二区三区| 91婷婷| 97人妻精品无码| 久9久热免费精品视频| 免费特级毛片| 亚洲图片在线| 亚洲中文字幕日韩精品| 午夜一区二区三区视频| 久久96热在精品国产高清| 日本无码白浆一区二区| 婷婷精品国产亚洲AV麻豆不片| 涩涩国产在线不卡无码| 毛片tv网站无套内射tv网站| 丝袜美腿亚洲综合第一页| 中文字幕av久久爽Av| 97国产成人无码精品久久久| 亚洲欧美另类久久久精品能播放的 | 国产成人精品AV在线观| 无码中文av有码中文a| 久久99国产亚洲高清观看首页| 免费看大黄高清网站视频在线| 成人性生交大片免费看| 成人精品国产一区二区网|