<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      梁文鋒,這一次要掀桌

      0
      分享至



      今天,中國深度求索的DeepSeek-V4人工智能模型“千呼萬喚始出來”,一點沒讓人失望。

      所謂“冤家路窄”。幾個小時前,OpenAI的GPT5.5剛剛發布,沒什么水花——好比開演唱會的汪峰,總是幫忙預告“別的大事發生”。





      DeepSeek-V4(上)和OpenAI的GPT5.5(下)

      要知道,DeepSeek的兩大撒手锏模型,2024年底發布的V3和2025年初發布的R1,以極高推理效率和極低成本,直接掀翻了大模型Scaling Law的桌子,證明“堆算力”絕不是人工智能發展的唯一路徑,導致GPU霸主英偉達一天之內市值蒸發6000億美元,創下美股史上最大單日市值損失紀錄。

      如果不是后來推理需求替代了訓練需求,全球AI算力的“敘事”都得重寫,多賺錢的GPU廠商都得迎接寒冬。

      一年多后的今天,DeepSeek-V4又來“掀桌”了。

      這一次被“掀翻”的,又是誰呢?

      掀了“模型性能桌”

      今天發布的DeepSeek-V4,兩個版本。一個叫Flash,參數少點,是多快好省的日常版,沒什么大活兒就用它;一個叫Pro,專家版,參數1.6T,主打專業高性能“服務”。

      畢竟其他AI模型的更新“日新月異”,而經歷了145天,DeepSeek才發布新模型V4,它到底厲害在哪里?

      什么數學推理能力增強、代碼輸出能力增強、多模態短板補齊、上下文窗口百萬詞元起步、API價格更低等等,其實都不是關注的重點,它們屬于AI模型“正常”的迭代升級。



      DeepSeek-V4的兩個版本,Flash版和Pro版/圖源:DeepSeek

      根據官網信息,V4有3大“厲害”的技術要點,真正值得注意。

      一是Engram記憶模塊。今年1月深度求索發表過創始人梁文鋒的署名論文,專門談這個技術要點。簡單說,Engram是一種條件記憶,可以區分靜態知識和主動知識,即只要能“查”的就不去“算”,節約算力。

      它是要解決傳統Transformer架構里,記憶和推理混在一起的問題。以前大模型累得要死,既要用“注意力”去“檢索”知識,又得用“注意力”去推理。

      而Engrame可以把那些固定的、靜態的知識存入到一個類似“字典”的查找表里,使模型能夠快速調用,就不用消耗大量算力在那“現算”了。

      實際效果是相當不錯的,模型的寶貴“注意力”資源釋放了,可以專心做組合推理任務。在實驗階段,一個集成270億參數的Engram的模型,在參數和浮點運算次數同等的條件下,性能超過MoE(混合專家)模型。



      DeepSeek表示,DeepSeek-V4-Pro性能比肩頂級閉源模型/圖源:DeepSeek

      二是mHC,也叫流形約束超連接。梁文鋒也在署名論文里介紹過,主要是想解決極深網絡訓練不穩定的問題。

      Transfomer模型就像金字塔,一層摞一層,堆疊得很深的時候,很容易出現梯度爆炸、指令消失、訓練崩潰。

      這模型就好比一座500層摩天大樓,信號是一層一層傳上去的,但如果每層都漏一點信息,等到頂樓時,指令跟噪音差不多了,傳得越多錯得越多;而且地基容易壞,樓太高,下面支撐不穩定,稍微一點搖晃樓就要塌了。

      mHC等于在摩天大樓里裝了一個自動穩定電梯。它有數學上的硬約束,“每一層”都有一個閥門,不管傳進來是什么信號,一律精準控制在一個固定范圍內:既不能讓信號太強給電梯增加負擔,也不會讓信號太弱以至于傳丟了。



      DeepSeek-V4 和 DeepSeek-V3.2 的計算量和顯存容量隨上下文長度的變化/圖源:DeepSeek

      三是CSA和HCA注意力機制創新。CSA是壓縮稀疏注意力,可以看摘要找重點;HCA是高度壓縮注意力,看大綱抓主旨。

      V4把這兩種方法交錯使用,一層CSA,一層HCA,就像一個人讀書,既粗看目錄大綱,又細看了一下各章內容摘要。這兩種創新解決了大模型處理長文本的兩個短板:卡頓、爆顯存。

      靠這三個集中的創新點,深度求索掀了“模型性能桌”。據深度求索公司內部評測,V4的編程體驗,比Anthropic的Claude Sonnet 4.5強,交付質量接近Opus 4.6非思考模式,比起Opus 4.6思考模式還有些差距。

      前幾天Opus 4.7也上線了,編程能力是強于4.6思考模式,綜合性能全球第一。這樣看,V4的性能逼近Opus4.6,也就和“全球第一”差兩個月左右。

      掀了“GPU壟斷桌”

      V4還有一個突出的本領——精打細算地榨干了GPU的性能。

      4月23日,也就是V4發布的前一天,深度求索發布了開源Tile Kernels模塊,使用的是TileLang語言。

      TileLang是一個兼具計算機語言和編譯器前端/中端的AI算子編程語言,屬于領域特定語言(DSL),由北京大學計算機學院團隊主導開發,深度求索聯合開發,2025年在GitHub上開源。去年9月,DeepSeek的V3.2-Exp模型就使用了這個語言。

      開發GPU內核,之前只能靠C++和CUDA。

      CUDA是和英偉達綁定的計算平臺加編程模型,允許軟件開發者利用計算機語言,直接調用GPU中的通用計算資源。目前全球90%以上的AI算力都跑在CUDA架構上。

      現在,TileLang拋開CUDA,用Python表達計算邏輯,再交給編譯器自動優化,直接改變了GPU優化的方式。

      而且,TileLang可以跑在任意一種芯片上。英偉達的可以,寒武紀的可以,華為昇騰也可以——同一套邏輯能夠跨硬件執行。



      TileLang-Ascend開源社區

      深度求索昨天發布的Tile Kernels模塊,是利用TileLang的Python接口編寫邏輯,然后通過TileLang的編譯器,自動生成針對特定硬件優化的底層代碼。

      其優化GPU的主要辦法包括:“瓷片”(Tile)式管理,把計算任務切成固定大小的矩陣,數據搬運整塊進、整塊出;還可以一邊算“這塊”,一邊搬“下一塊”,磨刀不誤砍柴工,讓GPU的計算狀態永遠滿載,利用率極大拉高。

      AI芯片使用的現實情況是,很多國產芯片的紙面算力很高,但實測的有效利用率只有3到4成,而英偉達芯片有CUDA的加持,利用率輕松達到6至7成。

      現在,有了處于軟件抽象層的Tile Kernels,通過Tile級的微操,國產芯片的有效算力可以真正實現與英偉達同代產品的1比1對齊。

      在使用層面,中國頂級AI芯片與英偉達頂級AI芯片的差距會越來越小。

      說到底,英偉達的GPU不是唯一選擇了,連英偉達的CUDA也不是非用不可了。英偉達的股價,恐怕又得往下走一走了。

      掀了“美國AI牌桌”

      美國放行英偉達H200已經4個月,而美國商務部長盧特尼克在4月22日表示,中國一塊也沒買。

      核心原因當然有“自力更生”的因素,也因為深度求索等中國公司已經可以挑戰英偉達幾款更先進的芯片,沒有必要買它的“限定版”舊款。

      美國本來的算盤是,偶爾小規模放行一下英偉達的舊款芯片,其他芯片禁售、模型禁用,對中國實行一波緊似一波的圍追堵截。

      而中國芯適配中國模型,已經不算新聞了。

      2025年8月DeepSeek-V3.1發布,模型推理端已經穩定支持華為昇騰910系列。今年2月,V4輕量版內測時,業內傳出其訓練和推理優先向昇騰芯片開放,暫時未向英偉達芯片開放測試權限。



      DeepSeek-V4-Flash上線華為云/圖源:華為

      很可能,從訓練到推理,V4全棧使用昇騰芯片。在這一過程中,深度求索和華為共同解決了一系列技術難題,如穩定性問題、片間互聯問題、軟件工具問題,因此V4花的時間也比較長。

      未來,V4模型明確支持華為昇騰950。昇騰950將于今年下半年推出,面向大模型訓練和推理,是昇騰910C的升級版,據悉采用全新架構,將是當下國內唯一商用、明確支持FP4低精度推理的AI加速卡,搭載華為自研國產HBM芯片。

      其次,深度求索的創新,幾乎是逆潮流而行的,和美國的路數不一樣。主流的創新,都是不斷優化模型架構,如MoE、長上下文等等;而深度求索琢磨的是GPU內核。

      而越往GPU內核走,對工程能力的要求越高。特別是Tile Kernels的意義,絕不能僅視其為算子集合,它是一套性能工程。

      深度求索這樣的世界頂級團隊,可以通過這一做法獲得數倍的效率提升,但其他團隊只能依賴框架優化等辦法、甚至無法判斷硬件性能瓶頸在哪里。

      芯片的真正瓶頸在于人,而不是代碼。V4露了一手“能力上限”,這不是“平均能力”所能達到的。



      2025年5月4日,人們在浙江省杭州市文三數字生活街區的AI黑科技市集上體驗DeepSeek的人工智能大模型/新華社發(龍巍攝)

      最后,看定價,V4依然極具市場競爭力。其中,高性能版的Pro輸入價格1元/百萬Tokens,輸出價格24元/百萬Tokens。輕量版的Flash輸入價格0.2元/百萬Tokens,輸出價格2元/百萬Tokens。

      看看美國競品“高聳入云”的價格:Claude Opus 4.7,輸入價格36.25元/百萬Tokens,輸出價格181.25元/百萬Tokens。今天發布的GPT5.5,輸入價格36.25元/百萬Tokens,輸出價格217.5元/百萬Tokens。

      靠V3和R1,DeepSeek將訓練成本極大拉低;到了V4,推理的成本也被極大拉低。

      所以,往深處說,V4的一系列創新,掀了“現有模型性能”“GPU壟斷”和“美國AI封堵”這三張牌桌,并改變了全球AI領域的競爭態勢:過去總是擔心中國AI芯片不夠“頂尖”,“落后”的壓力隨處可見。

      從今而后,中國AI模型,可以毫不焦慮地跑在中國AI芯片上了。

      首圖為新華社記者 黃宗治 攝,封面為伊一 AI制圖

      作者 |榮智慧

      編輯 | 向 現

      值班主編 | 吳擎

      排版 | 菲菲

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      里子面子都丟了,森林北自曝身體出了問題,汪峰的體面被撕碎

      里子面子都丟了,森林北自曝身體出了問題,汪峰的體面被撕碎

      素衣讀史
      2025-11-19 16:09:14
      62歲阿姨肺癌離世,常年吃清蒸魚、燉湯,醫生:禍根藏在2個細節里

      62歲阿姨肺癌離世,常年吃清蒸魚、燉湯,醫生:禍根藏在2個細節里

      搖感軍事
      2026-05-09 20:59:39
      苦等13年!深圳巨無霸城中村舊改規劃公示,周邊房價要變天

      苦等13年!深圳巨無霸城中村舊改規劃公示,周邊房價要變天

      童童聊娛樂啊
      2026-05-08 14:16:35
      澤連斯基真的失控了,這或許是俄烏戰爭即將結束的標志

      澤連斯基真的失控了,這或許是俄烏戰爭即將結束的標志

      羅富強說
      2026-05-09 14:02:37
      破大防!荷蘭大臣曾向全世界承認:沒想到中方真的叫停芯片出口

      破大防!荷蘭大臣曾向全世界承認:沒想到中方真的叫停芯片出口

      混沌錄
      2026-05-08 22:50:08
      太可怕!印度女局長深夜便衣上街,3小時被40名男性輪番冒犯

      太可怕!印度女局長深夜便衣上街,3小時被40名男性輪番冒犯

      混沌錄
      2026-05-09 16:18:12
      拉門斯:最后兩場比賽不能松勁,我們希望拿到盡可能多的積分

      拉門斯:最后兩場比賽不能松勁,我們希望拿到盡可能多的積分

      懂球帝
      2026-05-10 01:23:23
      前國手張繼科直播表示:我這沒濕巾,你們拿毛巾蘸水擦一下就行

      前國手張繼科直播表示:我這沒濕巾,你們拿毛巾蘸水擦一下就行

      鳳幻洋
      2026-05-09 15:49:48
      方世玉怎么死的?一身銅筋鐵骨,卻被師太踢中罩門,24歲英年早逝

      方世玉怎么死的?一身銅筋鐵骨,卻被師太踢中罩門,24歲英年早逝

      近史談
      2026-05-10 01:40:22
      喜訊!徐昕收到馬刺試訓邀請函 想給文班亞馬尋找替補內線

      喜訊!徐昕收到馬刺試訓邀請函 想給文班亞馬尋找替補內線

      醉臥浮生
      2026-05-09 14:26:05
      劉楚恬:2歲出道年入百萬,因長相甜美被禁止整容,如今長什么樣

      劉楚恬:2歲出道年入百萬,因長相甜美被禁止整容,如今長什么樣

      蹲坑看世界
      2026-05-07 15:09:16
      深度長文:為什么生物不朝著永生演化,反而執著于繁衍?

      深度長文:為什么生物不朝著永生演化,反而執著于繁衍?

      宇宙時空
      2026-05-07 17:15:49
      森林北清空汪峰所有動態,一句“家里的草綠了”似暗指汪峰換新歡

      森林北清空汪峰所有動態,一句“家里的草綠了”似暗指汪峰換新歡

      觀魚聽雨
      2026-05-09 21:54:29
      1998年數萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

      1998年數萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

      哄動一時啊
      2026-02-17 22:21:25
      離譜!享界座椅被指夾人,多名車主拿自己孩子當實驗品,有孩子一臉痛苦

      離譜!享界座椅被指夾人,多名車主拿自己孩子當實驗品,有孩子一臉痛苦

      可達鴨面面觀
      2026-05-08 18:42:02
      看完心酸!網貸逾期人數持續暴漲,男人欠債和女人欠債根本不一樣

      看完心酸!網貸逾期人數持續暴漲,男人欠債和女人欠債根本不一樣

      記錄生活日常阿蜴
      2026-05-08 14:06:50
      殺傷不亞于核彈!196國聯合要求禁止,目前僅有2國掌握技術

      殺傷不亞于核彈!196國聯合要求禁止,目前僅有2國掌握技術

      聞識
      2026-05-08 14:19:43
      1985年,國安叛徒藏身南美,中國6名兵王萬里鋤奸,FBI顏面盡失

      1985年,國安叛徒藏身南美,中國6名兵王萬里鋤奸,FBI顏面盡失

      文史達觀
      2026-05-08 06:45:13
      重磅!中國接力隊37秒85戰勝牙買加,“短跑王者”神話被打破?

      重磅!中國接力隊37秒85戰勝牙買加,“短跑王者”神話被打破?

      林子說事
      2026-05-09 16:03:37
      王思聰洛杉磯近照曝光!一身LV卻白發駝背,原來錢真買不回心氣兒

      王思聰洛杉磯近照曝光!一身LV卻白發駝背,原來錢真買不回心氣兒

      老吳教育課堂
      2026-05-07 18:00:58
      2026-05-10 02:28:49
      南風窗 incentive-icons
      南風窗
      冷靜地思考,熱情地生活
      2069文章數 124128關注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協議

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      體育要聞

      成立128年后,這支升班馬首奪頂級聯賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認不出!

      財經要聞

      多地號召,公職人員帶頭繳納物業費

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      數碼
      本地
      房產
      公開課
      軍事航空

      數碼要聞

      有鴻蒙·更美的——全球首臺鴻蒙智選美的智能空調上市

      本地新聞

      用蘇繡的方式,打開江西婺源

      房產要聞

      低價甩賣!海口這個地標商業,無人接盤!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美伊突然再次交火 伊朗外長:戰爭準備程度是1000%

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日韩成人综合| 丰满岳妇乱一区二区三区| 久久精品高清一区二区三区| 国产精品综合一区二区三区| 乱精品一区字幕二区| 久久久久久一品道精品免费看| 日韩精品射精管理在线观看| 色综合久久久久综合体桃花网| 成人3p在线观看| 色宗网| 男人的天堂色偷偷亚洲京东| 人妻人久久精品中文字幕| 69精品无人区国产一区| 国产乱人伦久久免费| 亚州无码人妻| 欧美精品久久天天躁免费观看| 亚洲精品成人无码中文毛片不卡| 国产亚洲精品午夜福利| 亚洲欧洲日产国无高清码图片| 精品国产一区二区三区av色诱| yeyecaoyeye| 2929免费A级毛片无码| 亚洲AV无码不卡在线播放| 四虎永久精品在线视频| 国产xxxxx| 亚洲人妻在线一区二区| 国产人妻精品久久久久久| 无码中文字| 不卡乱辈伦在线看中文字幕| 无码伊人66久久大杳蕉网站谷歌| 日韩激情无码av一区二区| 国产女人喷潮视频免费| 国产三级国产精品国产专区| 中文字幕日日夜夜| 色婷婷日日躁夜夜躁| 五月丁香影院| 欧美mv日韩mv国产网站app | 国内偷自第一区二区三区| 亚洲最大成人| 国产一级小视频| 97国产超碰一区二区三区|