<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      梁文鋒搭箭,黃仁勛難安

      0
      分享至


      “箭”已上弦,但遲遲未發

      作者 | 徹諾

      來源 | 盒飯財經(ID:daxiongfan)

      頭圖及封面來源 | 網絡及即夢制作

      不發一言,全網卻在時刻盯梢。

      3月29日晚至30日上午,DeepSeek經歷了一場大規模服務中斷。據環球時報,29日22時開始,網頁端與App全面卡頓,頻繁彈出“服務器繁忙”提示,相關功能無法正常使用。至30日清晨,仍有用戶反饋無法正常使用。

      而后,“DeepSeek崩了”相關話題迅速沖上百度、微博、今日頭條等多個平臺的熱搜榜前十。海外科技圈也在關注,除了媒體報道,更有不少專業用戶進行實測,對比前后同一任務的執行結果。

      對比外界的高度關注和推測,DeepSeek官方沒有進度通報,也沒有解釋原因。3月30日上午,官網發布公告:【已解決】DeepSeek網頁/APP性能異常,服務狀態顯示“正常”。

      3月中上旬,更是因為 OpenRouter上出現的一款名為Hunter Alpha神秘模型,而引發了猜測。當時,不少開發者認為這可能是V4的隱身測試版。后來,證明該神秘模型并非V4,是小米旗艦模型MiMo-V2-Pro的內部測試版本。而DeepSeek對該推測并未發聲。

      一動一靜,微妙的張力來自梁文鋒:“箭”已上弦,但遲遲未發。

      2024年年底V3,隨后的2025年年初R1發布,DeepSeek瞬間比肩OpenAI等巨頭,登頂中美等國App Store榜首。產品技術之外,因極低的算力成本,引發美股半導體板塊劇烈震蕩。現如今,行業正屏息以待梁文鋒的下一個大招——DeepSeek V4。然而,原本業內預期在今年一季度就會亮相的 V4,卻一再推遲。

      2月、春節前后、3月初、最早4月,外界對DeepSeek V4發布的時間猜測一路后移。除此,V4的定位、架構、性能、上下文窗口、定價、供應鏈等情況也在高度關注中,傳聞不斷。

      其中,一條供應鏈相關的報道,更是在技術之外引發了各種猜想。據路透社報道,兩位了解情況的消息人士表示,DeepSeek在即將進行重大模型更新之前,未向美國芯片制造商展示其即將推出的旗艦模型,這打破了行業標準做法。

      短短幾行字,透露的是一個“釜底抽薪”的鏈路。

      英偉達能撐起這萬億市值,靠的不僅僅是GPU硬件本身,還有其打磨了十幾年的CUDA軟件生態。CUDA就像是給全球AI開發者鋪好的一條路,沿著走總能“大力出奇跡”。但如真和上述報道透露的一樣,DeepSeek要做的便是鋪好了一條“繞過CUDA”的高速公路。

      而更戲劇性的是,從2025年12月至今DeepSeek相關方面陸續發布的論文和開源項目來看,這些推測并非空穴來風。

      拿著放大鏡找變化

      當地時間3月29日傍晚,X平臺上,名為“AiBattle”的用戶發了一條推文。

      The DeepSeek model that they serve on the WEB/APP may have been updated again The model does seem to consistently identify itself as V3 now The zero-shot coding outputs I’m getting now also seem different in style from the ones I got a few days ago It needs more testing to be completely sure

      翻譯過來,大概的意思就是:網頁和APP端上,DeepSeek模型可能已經再次更新。現在,這個模型似乎始終將其自身標識為V3版本。做了一些測試,發現零提示能力大漲,輸出的風格和幾天前不太一樣。但還需要進行更多測試才能完全確定結論。

      配圖則是兩張鵜鶘騎自行車的前后對比圖。


      通過這張對比圖,明顯能看到其空間與圖形代碼能力大幅提升。在畫面構圖、色彩搭配以及元素邏輯上,肉眼可見地碾壓一周前的版本。截至3月31日18:47,該條推文累計獲得162.8K個Views。

      用SVG(可縮放矢量圖形)畫一只騎自行車的鵜鶘,常被視為大模型空間與渲染能力“試金石”的極限測試題。

      這道測試題,來自全球知名的開源開發者、Django框架聯合創始人Simon Willison。他認為現在大模型刷榜的數據水分太大,而SVG本質上是由無數的坐標、曲線公式和顏色代碼組成的純代碼。讓一個沒有真手真眼的“純文本 AI”用代碼去精確描繪“一只鵜鶘”的生物特征和“一輛自行車”機械結構,能直接暴露出大模型的空間想象能力和代碼邏輯能力。

      一天后,該用戶補充發布了“更多測試”的結果。

      “AiBattle”表示,在7小時的宕機之后,DeepSeek可能再次對模型進行了修改。在停機之前,該模型自稱為V3版本。現在它又變回自稱“最新版本”。SVG的質量似乎也變得更差,回到了以前的狀態。


      如“AiBattle”這樣的開發者并不是少數。AI圈如同被DeepSeek“斷更”,他們拿著放大鏡,試圖找到蛛絲馬跡,以證明V4已在弦上。


      例如,他們發現知識庫截止日期可能悄悄延后了。有用戶發現,DeepSeek不開啟聯網搜索的前提下,知道2025年美國選舉結果,但對2026年2月的大事則一無所知,這使得外界推測新版本的知識截止日期可能是2026年1月。

      例如,上下文token方面。2月11日,DeepSeek悄悄把現有模型的上下文窗口從128K擴到1M tokens,并將知識截止更新到2025年5月。社區很多人把這理解為V4相關基礎設施正在上線前測試。

      底層技術論文,往往是新一代大模型的預告片和說明書。

      對比外界的推測和社區的測試,更確定的是自2025年年底以來,DeepSeek發布的論文和開源的項目。

      2025年12月31日,梁文鋒上傳發布了一篇名為《mHC: Manifold-Constrained Hyper-Connections》的論文。


      這篇文章解決了傳統Hyper-Connections在大規模訓練中信號指數放大(最高可達3000×)導致的訓練崩潰問題,以及通過將HC的殘差空間投影到特定流形,恢復恒等映射(identity mapping)屬性,保證信息守恒。

      論文中,梁文鋒的名字出現在作者一欄中。


      2026年1月,DeepSeek在GitHub上發布了一項名為“Engram”的研究成果,并同步上傳了名為《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models(基于可擴展查找的條件記憶:大語言模型稀疏性的新維度)》的論文。

      這一研究成果,被業內稱為“用哈希表替代大模型死記硬背”的神器。

      2月26日,DeepSeek聯合北京大學、清華大學發布了最新推理架構論文。論文標題為《DualPath: Breaking the Storage Bandwidth Bottleneck in Agentic LLM Inference》,解決的是Agent長文本吞吐瓶頸的框架問題。

      這或許是梁文鋒準備的三支利箭。


      有的放矢,想要榨干硬件的每一滴性能

      如今的大模型軍備競賽中,頂級AI公司發布底層技術論文,早就不是傳統意義上的“秀肌肉”了。

      這三支箭,自然也是有的放矢。

      mHC、Engram、DualPath這三項技術,表面上看分別屬于算法數學、模型架構和系統工程三個截然不同的領域,但如果把它們拼在一起,會發現它們不是孤立的學術論文。

      先看,mHC(Manifold-Constrained Hyper-Connections)。類似一個穩定的骨架,解決“練得出來”的問題。


      當模型參數飆升到幾千億甚至萬億時,傳統的殘差連接會成為信息流通的“窄門”,但隨意增加跨層連接又會導致訓練崩潰。mHC通過將這些連接約束在特定的數學流形(雙隨機矩陣)上,保證了超大模型在極深、極寬的架構下依然能穩定訓練。

      怎么直白的理解?

      這種新型的連接結構,就相當于花一點點小錢,換來團隊高效率。就好像,在AI內部稍微調整了一下“部門間的溝通機制”,雖然增加了6-7%的溝通成本,但讓整個模型在學習時再也不會出現“配合混亂”的問題,變得更穩定、更聰明。

      而Engram(條件記憶模塊),就像是外掛的硬盤,解決“記得住且夠聰明”的問題。

      基于mHC搭好的超大模型骨架,Engram開始對“大腦”進行分區。過去的大模型把所有知識都死記硬背在昂貴的神經網絡權重里,導致“推理計算”和“記憶”搶占資源。Engram 引入了全新的稀疏性,把靜態知識打包成哈希表卸載到廉價的CPU內存里,通過O(1) 極速查找,從而把極其寶貴的GPU算力100%釋放出來,專門用于復雜的邏輯推理。

      這種稀疏注意力,就相當于讓大模型學會“一目十行”和“抓重點”的能力。原本讓AI讀一篇長文,哪怕是廢話,也要逐字精讀。當AI獲得“一目十行”這一buff后,看長文的速度直接翻倍,計算壓力大大減輕。

      更直白的理解,這種知識存儲,類似于把死記硬背變成了查字典。以前AI為了記住某本書是誰寫的、某國首都是哪這樣的固定知識,需要消耗大腦大量的算力去硬記。現在DeepSeek的做法是,把這些“死知識”拎出來單獨做成了一本“字典”。AI 遇到這種問題直接去“翻字典”,不用再耗費腦力,把算力全省下來用在“邏輯推理”和“思考”。

      DualPath(雙路徑推理框架),則是高效的物流系統,解決“用得起、跑得快”的問題。


      模型練好了,大腦也變聰明了,當它作為Agent去處理幾十萬字的長文本和多輪代碼任務時,會產生海量的上下文緩存(KV-Cache)。這時候計算不再是瓶頸,“讀取硬盤數據到顯卡”的 I/O 帶寬成了瓶頸。DualPath巧妙地調用了集群中原本閑置的解碼節點(Decode)的網卡,去幫預填充節點(Prefill)搬運數據,讓端到端的吞吐量暴增近2倍。

      簡單的理解,就是AI在處理超長任務時,其實不是“腦子”不夠用,而是“手腳”搬運數據的速度太慢拖了后腿。DualPath這項技術就像一個聰明的車間主任,把別處閑置的“運輸車”調過來幫忙搬數據,直接讓整體工作效率翻了一倍。

      理論上來看,mHC,刺向了“CUDA 生態墻”,證明了非英偉達的底層硬件加上極致的數學通信優化,依然能跑通萬億參數大模型;Engram,刺向了“顯存焦慮”,把死知識踢出GPU,大幅降低推理的硬件門檻;DualPath,針對的則是“Agent 吞吐瓶頸”,大幅提升大模型的并發處理能力。

      這三項技術看似解決不同問題,但背后的技術信仰完全一致:不迷信算力堆砌,通過極致的解耦,榨干硬件的每一滴性能。

      但,這與硅谷所信奉的Scaling Law(規模法則)并不一致。Scaling Law的核心就是“大力出奇跡”,更多更先進的芯片,燒出更聰明的大模型。

      這一路徑下,大模型越做越大,對算力的需求便是無底洞。這也是黃仁勛掛在嘴邊的“The more you buy,The more you save(買得越多,省得越多)”,讓人信奉的底層邏輯。


      “算力溢價”的定價權是否會轉移

      2025年GTC大會上,黃仁勛將他那句“買得越多,省得越多”,升級為了“The more you buy, the more you make(?買得越多,賺得越多)?”。

      這句話的精妙之處,在于直接用超市打折區的標語,消解企業花幾十億美金采購顯卡的財務焦慮。在這套邏輯下,高昂的資本支出不知不覺成了極具性價比的投資。

      但,如果奇跡不一定非要大力呢?

      如果mHC、Engram、DualPath這三大底層技術真的能在商業中規模化貫通,這就意味著DeepSeek找到了一條新路,一條跳出“花錢買算力、漲參數、再買算力”循環的新路。甚至,哪怕V4遲遲未發布,但在想象中植入了一個念頭:過去堆算力的暴力美學路徑并不是唯一選擇,還可以拼算法、拼工程、拼數學。

      當地時間2月25日, 路透社經合作媒體轉載的報道指出,DeepSeek似乎已將其即將推出的旗艦模型提前給包括華為在內的中國芯片供應商做適配,但沒有同樣給英偉達或AMD預覽。

      從行業慣例來看,過去幾年,全球大部分大模型在發布前,通常會和英偉達、AMD等芯片制造商共享主要模型的預發布版本,以確保其軟件在廣泛使用的硬件上高效運行。

      底層技術論文在先,不確定的不利消息在后,心癢要撓未撓,利箭將射未射。

      對于英偉達這樣體量的企業而言,自然并不擔心少賣了幾張卡。但,如果是開辟的路線被繞開呢?那關乎的是“算力溢價”的定價權是否會轉移?如果DeepSeek V4真的把多模態和Agent的成本打到極低,甚至讓手機或PC端側推理成為主流,那么硅谷奉為圭臬的“云端算力霸權”就會動搖。

      當然,V4一天未發,以上這些都只是建立在“如果”之上的推測。

      商業世界的殘酷在于,有想法有野心,并不意味著立刻就能鋪平新道。V4一直未發布,或許也有這類原因存在。

      但,DeepSeek 的核心邏輯始終清晰:用算法效率彌補硬件劣勢,用開源策略強化商業模式,用效率革命挑戰算力暴力。一旦V4正式落地,市場震蕩將再次不可避免——問題不是“會不會”,而是“何時”。

      參考資料:

      1.《DualPath: Breaking the Storage Bandwidth Bottleneck in Agentic LLM Inference》,https://arxiv.org/abs/2602.21548

      2.《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》,https://github.com/deepseek-ai/Engram

      3.《mHC: Manifold-Constrained Hyper-Connections》,https://arxiv.org/abs/2512.24880

      4.《DeepSeek to launch new AI model focused on coding in February, The Information reports》,Reuters

      5.《DeepSeek V4 什么時候發布?2026 最新消息、規格與值得關注的重點》,Jessie,

      https://evolink.ai/zh/blog/deepseek-v4-release-window-prep

      6.《DeepSeek宕機8小時后升級?新模型能力大增引熱議》,第一電動網

      7.《消息稱DeepSeek V4模型讓華為等早期訪問,不讓英偉達AMD先用》,IT之家

      8.《DeepSeek V4 Is Coming This Month. Why It Could Rattle the Markets, Again.》

      9.《Exclusive-DeepSeek withholds latest AI model from US chipmakers including Nvidia, sources say》,Reuters

      歡迎在評論區留言~如需開白請加微信:YPYP01234567

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      韓媒:中國人怒了,砸34億贊助世界杯,卻還要花大錢買轉播權

      韓媒:中國人怒了,砸34億贊助世界杯,卻還要花大錢買轉播權

      寒律
      2026-05-14 10:38:36
      事關臺灣問題,中方說了三句重話,特朗普聞言,態度像變了一個人

      事關臺灣問題,中方說了三句重話,特朗普聞言,態度像變了一個人

      蘭亭墨未干
      2026-05-14 16:34:56
      隨著騎士加時4分險勝,NBA季后賽最新排名出爐!東部第一命懸一線

      隨著騎士加時4分險勝,NBA季后賽最新排名出爐!東部第一命懸一線

      薇說體育
      2026-05-14 11:43:28
      “性質惡劣!”新西蘭父子在海洋保護區“狂撈”486只鮑魚,企圖販賣!“被判四個月居家監禁! ”

      “性質惡劣!”新西蘭父子在海洋保護區“狂撈”486只鮑魚,企圖販賣!“被判四個月居家監禁! ”

      新西蘭天維網
      2026-05-13 13:05:51
      中方一錘定音給特朗普最高禮遇,普京通告全球:中俄關系獨一無二

      中方一錘定音給特朗普最高禮遇,普京通告全球:中俄關系獨一無二

      古史青云啊
      2026-05-13 09:59:29
      張柏芝現身 4S 店,為剛考取駕照的大兒子 Lucas 提國產新車

      張柏芝現身 4S 店,為剛考取駕照的大兒子 Lucas 提國產新車

      老吳教育課堂
      2026-05-14 17:43:56
      王一博回應結婚,網友:祝福。

      王一博回應結婚,網友:祝福。

      美芽
      2026-05-13 12:09:53
      錢再多有什么用?2個女兒慘死3個兒子反目,資產1250億也無人送終

      錢再多有什么用?2個女兒慘死3個兒子反目,資產1250億也無人送終

      北緯的咖啡豆
      2026-04-08 17:09:30
      江青書信曝光!鋼筆字竟暗藏驚人秘密,書法之爭誰勝出?

      江青書信曝光!鋼筆字竟暗藏驚人秘密,書法之爭誰勝出?

      書畫相約
      2026-04-14 07:21:03
      網傳某地事業編欠薪10個月,社保斷繳已鬧上百姓呼聲!

      網傳某地事業編欠薪10個月,社保斷繳已鬧上百姓呼聲!

      燈錦年
      2026-05-13 19:39:30
      浙江寶寶“九個頭旋”引熱議,兒保醫師:頭旋數量和智商、性格無直接關系

      浙江寶寶“九個頭旋”引熱議,兒保醫師:頭旋數量和智商、性格無直接關系

      上游新聞
      2026-05-14 10:33:07
      U17國足VS沙特:4231最強出擊,萬項領銜前場進攻,海歸新星沖鋒

      U17國足VS沙特:4231最強出擊,萬項領銜前場進攻,海歸新星沖鋒

      零度眼看球
      2026-05-14 06:46:02
      這售價要超200萬了吧!消息稱華為、江淮、瑪莎拉蒂聯手造車:最快2027年見到“瑪界”

      這售價要超200萬了吧!消息稱華為、江淮、瑪莎拉蒂聯手造車:最快2027年見到“瑪界”

      快科技
      2026-05-14 11:54:52
      日航司高度焦慮!7月起,日本過華領空成本劇增,交錢也未必能批

      日航司高度焦慮!7月起,日本過華領空成本劇增,交錢也未必能批

      鐵錘簡科
      2026-05-14 13:24:35
      馬斯克太興奮了!360度狂拍照,網友笑瘋了

      馬斯克太興奮了!360度狂拍照,網友笑瘋了

      李東陽朋友圈
      2026-05-14 17:58:49
      印度每年榨糖,剩下7500萬噸甘蔗渣,中國人卻用它造出了科技王炸

      印度每年榨糖,剩下7500萬噸甘蔗渣,中國人卻用它造出了科技王炸

      毒sir財經
      2026-05-12 19:34:07
      程維高并非被一擼到底,下臺后享受副省級待遇,活了78歲

      程維高并非被一擼到底,下臺后享受副省級待遇,活了78歲

      史不語
      2026-05-13 08:10:10
      寧夏惡魔,白天在謝晉電影里演好人,晚上回家當閻王,殺人喂狗!

      寧夏惡魔,白天在謝晉電影里演好人,晚上回家當閻王,殺人喂狗!

      莫地方
      2026-05-14 00:55:03
      侮辱、誹謗小米汽車 四個賬號博主一審均敗訴

      侮辱、誹謗小米汽車 四個賬號博主一審均敗訴

      閃電新聞
      2026-05-13 17:52:31
      特朗普給美國埋下一個14年大雷,現在他只能賭一把“自求多福”?

      特朗普給美國埋下一個14年大雷,現在他只能賭一把“自求多福”?

      茶韻浮生
      2026-05-14 20:29:14
      2026-05-14 21:40:49
      盒飯財經 incentive-icons
      盒飯財經
      約會最好的商業思想
      1321文章數 16880關注度
      往期回顧 全部

      財經要聞

      李強會見美國工商界代表

      頭條要聞

      重慶"萌感"佛頭意外走紅 雕刻者:不是文物且尚未完工

      頭條要聞

      重慶"萌感"佛頭意外走紅 雕刻者:不是文物且尚未完工

      體育要聞

      爭議抽象天王山,和季后賽最穩定中鋒

      娛樂要聞

      何九華官宣當爸!全程不提孩子媽

      科技要聞

      馬斯克說會談很順利 黃仁勛點贊 庫克比耶

      汽車要聞

      雙零重力座椅/AI智能體/調光天幕 啟境GT7內飾發布

      態度原創

      家居
      數碼
      親子
      房產
      手機

      家居要聞

      精神奢享 對話塔尖需求

      數碼要聞

      小米耳夾式耳機官宣,17Max樣張公布

      親子要聞

      監控下的幼兒園小可愛,主動幫老師搬桌開門,邏輯超在線

      房產要聞

      海南樓市新政要出!擬調公積金貸款額度,最高可貸168萬!

      手機要聞

      vivo S60預熱開啟,超大面積一體冷雕玻璃

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲 成人 无码 在线观看| 亚洲AV乱码毛片在线播放| 国产精品午夜福利精品| 久久精品国产亚洲成人av| 亚洲成人av综合一区| 亚洲日韩国产精品第一页一区| 妖精视频yjsp毛片永久| 亚洲精品一区二区区别| 亚洲欧洲日产国码AV天堂偷窥| 久久亚洲精品无码播放| 福利区免费在线观看视频| av无码天堂| 精品无套内射后入少妇| 黄色A级国产免费大片视频| 免费午夜无码片在线观看影院| 日本视频一两二两三区| 亚洲少妇一区二区三区| 襄汾县| 中文字幕av一区二区三区| 国产白浆一区二区三区| 国产精品午夜福利清纯露脸| 视频一区视频二区制服丝袜| 高清在线一区二区三区视频| 久久精品一区二区免费在线观看| 无码精品国产D在线观看| 超碰人人摸| 国产91成人亚洲综合在线| 福利视频一区二区在线| 精品人妻中文无码AV在线| 无码人妻丰满熟妇精品区| 久久偷拍视频只有精品| 狠狠撸网| 国产亚洲精品成人aa片新蒲金| 亚洲av无码牛牛影视在线二区 | 亚洲日本中文字幕乱码中文| 久色导航| 人妻少妇av中文字幕乱码| 欧美久久久久久精选大尺度 | 么公的好大好硬好深好爽视频| 天堂av成人网在线观看| 久久精品国产77777蜜臀|