<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      給 DeepSeek 的最后一封催更信

      0
      分享至

      當(dāng)"中國團(tuán)""中國鏈""中國環(huán)"三重?cái)⑹陆豢棾尚危?dāng)編程、多模態(tài)、Agent、OpenClaw四波浪潮過去而無DeepSeek身影,當(dāng)Anthropic按$0.08/小時(shí)出租"數(shù)字勞動(dòng)力"重構(gòu)商業(yè)邏輯,開源生態(tài)與Token經(jīng)濟(jì)都在等待DeepSeek V4的第三次助推。人民想念的不僅是更便宜的Token,更是那個(gè)能用萬億參數(shù)基座、原生多模態(tài)、超強(qiáng)Agent能力"搞個(gè)大的"的破局者,來定義中國AI的下一步。

      ———— / BEGIN / ————

      前段時(shí)間,刷屏,文章提到一點(diǎn)——DeepSeek推動(dòng)了全球大模型的降本,讓用戶和行業(yè)得以享受更便宜的Token。

      關(guān)鍵的問題是,“小龍蝦”這類智能體應(yīng)用的瘋狂“燒Token”,再次推高用戶的使用成本,這種情況下,推動(dòng)全行業(yè)降本增效的重任又落到了DeepSeek的肩上。

      算算時(shí)間,DeepSeek V3、R1發(fā)布已一年有余,外界原本預(yù)期DeepSeek V4今年春節(jié)會(huì)來炸場,但最終希望落空。不過,從近期宕機(jī)、專家模式上線等一系列動(dòng)態(tài)來看,感覺DeepSeek V4有可能離我們越來越近了。

      所以,這可能也是最后一次“催更”DeepSeek。

      在這封催更信里面,我想和那些想念DeepSeek的朋友,聊聊中國AI的敘事、技術(shù)進(jìn)化的浪潮、生態(tài)競爭、Token經(jīng)濟(jì)學(xué)這些話題。

      中國AI敘事已變

      2025年春節(jié),DeepSeek R1以低成本+高性能+開源亮相,發(fā)布即巔峰。不僅在國產(chǎn)大模型領(lǐng)域一騎絕塵,而且風(fēng)靡世界,互聯(lián)網(wǎng)平臺、IT巨頭、各行各業(yè)紛紛接入,且擁抱開源,形形色色的DeepSeek一體機(jī)都嘗試著搶戲。

      在那段時(shí)間,談及中國AI,言必稱DeepSeek,毫不夸張的說,街頭的爺爺奶奶都可能在談?wù)摚踔潦褂眠@款國產(chǎn)AI助手。

      只是,過去一年人工智能產(chǎn)業(yè)和中國的AI敘事,早已不是一重天:圍繞人工智能的“中國團(tuán)”“中國鏈”“中國環(huán)”——三重?cái)⑹陆豢棾尚巍eepSeek獨(dú)撐的AI中國敘事,失去了色彩。

      所以,在這個(gè)角度看大模型和人工智能,大家缺的不光是算力、電力,缺的也是時(shí)間窗口。

      關(guān)于“中國團(tuán)”,我把它概括為“(3+1)+6+N”,其中“3+1”是四大廠,對應(yīng)字節(jié)、阿里、騰訊和百度,后面三家是互聯(lián)網(wǎng)時(shí)代的三巨頭,大家熟知的BAT。而數(shù)字“6”對應(yīng)的是大模型時(shí)代的“六小虎”——Kimi、智譜、MiniMax、階躍星辰、百川、面壁智能,主要幾家在DeepSeek埋頭自研的時(shí)候,完成了上市或者在沖刺上市。

      “六小虎”里面原來是有李開復(fù)的零一萬物的,但在第一次百模大戰(zhàn)中,零一萬物開始掉隊(duì),所以這里我們把面壁智能放了進(jìn)來,但其實(shí)百川過去一年多,聲量也逐漸微弱。

      “N”其實(shí)不單只某一家,它對應(yīng)的是其他垂類模型和專業(yè)市場的AI企業(yè)。

      總計(jì)10家/類企業(yè)構(gòu)成了中國大模型產(chǎn)業(yè)頭部態(tài)勢,他們已不是散兵游勇,而是一個(gè)具有集群競爭力的產(chǎn)業(yè)軍團(tuán),也是DeepSeek再次封神之路上,必須要逾越的對手。

      與“中國團(tuán)”同步成長的也包括“中國鏈”——從芯片算力、集群/云、數(shù)據(jù)語料、算法/模型、智能體、AI應(yīng)用開發(fā)生態(tài),已經(jīng)完成了全鏈貫通,成為全球范圍內(nèi)唯二的智能科技全產(chǎn)業(yè)鏈國家,有希望為全球智能基礎(chǔ)設(shè)施多提供一種選擇,也有希望以能力經(jīng)濟(jì)的能力輸出為全球智能普惠提供新的公共品。

      這一點(diǎn)大家不要懷疑,DeepSeek R1當(dāng)年的確打出了中國模型在海外的品牌,但現(xiàn)在MiniMax這些廠商,在海外的業(yè)務(wù)一樣做得有聲有色。

      而關(guān)于“中國環(huán)”,覆蓋了產(chǎn)業(yè)、應(yīng)用和投資三個(gè)方面——從AI到AI4S再到現(xiàn)代產(chǎn)業(yè)群的產(chǎn)業(yè)閉環(huán),從AI科技到千行百業(yè)、億萬家庭的市場應(yīng)用閉環(huán),從早期投資到上市退出的資本閉環(huán)。閉環(huán)初步成形不僅意味著人工智能在中國跑通,更意味著智能經(jīng)濟(jì)不同層面的大循環(huán)小循環(huán)由此貫通。

      從團(tuán)、鏈到環(huán),中國的AI敘事已然發(fā)生改變。

      不考慮企業(yè)免費(fèi)的營銷策略,2026年初以來,六小虎的模型在OpenRouter等國際平臺上的Token消耗量占比接連領(lǐng)先,且總體份額過半,主要是海外用戶。

      概括來說,2025年中國的開源力量改變了全球人工智能發(fā)展格局。到了2026年,中國人工智能發(fā)展進(jìn)入向外能力輸出階段。

      從全球大模型和人工智能產(chǎn)業(yè)的視角來看,技術(shù)路徑的多元化,增強(qiáng)了人才流動(dòng)活力,有利于供應(yīng)鏈韌性。對于下游的應(yīng)用開發(fā)者而言,多家可選供應(yīng)商的存在意味著更強(qiáng)的議價(jià)能力和更低的鎖定風(fēng)險(xiǎn)。

      在中國的AI敘事里面,還有一個(gè)比較好的現(xiàn)象在于,市場還沒有被少數(shù)寡頭壟斷,這對于競爭創(chuàng)新和人才生態(tài)建設(shè)是好事,也有利于在中美AI競爭中形成集群優(yōu)勢。

      四波浪潮已經(jīng)過去

      中國古典神話總說“天上一天,人間一年”,DeepSeek“斷更”的這一年,人工智能已經(jīng)過去了四次浪潮——編程、多模態(tài)、智能體、OpenClaw(小龍蝦)。

      當(dāng)GitHub Copilot、Cursor、Claude Code等AI編程工具席卷開發(fā)者社區(qū)時(shí),在Vibe Coding的故事中,人們很難記得起DeepSeek的存在,盡管它也會(huì)被用到編程場景。

      編程,這個(gè)人工智能席卷一切行業(yè)的底層驅(qū)動(dòng)、開發(fā)者最剛需的場景,如今在國外被Anthropic等牢牢占據(jù),在國內(nèi)成了Kimi們跑馬圈地的戰(zhàn)場。

      而在多模態(tài)這波浪潮中,Gemini 3 Pro等在視覺理解、圖像生成領(lǐng)域均有不俗表現(xiàn),大家能夠記得的是Nano Banana,而在視頻生成領(lǐng)域,是字節(jié)的Seedance 2.0。

      DeepSeek像是一個(gè)慢熱的選手,直到V3.2才開始灰度測試百萬Token上下文,多模態(tài)能力更是還沒到來。

      有人說,在大模型領(lǐng)域,一旦一代產(chǎn)品技術(shù)路線錯(cuò)了,就會(huì)錯(cuò)過一個(gè)時(shí)代?DeepSeek是卡在這里了嗎,也很難說。

      第三波浪潮是Agent-多Agent-蜂群智能。相比AI助手的理解和對話能力,Agent已經(jīng)進(jìn)化到了執(zhí)行層面,從“答題”轉(zhuǎn)向“解題”——過去是“被動(dòng)應(yīng)答”,現(xiàn)在則是“主動(dòng)執(zhí)行”。在這波浪潮中,Manus等產(chǎn)品的涌現(xiàn),標(biāo)志著AI Agent正在從概念走向落地,Kimi Agent Swarm則將這一波推向高潮。

      DeepSeek在這一波浪潮中,更多只是作為模型被調(diào)用,不是Agent生態(tài)的構(gòu)建者,模型本身對Agent、工具、代碼的支持水準(zhǔn)也比較有限。

      時(shí)間來到2026年,以O(shè)penClaw等各類Claw、Claude Code、Claude Cowork等為代表的行動(dòng)智能浪潮開始出現(xiàn),它們的能力實(shí)際已經(jīng)超越Agent層面,成為接管型應(yīng)用操作系統(tǒng)——應(yīng)用AI OS。

      只不過,OpenClaw這類產(chǎn)品也被戲稱為“Token黑洞”,其單任務(wù)的Token消耗量是傳統(tǒng)對話AI的幾十倍甚至上百倍。這種高投入低產(chǎn)出的模式,在產(chǎn)業(yè)規(guī)模化應(yīng)用中面臨可持續(xù)性難題,產(chǎn)品本身的粗糙、不穩(wěn)定和多次破壞性的版本迭代,像極了毛坯房。

      所以有人在喊“人民想念DeepSeek”也不奇怪,畢竟幾波浪潮,都沒了它的影子,畢竟人民需要它來推動(dòng)中國大模型的降本增效。

      但必須要說的是,OpenClaw確認(rèn)應(yīng)用AI OS、通用行動(dòng)智能體的邏輯是成立的,而且時(shí)機(jī)到了。它告訴所有人,AI不再只是工具,而可以是全能的接管型代理。

      所以3月“全民養(yǎng)蝦”大潮里面,你看大家抄作業(yè)速度多快,為了推廣本土產(chǎn)品,大家都開始送起了“賽博雞蛋”,因?yàn)镺penClaw讓包括Anthropic在內(nèi)的大廠瞬間看明白,原來包打一切的應(yīng)用OS、行動(dòng)智能就近在眼前,腦子都有了,任務(wù)也能執(zhí)行,長出個(gè)手腳變成通用智能體還不容易!

      也是因?yàn)檫@個(gè)原因,Anthropic反應(yīng)、反制都是最快的,也是對Claw沖擊最大的。Claude Code包抄OpenClaw后路,其它大廠又紛紛快速抄Claude Code和OpenClaw的作業(yè)。這就是眼前正在發(fā)生的事。

      之所以兵家必爭,是因?yàn)檫@件事的入口地位、巨大價(jià)值以及未來的生態(tài)支配地位,不亞于模型,不亞于前三波浪潮。

      如果說大模型在積蓄力量,多模態(tài)是拓寬場景,Agent代表撒種子,那么對生態(tài)進(jìn)行大面積收割要靠應(yīng)用AI OS、通用行動(dòng)智能體,現(xiàn)在已經(jīng)多多少少有些終局的意味和終極形態(tài)的影子。到了EI內(nèi)生智能、II自主智能階段,可能要另當(dāng)別論。

      不過,就今天OpenClaw的投入產(chǎn)出比來說,能占據(jù)AI OS、通用行動(dòng)智能體生態(tài)位的可能不是它。

      所以在這最后一份致DeepSeek的催更信里面,我們也想提一個(gè)問題:沒有第一時(shí)間跳進(jìn)這四條河流的DeepSeek,是不是在選擇蓄力,希望通過V4以及之后的基座模型“搞個(gè)大的”?

      只是,市場從不等待,用戶的注意力、開發(fā)者的熱情、資本的流向,都在一波又一波的浪潮中被分流。這四波浪潮所在的領(lǐng)域,競爭門檻都已急劇抬高,生態(tài)化成本也大幅度增加。

      DeepSeek的故事,只能停留在2025年的春節(jié)嗎?

      全生態(tài)競爭到來

      之前我的看法是,頭部企業(yè)已經(jīng)到了全生態(tài)競爭階段。在這個(gè)階段,全棧AI能力是接下來巨頭角力的基礎(chǔ),最好的例子就是Google。

      Google之所以在Gemini 3 Pro那一波受到高度關(guān)注,源于他們在四個(gè)方面累積的“厚度”優(yōu)勢逐步顯現(xiàn):模型原理原力持久進(jìn)化度(Evolutionary Index)、數(shù)據(jù)深度(Data Index)、全鏈生態(tài)廣度(Ecological Index)、智能連接度(Connectivity Index)。

      谷歌CEO皮查伊在任差不多10年了,在剛剛的訪談中,他回憶了Transformer被ChatGPT搶跑的這段意難平的往事,但是他不認(rèn)為失去先發(fā)優(yōu)勢就會(huì)輸,他把谷歌的優(yōu)勢總結(jié)為全棧垂直整合。

      所以到了Gemini 3 Pro,基于這種全棧整合,谷歌打了一個(gè)漂亮的翻身仗。

      可以大膽的預(yù)判一下,2026年,美國人工智能產(chǎn)業(yè)頭部的競爭,可能的節(jié)奏是Anthropic先拔得頭籌,Google緊接著全線壓上,而搶跑的OpenAI面臨左右包夾的局面,最終四強(qiáng)變?nèi)龔?qiáng),掉隊(duì)的那一強(qiáng)是被進(jìn)一步拉開差距的Grok。

      2026年的GTC,在前期預(yù)熱環(huán)節(jié),黃仁勛少有的寫了一篇文章,提出了“五層蛋糕理論”:能源 → 芯片 → AI基礎(chǔ)設(shè)施 → 模型 → 應(yīng)用。

      但如果要拆得更細(xì),人工智能的競爭也體現(xiàn)在芯片算力、數(shù)據(jù)語料、模型基座、開發(fā)工具與開發(fā)者、智能體與工具技能、應(yīng)用服務(wù)這些環(huán)節(jié),每一個(gè)環(huán)節(jié)的失位都可能導(dǎo)致整體競爭力下降,而競爭、投資的門檻,已經(jīng)成為了百億、千億美元級的重資產(chǎn)游戲。

      創(chuàng)新,不再限于“彎道超車”,更在于系統(tǒng)比拼、體系對抗。尤其是大模型所依賴的資本、算力、算法和數(shù)據(jù)等要素,成為決定性的關(guān)鍵因素,吃一顆大力丸,吃一碗海參,解決不了太多問題。

      全生態(tài)競爭的格局中的DeepSeek,原理產(chǎn)生原力——底層突破——雖然還有優(yōu)勢,但短板也同樣明顯:缺乏IT巨頭的產(chǎn)業(yè)生態(tài)鏈支持,產(chǎn)品應(yīng)用功能相對單薄,多模態(tài)與Agent生態(tài)建設(shè)有待加強(qiáng)。

      Token經(jīng)濟(jì)崛起

      Token經(jīng)濟(jì)新年起勢,Token經(jīng)濟(jì)是智能經(jīng)濟(jì)作為能力經(jīng)濟(jì)的價(jià)值閉環(huán),這是我在央廣網(wǎng)采訪中的觀點(diǎn)。

      過去,在工業(yè)時(shí)代,能源單位是千瓦時(shí),在數(shù)字時(shí)代的流量單位是GB,智能時(shí)代的能力產(chǎn)品的供給單位就是Token,Token讓AI的“能力”成為可計(jì)量、可定價(jià)、可交易的商品。

      你可以這樣理解:Token成為了連接技術(shù)與商業(yè)的“結(jié)算單位”,進(jìn)而使得能力經(jīng)濟(jì)的商業(yè)閉環(huán)正在形成。

      Token的消耗量,正在以幾何級增長速度膨脹——中國日均Token調(diào)用量從2024年初的1000億躍升至2026年3月的140萬億,兩年增長超千倍,消耗的越多,就代表著能力經(jīng)濟(jì)的蓬勃發(fā)展。

      對于企業(yè)來說,通過價(jià)格杠桿實(shí)現(xiàn)毛利率提升,這意味著它的盈利模式局部已經(jīng)跑通。

      只不過,Token是計(jì)量單位,不是計(jì)質(zhì)單位。產(chǎn)業(yè)界不能只看Token數(shù)量,更要關(guān)注背后的“能力質(zhì)量”。所以,我覺得未來Token經(jīng)濟(jì)的分化會(huì)很明顯——能力水準(zhǔn)高的Token賺錢,能力水準(zhǔn)低的Token虧錢,后者甚至被淘汰。

      所以,小米的羅福莉在給MiMo大模型套餐“帶貨”的時(shí)候說:“當(dāng)前全球算力供給已經(jīng)跟不上Agent創(chuàng)造的token需求。真正的出路不是更便宜的token,而是共同進(jìn)化——更省token的Agent框架與更強(qiáng)大、更高效的模型的協(xié)同。”

      今年有一個(gè)很典型性的趨勢,用戶一邊在喊Token貴,一邊又在給Token付費(fèi),本質(zhì)上是消耗的一部分Token轉(zhuǎn)化為了生產(chǎn)力,而當(dāng)Token付費(fèi)成為潮流,企業(yè)就可以獲得營收才能投入研發(fā)更高水準(zhǔn)模型,這是在為智能經(jīng)濟(jì)造血。

      模型、智能體企業(yè)商業(yè)化最直接的兩條路:要么靠付費(fèi)訂閱回血,要么通過API以Token資費(fèi)套餐造血。OpenAI在AI助手的對話下面關(guān)聯(lián)廣告這種做法,存在著太多的不確定性,行業(yè)里還沒有第二家跟著出牌。

      我認(rèn)為,在推理驅(qū)動(dòng)的Token經(jīng)濟(jì)時(shí)代,率先跑通的場景我認(rèn)為有三類:高價(jià)值高密度場景(如金融風(fēng)控、醫(yī)療診斷,客戶愿為“不出錯(cuò)”支付溢價(jià));高頻高剛需場景(如智能客服、代碼生成,靠規(guī)模攤薄成本);以及Agent智能體廣泛應(yīng)用的場景。

      未來,Token會(huì)像水像電一樣成為基礎(chǔ)服務(wù),薄利、普惠、泛在。單位Token成本會(huì)持續(xù)下降,但Token經(jīng)濟(jì)會(huì)分層:常規(guī)能力水準(zhǔn)的Token趨向薄利,以量取勝;高能力水準(zhǔn)、高價(jià)值的Token可能持續(xù)保持溢價(jià)。

      更具象地說,能夠構(gòu)建場景+數(shù)據(jù)+平臺+模型閉環(huán)、提供高價(jià)值智能體服務(wù)的企業(yè)將獲得溢價(jià)。

      量化投資出身的DeepSeek雖不差錢,但從可持續(xù)發(fā)展角度來看,也需要擁抱Token經(jīng)濟(jì)。

      開源生態(tài)等待第三次轉(zhuǎn)折

      過去一年多時(shí)間,開源生態(tài)格局變了。

      2025年初,DeepSeek對開源生態(tài)完成了第一次引爆。今年初,OpenClaw完成了對開源生態(tài)的第二次神助攻。第一次引爆使得一些閉源模型也向開源靠攏,國內(nèi)如百度等巨頭加入開源陣營,海外如OpenAI、Google等也在加大開源力度。

      根據(jù)OpenRouter平臺對100萬億Token調(diào)用數(shù)據(jù)的分析,開源模型的市場份額已攀升至33%。中國開源模型的異軍突起尤為引人注目,OpenRouter平臺前六位當(dāng)中一度有五家是中國的開源模型。

      開源模型的崛起,是由技術(shù)迭代、用戶需求和經(jīng)濟(jì)因素共同驅(qū)動(dòng)的結(jié)果。企業(yè)選擇開源模型的核心動(dòng)因變得非常現(xiàn)實(shí):閉源API成本與調(diào)用規(guī)模強(qiáng)相關(guān),邊際成本不可控;自托管開源模型在高并發(fā)、長上下文、Agent場景中,單位成本顯著下降。

      用直白的話說,只要能力在線,開源模型在私有化部署場景下,用得越多,就越便宜。作為開源模型生態(tài)的攪局者,DeepSeek在2026年,大概率還會(huì)對開源業(yè)態(tài)再次助推一波。

      這種預(yù)想中的推動(dòng)涵蓋了算力成本的產(chǎn)業(yè)沖擊效應(yīng)、用戶市場的引爆效應(yīng)、開源生態(tài)的激發(fā)效應(yīng),以及對于市場信心的提振效應(yīng)等,可能會(huì)再次出現(xiàn)。

      這是人民想念DeepSeek的底層邏輯,價(jià)格只是一個(gè)表象。

      開源雖好,但建設(shè)仍然任重道遠(yuǎn)。

      對DeepSeek來說,它還需要盡快形成開發(fā)者生態(tài),支持Agent開發(fā)生態(tài),建立Apps以及類似Skills的技能封裝與分發(fā)渠道,以提升開放性、靈活性,同時(shí)吸引更多開發(fā)者參與其中。

      期待DeepSeek再次成為開源生態(tài)的關(guān)鍵一推。

      對V4的期待不是過去的標(biāo)準(zhǔn)

      大洋彼岸的懸念是,OpenAI和Anthropic的下一代模型能打到什么程度,Super App能不能像正在生態(tài)化的Claude Code一樣成為應(yīng)用OS和通用行動(dòng)智能體,以及Coding這把生態(tài)底層尖刀誰最快,這三件事會(huì)影響今年的大風(fēng)向。

      從現(xiàn)在的局勢來看,Anthropic的火已經(jīng)快燒到OpenAI的大本營了,這一點(diǎn)可以翻閱華爾街日報(bào)披露的兩家財(cái)務(wù)數(shù)據(jù),Anthropic有可能搶在OpenAI之前扭虧為盈。

      在這種背景下,我們期待DeepSeek的什么呢?

      把前文的這些觀點(diǎn)總結(jié)一下,它應(yīng)該包括V4、R2實(shí)現(xiàn)代際跨越、100萬Token的上下文窗口(剛剛開始灰度測試)、原生多模態(tài)能力、萬億參數(shù)級別的基礎(chǔ)模型應(yīng)該是最基本的起點(diǎn)。

      可是,這些都是過去的標(biāo)準(zhǔn),不應(yīng)該是V4、R2的能力上限。站在今天這個(gè)時(shí)間段,DeepSeek需要的是在多Agent能力、工具使用、電腦操作以及背后超強(qiáng)的代碼能力上實(shí)現(xiàn)突破。

      大家也不用過度焦慮,AI Agent雖大熱,但目前仍處于已有能力整合的階段,離真正意義上的自主智能體尚有距離。

      未來,AI Agent可能會(huì)出現(xiàn)四種路徑:云端虛擬機(jī)整合、本地與云協(xié)同的端側(cè)混合模式、通過協(xié)議實(shí)現(xiàn)智能互聯(lián),或以“超級OS”形式重構(gòu)所有高頻應(yīng)用入口。不管哪一種路徑,它最終都將成為個(gè)人智能服務(wù)的樞紐,成為未來競爭的戰(zhàn)略制高點(diǎn)。

      舊的標(biāo)準(zhǔn)已不匹配DeepSeek V4,所以在這封催更信里面,我對它的期待不僅是一個(gè)更強(qiáng)大的語言模型,更是一個(gè)能夠自主執(zhí)行復(fù)雜任務(wù)、整合多種工具、與外部環(huán)境高效交互的智能體基座。

      就像前面說的,期待它“搞個(gè)大的”,而DeepSeek實(shí)際進(jìn)行的模型原理探索與產(chǎn)品技術(shù)進(jìn)展,似乎也在印證這個(gè)“大”節(jié)奏。

      去年10月以來,DeepSeek在大模型領(lǐng)域的論文發(fā)布與產(chǎn)品局部更新動(dòng)作持續(xù)加速,形成了密集的創(chuàng)新節(jié)奏。

      從2025年12月發(fā)布DeepSeek-V3.2,到2026年1月集中放出mHC、Engram、DualPath等三項(xiàng)核心架構(gòu)論文并大幅更新和擴(kuò)展之前發(fā)布的R1技術(shù)報(bào)告,整體研發(fā)呈現(xiàn)出覆蓋架構(gòu)創(chuàng)新、推理效率、多模態(tài)、智能體能力的立體化推進(jìn)態(tài)勢。這一系列工作被普遍視為下一代旗艦?zāi)P虳eepSeek-V4的技術(shù)前奏。

      DeepSeek并未正式確認(rèn)這些創(chuàng)新將如何融入V4最終架構(gòu),但論文的作者署名(包括創(chuàng)始人梁文鋒)、代碼泄露以及平臺可見的變化均指向這一方向。

      2025年10月的DeepSeek-OCR系列探索了將文本信息通過視覺表征進(jìn)行壓縮的可能性,顛覆了“文本token比視覺token更高效”的傳統(tǒng)假設(shè)。OCR 2的視覺因果流機(jī)制進(jìn)一步讓模型能夠像人一樣依據(jù)版面邏輯“看懂”文檔,而非機(jī)械掃描。這為多模態(tài)模型理解和處理極其冗長的文檔(如整本書、整份財(cái)報(bào))提供了全新的思路,有望將大模型的上下文窗口擴(kuò)展至數(shù)千萬token量級,而無需承受平方級的計(jì)算復(fù)雜度增長。

      mHC技術(shù)針對的是萬億參數(shù)級模型訓(xùn)練中的根本性難題:信號爆炸,突破“深層網(wǎng)絡(luò)穩(wěn)定性”這一規(guī)模化發(fā)展的瓶頸,為萬億參數(shù)級開源模型的訓(xùn)練鋪平道路。也有助于在不依賴先進(jìn)制程芯片的情況下,通過架構(gòu)創(chuàng)新實(shí)現(xiàn)模型深度擴(kuò)展。

      Engram面向長上下文與持續(xù)學(xué)習(xí)的工程化解決,其條件記憶機(jī)制理論上支持跨會(huì)話的持久化記憶,突破當(dāng)前大模型“無狀態(tài)”推理的限制,推理效率不再被知識密度所拖累。它挑戰(zhàn)了傳統(tǒng)Transformer“以計(jì)算換記憶”的設(shè)計(jì)范式。該方法將靜態(tài)知識存儲在外部稀疏表中,使模型前饋網(wǎng)絡(luò)專注于動(dòng)態(tài)推理。這種“神經(jīng)-符號”混合架構(gòu)使模型在保持百萬token級上下文的同時(shí),有希望顯著降低推理成本。

      2025年12月的V3.2版本已經(jīng)初步展現(xiàn)出“跨工具記憶保持”能力,解決了傳統(tǒng)AI Agent在多工具調(diào)用時(shí)丟失推理鏈的問題,并且通過稀疏注意力機(jī)制使128K長上下文推理成本降低數(shù)倍,內(nèi)存占用減少70%。

      另外,DeepSeek聯(lián)合北大、清華發(fā)布新論文推出的智能體推理框架DualPath,針對智能體大模型推理的存儲帶寬瓶頸,創(chuàng)新雙路徑KV-Cache加載機(jī)制,讓數(shù)據(jù)讀取與GPU計(jì)算并行,徹底解決傳統(tǒng)架構(gòu)算力空轉(zhuǎn)問題。實(shí)測離線推理吞吐量最高提升1.87倍,在線Agent運(yùn)行效率提升1.96倍,用純軟件優(yōu)化實(shí)現(xiàn)性能翻倍,堪稱AI基礎(chǔ)設(shè)施的顛覆性突破,提高成本效率的風(fēng)格非常DeepSeek。

      種種跡象表明,即將發(fā)布的新一代旗艦?zāi)P虳eepSeek-V4大概率將整合文本、圖像、視頻生成能力,并采用原生多模態(tài)預(yù)訓(xùn)練而非后期拼接,模型參數(shù)在萬億以上,并且具有較強(qiáng)的記憶、工具、代碼、學(xué)習(xí)能力和對智能體的良好支持。

      國產(chǎn)模型與國產(chǎn)算力的雙劍合璧

      模型之外,對DeepSeek V4的另一個(gè)期待,是希望與國產(chǎn)算力經(jīng)過磨合探索之后雙劍合璧。

      現(xiàn)在已經(jīng)有不少報(bào)道在討論,DeepSeek在發(fā)布V4之前,未向英偉達(dá)、AMD等美系芯片商提供預(yù)覽,而是選擇提前數(shù)周向包括華為在內(nèi)的中國芯片供應(yīng)商開放訪問權(quán)限,以確保模型在國產(chǎn)算力平臺上完成深度適配與優(yōu)化。

      這也是外界認(rèn)為DeepSeek V4晚點(diǎn)的一個(gè)關(guān)鍵原因。

      適配國產(chǎn)算力,這條路對國產(chǎn)模型來說非常艱難,但從更長遠(yuǎn)的時(shí)間來看又不得不做。一件不得不做的事情,總要有起點(diǎn),或許DeepSeek V4就是那個(gè)起點(diǎn)。

      當(dāng)模型伸出橄欖枝,壓力就給到了國產(chǎn)算力,它要求效能到產(chǎn)能再到有效供給,都要能夠進(jìn)一步跟上,與模型、智能體發(fā)展形成生態(tài)協(xié)同。

      如果DeepSeek V4和R2被實(shí)證從訓(xùn)練到推理能夠在國產(chǎn)芯片上跑出世界一流的水平,并且成本更低,就有希望大幅度擺脫對海外算力的依賴,打破黃仁勛借SemiAnalysis給自己貼的那張“Token之王”的標(biāo)簽。

      如果大家還有印象,DeepSeek R1問世那一夜,英偉達(dá)暴跌近17%,單日最大市值蒸發(fā)紀(jì)錄5890億美元。

      英偉達(dá)暴跌對科技股投資者來說不是一件好事,但如果是DeepSeek推動(dòng)的,那么我們喜聞樂見這樣的情況再次發(fā)生。

      糖水智能與原力智能分層

      在這封信的尾聲,如果還要提一個(gè)期待——DeepSeek能夠在另一個(gè)Scaling Law上做出突破。

      這種突破不是傳統(tǒng)意義上的“模型越大能力越強(qiáng)”,而是小體量模型不斷Scaling大體量模型的能力。

      基于“原理-算法-訓(xùn)練-思考與推理能力的進(jìn)化”以及“智能的壓縮-蒸餾-內(nèi)化”這兩個(gè)技術(shù)路線,每個(gè)階段的小體量模型不斷達(dá)到上一個(gè)階段大體量模型的能力水準(zhǔn),乃至于不斷接近和達(dá)到日常高可用水平,然后在此基礎(chǔ)上能力-應(yīng)用-場景-價(jià)值逐步分層。

      小模型、常規(guī)智能服務(wù)于簡單基礎(chǔ)日常,以量見長,開放、端側(cè)、邊緣部署和成本效率更優(yōu)——這是“糖水智能”,是Token經(jīng)濟(jì)里的喝湯部分。

      大模型、超級智能服務(wù)于企業(yè)行業(yè)商業(yè)-生產(chǎn)力-專業(yè)科技-重型任務(wù),高水準(zhǔn)產(chǎn)生高溢價(jià)——這是“原力智能”,是Token經(jīng)濟(jì)里的吃肉部分。

      關(guān)于小模型的能力進(jìn)化,Google Gemma 4是一個(gè)不錯(cuò)的參照系,它包含了2B、4B、26B和31B四個(gè)版本,覆蓋手機(jī)到工作站全場景。其中31B Dense模型在Arena AI開源排行榜排名第三,26B A4B MoE模型排名第六。四款模型均支持圖像和視頻輸入,支持140多種語言,內(nèi)置可開關(guān)的思考模式。這不是簡單的參數(shù)壓縮,而是智能的蒸餾與內(nèi)化——通過更高效的知識遷移、更精密的量化剪枝、更先進(jìn)的蒸餾技術(shù),讓小模型擁有大智慧。

      期待DeepSeek能在30B-70B-120B這三檔高質(zhì)量模型,蓋過Gemma-4,企業(yè)級部署能夠以萬億參數(shù)的開源模型超越“六小虎”曾經(jīng)達(dá)到的水平,開創(chuàng)新的格局。

      而在端側(cè),也期待DeepSeek在1B-8B這一檔的輕量化模型上實(shí)現(xiàn)同樣的突破。當(dāng)端側(cè)模型能夠在消費(fèi)級顯卡甚至手機(jī)上流暢運(yùn)行,當(dāng)個(gè)人手機(jī)、電腦里的端側(cè)模型數(shù)以億計(jì),當(dāng)每一個(gè)普通用戶都能擁有較強(qiáng)的AI能力,便是智能平權(quán)、智能經(jīng)濟(jì)的普惠形態(tài)。

      2026年是新一代前沿模型和接管型智能體的“跳變式發(fā)展”之年,每家AI企業(yè)都將打出自己的王牌,引發(fā)新一輪的產(chǎn)業(yè)洗牌。

      “中國團(tuán)”需要DeepSeek的回歸,開源生態(tài)需要DeepSeek的推動(dòng),Token經(jīng)濟(jì)需要DeepSeek的深度原力智能,國產(chǎn)算力需要DeepSeek的驗(yàn)證。

      現(xiàn)在,中美模型能力在日常問答的常規(guī)智能部分幾乎已經(jīng)沒有差距,但在長程復(fù)雜任務(wù)的深度智能方面還有差距。這種差距,使得大家對DeepSeek心生期待。

      這是最后一次催更,也是最后的召喚。V4與R2身上,肩負(fù)的期待不僅是模型的迭代,更是一個(gè)年代的發(fā)展進(jìn)階。從模型之戰(zhàn)到全生態(tài)之戰(zhàn),從單點(diǎn)突破到全棧AI競爭,從跟隨模仿到自主創(chuàng)新——DeepSeek的下一步,是不是能夠定義中國人工智能的下一步?

      希望DeepSeek這一年多的“沉寂”,是為了更好的爆發(fā)。

      本文來自公眾號:騰訊科技 作者:胡延平 編輯:蘇楊

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      山西親手葬好局!鐵定沒看廣東絕殺戰(zhàn),軟趴籃板球放廣廈逃出生天

      山西親手葬好局!鐵定沒看廣東絕殺戰(zhàn),軟趴籃板球放廣廈逃出生天

      小潌拍客在北漂
      2026-05-10 23:41:08
      1984年葉劍英病危,追悼會(huì)花圈已備好,35歲才當(dāng)醫(yī)生的鐘南山憑什么臨危受命救回元帥?

      1984年葉劍英病危,追悼會(huì)花圈已備好,35歲才當(dāng)醫(yī)生的鐘南山憑什么臨危受命救回元帥?

      史海孤雁
      2026-05-09 19:13:11
      250億!賴清德竄訪代價(jià)來了,斯威士蘭開始要債 盧秀燕卻聲援綠營

      250億!賴清德竄訪代價(jià)來了,斯威士蘭開始要債 盧秀燕卻聲援綠營

      聞識
      2026-05-10 18:17:01
      茶行業(yè)最大的笑話:繞過茶商,用便宜的價(jià)格買到茶農(nóng)的好茶!

      茶行業(yè)最大的笑話:繞過茶商,用便宜的價(jià)格買到茶農(nóng)的好茶!

      普洱話江湖
      2026-05-08 14:12:29
      暴雨大風(fēng)!廣州下周將開啟“倒水”模式

      暴雨大風(fēng)!廣州下周將開啟“倒水”模式

      環(huán)球網(wǎng)資訊
      2026-05-10 09:36:10
      比亞迪9000噸壓鑄“掀桌”!74個(gè)零件變1塊鋁,成本降5000元的造車魔法?

      比亞迪9000噸壓鑄“掀桌”!74個(gè)零件變1塊鋁,成本降5000元的造車魔法?

      生活魔術(shù)專家
      2026-05-10 18:55:56
      下一個(gè)拉什福德!卡里克親自出手,曼聯(lián)鎖定 8000 萬英格蘭紅星

      下一個(gè)拉什福德!卡里克親自出手,曼聯(lián)鎖定 8000 萬英格蘭紅星

      瀾歸序
      2026-05-10 02:06:04
      顛覆認(rèn)知!新研究:魚油等保健品,卻可能是阿爾茨海默病的“加速器”

      顛覆認(rèn)知!新研究:魚油等保健品,卻可能是阿爾茨海默病的“加速器”

      健康榨知機(jī)
      2026-05-09 19:23:57
      2026號1號文件:嚴(yán)禁上級機(jī)關(guān)事業(yè)單位從基層借調(diào)職工!

      2026號1號文件:嚴(yán)禁上級機(jī)關(guān)事業(yè)單位從基層借調(diào)職工!

      細(xì)說職場
      2026-05-10 11:18:10
      A股:周日下午傳來3個(gè)特大消息!明天或迎來更大級別變盤行情?

      A股:周日下午傳來3個(gè)特大消息!明天或迎來更大級別變盤行情?

      趨勢清風(fēng)俠
      2026-05-10 15:29:01
      向佑南昌酒吧被拍!新女友紋身金牙煙不離手,向太放話:死都不認(rèn)

      向佑南昌酒吧被拍!新女友紋身金牙煙不離手,向太放話:死都不認(rèn)

      小丸子Showw
      2026-05-08 20:08:11
      排面直接拉滿!小霖霖10歲生日全員奔赴灣灣,馬筱梅格局徹底圈粉

      排面直接拉滿!小霖霖10歲生日全員奔赴灣灣,馬筱梅格局徹底圈粉

      喜歡歷史的阿繁
      2026-05-10 12:56:08
      “臺灣永遠(yuǎn)不是中國的?” 鄭麗君放狂言,被67歲藝人當(dāng)眾扇耳光

      “臺灣永遠(yuǎn)不是中國的?” 鄭麗君放狂言,被67歲藝人當(dāng)眾扇耳光

      橙星文娛
      2026-05-10 13:42:19
      伊總統(tǒng)和議長聯(lián)合要求外長阿拉格奇辭職,因其沒有聽命于最高領(lǐng)袖

      伊總統(tǒng)和議長聯(lián)合要求外長阿拉格奇辭職,因其沒有聽命于最高領(lǐng)袖

      元芳有看法
      2026-05-09 20:01:10
      憑借IPO半年浮盈至少百億!高瓴資本敗筆來了,清倉隆基巨虧近80億

      憑借IPO半年浮盈至少百億!高瓴資本敗筆來了,清倉隆基巨虧近80億

      金石隨筆
      2026-05-11 00:09:00
      懸崖秋千墜亡事件后續(xù),排女孩后面游客發(fā)聲,有目擊者做幾天噩夢

      懸崖秋千墜亡事件后續(xù),排女孩后面游客發(fā)聲,有目擊者做幾天噩夢

      十九妹
      2026-05-07 16:16:16
      浙江東陽,33 歲的男子,在母親長眠的公墓旁,在車?yán)锝Y(jié)束了生命

      浙江東陽,33 歲的男子,在母親長眠的公墓旁,在車?yán)锝Y(jié)束了生命

      魔都姐姐雜談
      2026-03-30 19:25:57
      海參崴的街頭,誰在出賣我們的歷史尊嚴(yán)?

      海參崴的街頭,誰在出賣我們的歷史尊嚴(yán)?

      迷世書童H9527
      2026-05-07 14:55:09
      廣州七中:關(guān)于廣播站全面停止播放外文歌曲的通知

      廣州七中:關(guān)于廣播站全面停止播放外文歌曲的通知

      必記本
      2026-05-10 17:54:30
      王博:大家的斗志要比第一場要好 孫銘徽是否復(fù)出回杭州看訓(xùn)練情況

      王博:大家的斗志要比第一場要好 孫銘徽是否復(fù)出回杭州看訓(xùn)練情況

      狼叔評論
      2026-05-10 23:10:04
      2026-05-11 00:39:00
      人人都是產(chǎn)品經(jīng)理社區(qū) incentive-icons
      人人都是產(chǎn)品經(jīng)理社區(qū)
      想要成為大牛先從學(xué)做產(chǎn)品開始
      64706文章數(shù) 311608關(guān)注度
      往期回顧 全部

      科技要聞

      DeepSeek融資,改寫所有人的估值

      頭條要聞

      兒子車禍?zhǔn)軅嫦M蛔?.1% 母親請中醫(yī)熬"還魂湯"

      頭條要聞

      兒子車禍?zhǔn)軅嫦M蛔?.1% 母親請中醫(yī)熬"還魂湯"

      體育要聞

      那個(gè)曾讓詹姆斯抱頭的兄弟,40歲從大學(xué)畢業(yè)了

      娛樂要聞

      趙露思老實(shí)人豁出去了 沒舞蹈天賦硬跳

      財(cái)經(jīng)要聞

      白酒大逃殺

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態(tài)度原創(chuàng)

      房產(chǎn)
      健康
      旅游
      藝術(shù)
      本地

      房產(chǎn)要聞

      低價(jià)甩賣!海口這個(gè)地標(biāo)商業(yè),無人接盤!

      干細(xì)胞能讓人“返老還童”嗎

      旅游要聞

      重慶新增一夜景打卡點(diǎn)!磁器口步行街看大學(xué)生“腦洞”建筑

      藝術(shù)要聞

      這些美人體攝影,簡直美得讓人窒息!

      本地新聞

      用蘇繡的方式,打開江西婺源

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产AV福利第一精品| 国产人妖另类| 国产精品黄色片| 19国产精品麻豆免费观看| 国产无套精品一区性色| 久久99九九精品久久久久蜜桃| 国产av丝袜旗袍无码网站| av资源免费看| 天天弄天天模| 丰满少妇a级黄片在线免费观看| 欧美日韩免费一区二区三区视频播放| 成年片色大黄全免费软件到| 麻豆人妻| 日本夜爽爽一区二区三区| 在线免费看AV| 国产av一区二区三区传媒| |?少妇人妻无码精品视频| 精品无码成人网站久久久久久| 69人人妻人人澡人人爽国产DVD| 人妻精品动漫H无码中字| 色综合国产一区二区三区| 岛国精品在线播放| 免费看无码毛视频成片| 囯产精品777777| 国产精品无码一区二区在线a片| 久久国产免费观看精品3| 中文字幕无码久久精品| 无码精品人妻一区二区三区中| 亚洲欲妇| 香蕉精品资源在线| 亚洲一区二区在线视频| 国产精品视频九九九| 国产色自拍视频在线观看 | 中文字幕高清| 97人妻天天爽夜夜爽二区| 中江县| 久久国产精品精品视频| 97国内免费久久久久久久久久| 国产精品久久久久久久9999| 欧美精品一产区二产区| 久久精品亚洲|