<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      國產芯片,能否解決智譜和MiniMax的算力荒問題

      0
      分享至


      4月24日,DeepSeek正式發布新模型V4,以開源、低價、高性能給市場帶來沖擊,智譜與MiniMax雙雙跳水,市值一度跌超10%和12%。有網友戲稱,DeepSeek果然是國產大模型最嚴厲的父親。

      無論是新模型V4,還是近期DeepSeek的融資消息,無疑都會給智譜和MiniMax的股價帶來較大波動。4月23日,我們獨家報道DeepSeek最新估值達到3000億元,目前這個數字已經得到一位DeepSeek內部人士的確認。

      當前真正卡住智譜和MiniMax的不是別的,而是年初龍蝦火爆后帶來的算力荒。

      一位頭部大廠算法人員算了一筆賬,在同一個項目里改幾行代碼,不搭skills,AI先得讀完整套系統的上下文,工程文件、依賴聲明和類定義統統加載,單次任務幾十萬Token可能一下就燒完了。去年底同樣花10塊錢能跑完的任務,今年賬單上變成了近20塊。

      “真到了需要復雜推理還原問題的時候,真不如自己手寫,AI的性價比不如大學生,好用還便宜?!苯衲暌詠?,智譜API價格連漲三次,4月發布GLM-5.1后Token價格再度上調10%,外版Coding Plan月付價格幾乎翻倍,算下來,第一季度智譜的API定價累計上調約83%。MiniMax則將之前的Coding Plan全面升級為Token Plan,新增免費額度減少。

      做出同樣動作的還有阿里和騰訊,他們都將Coding Plan下架換成Token Plan。4月,阿里云四天內連發三條產品漲價公告,部分項目漲幅最高達34%。更早的3月,騰訊云部分模型價格漲幅高達463%。這意味著,哪怕成為高階會員,Token量大管飽的日子也已經一去不復返了。

      智譜CEO張鵬上個月在內部會議表示,“未來12個月最大問題是算力,不是需求?!倍鵀榱嗽谟邢薜馁Y源下求生存,MiniMax創始人閆俊杰表示,雖然公司同期收入增長了158.9%,但公司內部已經不再盲目追求用戶量的絕對值,并宣布,截至2月,M2系列模型的百萬Token推理成本已較2025年12月下降了超50%。

      摩根大通最近將智譜與MiniMax同列為“中國AI采用周期的結構性受益者”,面對同樣的算力擠兌,智譜和MiniMax交出了截然不同的答卷。

      01

      算力成了大模型廠商的生死線

      春節以來,開發者社區的投訴帖幾乎沒有停過。Kimi自2月起高峰期?,F算力不足,智譜更是一連遭遇了多輪危機,2月GLM-5上線后調用量暴增,API排隊蔓延,部分開發者的長鏈代碼生成任務直接中斷。

      智譜不得不公開致歉,承認“規則透明度不夠、GLM-5灰度節奏太慢、老用戶升級機制設計粗糙”,甚至開啟全額退款通道。

      4月12日,MiniMax正式開源M2.7模型,首日完成華為昇騰、摩爾線程、沐曦等多款國產GPU的Day-0適配,宣布通過MoE架構優化顯著降低了推理成本。但即便如此,用戶們吐槽MiniMax服務器繁忙、連續掉線、限流的帖子也不在少數。

      這種算力短缺的根源在兩端的同時失控。需求端,OpenClaw等智能體應用將Token消耗量推高了不止一個數量級。傳統對話場景一篇文章消耗幾千Token,一個典型的Openclaw自動化任務,其Token消耗量是傳統對話場景的3至5倍,在文件整理、代碼生成、多輪工具調用等環節,單次任務的上下文攜帶量成倍增長。

      根據智譜發布的2025年度財報,公司全年實現營業收入7.24億元,同比增長131.9%。但營收增速背后是更驚人的虧損擴大,年內虧損達到47.18億元,同比擴大59.5%,經調整凈虧損31.82億元,同比擴大29.1%。研發開支高達31.80億元,其中支付給第三方算力供應商的計算服務費用占據大頭。

      張鵬在一次AI開源前沿論壇上說:“所有的技術,包括智能體框架,在很多場景下可以帶來十倍級的效率提升,但前提是算力充足?!痹?026中關村論壇上,他再次強調:“大模型未來12個月面臨的最大問題可能是算力?!?/p>

      這種“增收巨虧”的局面并非智譜獨有。閆俊杰也不止一次公開表示,用戶量的增長和模型廠商收入的增長間并不存在正相關。這恰好解釋了當下大模型公司“增收不增利”的窘境來源。

      供給端則被死死卡住。2025年5月,美國商務部升級芯片出口限制,英偉達H20被納入禁售名單。雖然后續H20有望重返中國市場,但配額大幅縮減。據SemiAnalysis數據,H100一年期租賃價格從2025年10月的約1.70美元/小時/GPU漲至2026年3月的約2.35美元/小時,漲幅近40%。

      我們獨家獲悉,某頭部大廠更是拿出數百億的預算從年初就開始求卡,但仍然買卡無門。

      據中國信通院數據,2025年英偉達在中國數據中心市場的份額已從2022年的95%下滑至50%,而國產AI芯片份額從12%增長至25%。華為昇騰以約81.2萬塊的出貨量位居國產第一,市場份額約49.2%,但與英偉達剩余份額相加仍難以滿足爆發式增長的算力需求。

      這種供給失衡,讓Token市場出現了K型分化。低成本“閑聊型”Token價格一降再降,阿里通義千問一度壓至0.0005元/千Tokens,字節豆包0.0008元/千Tokens。這些面向基礎場景的Token,成了黃仁勛口中類似“水電煤”的基礎設施。

      而另一端的“黃金型”Token——長鏈推理、復雜代碼生成、企業私有化部署,價格卻一路走高。智譜的API定價去年以來已累計提價83%,而市場需求非但沒有減弱,API調用量反而增長了400%。算力這把達摩克利斯之劍,落在了所有廠商的脖子上。

      02

      智譜選保毛利,MiniMax選保份額

      算力短缺如同一道共同的緊箍咒,但智譜和MiniMax選擇了兩種截然不同的解脫路徑。智譜的打算很清楚,漲價,篩選,保利潤。

      張鵬在3月的一次活動中表示,低價競爭不利于行業發展,上調API價格是成本變化的結果。而從今年2月至4月,智譜用連續三次上調API價格來回應了這個判斷:Coding Plan套餐漲30%,旗艦API服務漲20%,GLM-5上線后漲10%,GLM-5.1再漲10%。

      Anthropic在海外已經劃出了一條清晰的參考線。最近,Anthropic調整了企業版Claude Enterprise的定價模式,從每月最高200美元的固定費用,改為每月20美元基礎費加按實際算力消耗收費。而在漲價的同時,Anthropic年化收入從2025年1月的約10億美元,一年后,AnthropicARR突破300億美元,超過OpenAI同期約250億美元的規模。

      如今,Anthropic估值已突破1萬億美元,超過了OpenAI(同期約8800億美元)。

      智譜選擇跟上。通過連續漲價篩選出高付費意愿的客戶,將有限的算力集中在Vibe Coding(氛圍編程)向Agentic Engineering(智能體工程)演進的高價值場景。

      2026年一季度,智譜API定價累計上調83%,同期調用量卻暴增400%,云端API業務毛利率從3.3%升至18.9%。在剛結束的2025年財報電話會上,張鵬將智譜定位為 “中國的Anthropic”,并提出:“大模型公司商業價值取決于Token消耗的規模,而定價權完全取決于模型的智能上界?!?/p>

      在張鵬看來,能高效處理長鏈復雜推理任務的高端Token永遠是稀缺品,而誰掌握了高端Token的定價權,誰就能在下一代競爭中占住入口。這正是智譜在毛利率從56.3%降至41%的背景下,仍堅持聚焦高價值場景的邏輯所在。

      MiniMax則走了一條完全相反的路線,開源、優化、搶規模。2025年10月以來,MiniMax在不到半年的時間內完成了M2、M2.1、M2.5和M2.7四代模型迭代。2026年4月12日,M2.7在全球開源。這款2300億參數的MoE模型在推理時僅激活100億參數,激活率約4.3%,極大降低了推理成本。

      為了降本,MiniMax與華為昇騰、摩爾線程、沐曦、昆侖芯等海內外芯片廠商在開源首日完成了Day-0適配。摩爾線程基于MUSA架構實現了深度調優,在MTT S5000上完成高性能推理部署。沐曦曦云C系列GPU依托全棧自研的MXMACA軟件棧實現了“模型發布即算力就緒”。

      MiniMax已經拿到了成果。模型調用量爆發,M2系列文本模型單日Token消耗量在2026年前兩個月較2025年12月激增6倍以上,2月ARR已突破1.5億美元。經調整凈虧損約2.5億美元,虧損率顯著收窄。

      但這也是一場危險的賭注。MiniMaxAPI客單價明顯低于智譜,單位算力的盈利空間被極度壓縮。MiniMax打的是“以規模換生態”的算盤,閆俊杰的策略是先讓Token足夠便宜,讓開發者習慣它的生態,再通過增值服務完成商業閉環。可如果開源生態變現的進度趕不上研發投入的增長,這條路就可能被高成本堵死。

      而低價策略能否支撐Minimax在下一代模型研發上與智譜、阿里等巨頭競爭,仍是未知數。

      03

      破局關鍵在國產芯片和時間窗口

      2025年度智譜研發開支為31.8億元,算力成本占研發總開支的七成以上,但仍無法滿足需求。GLM-5單次推理的算力消耗是前代GLM-4.7的3倍,而國產GPU的適配優化尚在推進中。

      盡管智譜已完成與華為昇騰、寒武紀等7大國產芯片的深度優化,長序列部署成本下降50%,整體算力缺口依然巨大。

      海外巨頭同樣承受著巨大算力緊缺的重壓。OpenAI放棄Sora視頻生成應用,將算力集中到核心模型開發中。Anthropic用鎖定AWS旗下Trainium芯片高達5吉瓦的算力資源來換取客戶穩定性,不只是傳統的風險投資。

      算力的“絞索”正在勒緊每一位玩家的脖頸。而在算力的“絞索”被解除之前,智譜和MiniMax各自的探索都只是權宜之計,真正的變數是國產芯片的時間窗口。

      2025年,英偉達在中國市場的AI加速卡占有率從2022年的約95%大幅下滑到約55%。國產AI加速卡總出貨量約165萬張,市占率約41%。華為昇騰以約81.2萬張的出貨量斷層領跑,占國產份額約49.2%。阿里平頭哥、百度昆侖芯、寒武紀、海光信息緊隨其后。

      在智譜發布的GLM-5中,華為昇騰、摩爾線程、寒武紀等國產芯片平臺已完成深度推理適配與算子級優化。

      更關鍵的一步可能在2026年到來。2026年3月,華為在合作伙伴大會上正式發布了搭載全新昇騰950PR的AI訓練推理加速卡Atlas 350。這款芯片性能據估計可達英偉達H20的近三倍,并且對CUDA體系的兼容性已大幅提升,字節跳動、阿里巴巴等大廠都計劃采用。

      這意味著通往國產GPU的高質量替代之路已不是紙上談兵。這次DeepSeek V4跳過英偉達CUDA生態,適配的是華為昇騰平臺,可能動搖英偉達在AI算力市場的主導地位,打破其軟件生態壟斷。這也正是黃仁勛最近預言的“災難”。

      不過當前DeepSeek自身也卡算力。V4發布時官方明確坦言,V4-Pro當前高端算力吞吐有限,自身都受高端芯片供給約束,無法向外大規模輸出富余算力。

      未來的錨點在于,昇騰950PR能否在實際部署中兌現百萬級高吞吐與低延遲的承諾,國產芯片是否能在2026年實現大規模、穩定的ToB商用。假設國產芯片能做到大規模穩定商用,讓算力成本驟降,屆時低價、規?;穆窂綗o疑將占據上風。

      留給國內大模型廠商的問題已然清晰,那就是能否在國產算力芯片全面成熟之前,搶先跑通一條脫離英偉達依賴獨立發展的路徑。

      撰寫|馬文佩、馬舒葉

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      山西一地4名干部職務有調整!

      山西一地4名干部職務有調整!

      山西晚報
      2026-05-08 09:38:21
      馬來西亞與中國決裂,轉向日本,361億賠償引發熱議!

      馬來西亞與中國決裂,轉向日本,361億賠償引發熱議!

      橙色書卷
      2026-05-06 21:19:04
      59:0!7800億軍購案通過,這兩人力勸鄭麗文,季麟連尷尬了

      59:0!7800億軍購案通過,這兩人力勸鄭麗文,季麟連尷尬了

      阿芒娛樂說
      2026-05-08 20:23:18
      重慶疾控提醒:不能吃!不能吃!統統不能吃!

      重慶疾控提醒:不能吃!不能吃!統統不能吃!

      白宸侃片
      2026-05-08 14:08:10
      郵輪暴發漢坦病毒,中國乘客發聲:在陽性乘客登船前一天下船,離開已37天,沒出現任何身體不適;專家稱此次毒株可人傳人

      郵輪暴發漢坦病毒,中國乘客發聲:在陽性乘客登船前一天下船,離開已37天,沒出現任何身體不適;專家稱此次毒株可人傳人

      大風新聞
      2026-05-08 11:17:05
      41歲C羅遭暴擊?沙特巨頭2-1奪沙王冠+4年3冠 4天后與勝利大決戰

      41歲C羅遭暴擊?沙特巨頭2-1奪沙王冠+4年3冠 4天后與勝利大決戰

      風過鄉
      2026-05-09 05:56:30
      林昀儒:全力沖擊決賽!卡爾伯格輸球成轉折,香港女團輸得可惜

      林昀儒:全力沖擊決賽!卡爾伯格輸球成轉折,香港女團輸得可惜

      排球黃金眼
      2026-05-08 08:22:43
      楚阿梅尼:認可俱樂部的處罰,我們仍是家人,我已向球隊致歉

      楚阿梅尼:認可俱樂部的處罰,我們仍是家人,我已向球隊致歉

      懂球帝
      2026-05-09 00:37:06
      太扎心了!單親媽媽被惡語攻擊:娶你,你能給別人創造什么價值

      太扎心了!單親媽媽被惡語攻擊:娶你,你能給別人創造什么價值

      火山詩話
      2026-05-06 07:24:29
      印度女警深夜穿便衣巡邏:3小時約40名男子接近她 行為不端者被拘留

      印度女警深夜穿便衣巡邏:3小時約40名男子接近她 行為不端者被拘留

      海外網
      2026-05-08 13:24:03
      92年上海一女子花40萬買入浦東一塊地皮,18年后,市值把她驚呆了

      92年上海一女子花40萬買入浦東一塊地皮,18年后,市值把她驚呆了

      紅豆講堂
      2025-05-12 10:27:03
      記者:曼聯已和瓊阿梅尼的團隊進行初步接觸;羅馬諾:瓊阿梅尼確實是曼聯夢寐以求的引援目標

      記者:曼聯已和瓊阿梅尼的團隊進行初步接觸;羅馬諾:瓊阿梅尼確實是曼聯夢寐以求的引援目標

      MUREDS
      2026-05-08 23:06:58
      河北王牌景區白洋淀徹底翻車!五一前3天不到2萬人,口碑徹底爛了

      河北王牌景區白洋淀徹底翻車!五一前3天不到2萬人,口碑徹底爛了

      譚談社會
      2026-05-07 20:44:05
      小寶與王某雷,誰探訪花的數量更多?

      小寶與王某雷,誰探訪花的數量更多?

      挪威森林
      2026-01-31 12:15:26
      1936年親手活捉蔣介石的孫銘九:建國后,上級部門破例為他謀工作

      1936年親手活捉蔣介石的孫銘九:建國后,上級部門破例為他謀工作

      磊子講史
      2026-01-22 10:13:17
      不問配置不聊價格,浙江一女子開口就要買5臺最新款iPhone,老板不但不賣,反手報了警

      不問配置不聊價格,浙江一女子開口就要買5臺最新款iPhone,老板不但不賣,反手報了警

      環球網資訊
      2026-05-08 07:38:20
      12名農民工遭“車位抵薪”32萬余元,當事人擔心被法院查封堅持貨幣支付,勞動監察大隊已向法院申請強制執行

      12名農民工遭“車位抵薪”32萬余元,當事人擔心被法院查封堅持貨幣支付,勞動監察大隊已向法院申請強制執行

      極目新聞
      2026-05-08 21:04:26
      又來,“伊朗這招太絕,中方會學,美國真沒準備好”

      又來,“伊朗這招太絕,中方會學,美國真沒準備好”

      觀察者網
      2026-05-08 10:14:07
      小波特:小托馬斯兩度被裁是性格原因 他幾乎不和任何人交流

      小波特:小托馬斯兩度被裁是性格原因 他幾乎不和任何人交流

      北青網-北京青年報
      2026-05-08 20:26:08
      斯諾克單賽季獎金榜:趙心童破百萬,世界第1歷史第3,吳宜澤第2

      斯諾克單賽季獎金榜:趙心童破百萬,世界第1歷史第3,吳宜澤第2

      劉姚堯的文字城堡
      2026-05-08 09:00:42
      2026-05-09 06:28:49
      白鯨實驗室one incentive-icons
      白鯨實驗室one
      記錄 AI改變世界的瞬間
      133文章數 16關注度
      往期回顧 全部

      科技要聞

      SK海力士平均獎金600萬 工服成相親神器

      頭條要聞

      美公布首批UFO文件 視頻公開:阿聯酋現水母狀物體

      頭條要聞

      美公布首批UFO文件 視頻公開:阿聯酋現水母狀物體

      體育要聞

      他把首勝讓給隊友,然后用一年時間還清賬單

      娛樂要聞

      古天樂被曝隱婚生子,新娘竟是她

      財經要聞

      估值3000億 DeepSeek尋求500億元融資

      汽車要聞

      MG 4X實車亮相 將于5月11日開啟盲訂

      態度原創

      親子
      教育
      家居
      數碼
      公開課

      親子要聞

      北京兒童配眼鏡指南:從看得清到管得住,守住孩子的視力第一條防線

      教育要聞

      家委會里“藏龍臥虎”:教育內卷新現象背后的隱憂

      家居要聞

      流動的尺度 打破家的形式主義

      數碼要聞

      華碩京東重磅新品日,華碩天選7系列游戲本開啟預約

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 免费一级特黄特色大片在线观看| 国产精品久久毛片| 国产免费视频一区二区| 亚洲成AV人片在线观看麦芽| 福利一区福利二区在线| 内射囯产旡码丰满少妇| 国产精品自拍视频免费看| 99精品久久久中文字幕| 精品国产午夜福利在线观看| 亚洲一区二区三区av链接| 伊人久久久大香线蕉综合直播| 亚洲日韩国产一区二区三区在线 | 国产成人?综合?亚洲| 男女一进一出视频久久| AV一区二区三区人妻少妇| 久久精品国产99久久6| 最新精品露脸国产在线| 天堂网亚洲综合在线| 777色婷婷| 精品国产国产AV一区二区| 日韩欧美高清| 被灌满精子的波多野结衣 | 爱性久久久久久久久| 精品国产91久久久久久亚瑟| 精品人人妻人人澡人人爽牛牛| 一 级做人爱全视频在线看| 少妇粗大进出白浆嘿嘿视频| 婷婷五月花| 色爱无码综合网| 性xxxxfreexxxxx牲性| caoporn成人免费公开| 亚洲人成亚洲人成在线观看| 亚洲一区二区在线av| 久久亚洲精品11p| 少妇被粗大的猛烈进出动视频 | 日本一区二区精品视频| 国产三级精品三级在线专区1| 亚洲精品中文综合第一页| 人妖网站| 久久人妻精品国产| 毛片国产精品完整版|