網易首頁 > 網易號 > 正文申請入駐

硬剛DeepSeek-V4！小米最強開源模型來了，國產芯片全適配

2026-04-28 14:08:20　來源: 魏家東

北京舉報

分享至

4月28日凌晨，小米AI團隊正式開源由羅福莉帶隊研發的MiMo-V2.5系列大模型，瞬間引爆國內AI圈。這款模型不僅在多項權威測評中超越近期大熱的DeepSeek-V4-Pro，還采用寬松的MIT協議，支持商用部署與二次訓練，無需額外授權。更重磅的是，小米同步推出百萬億Token免費激勵計劃，聯手多家芯片與Agent廠商共建生態。從技術硬實力到生態布局，MiMo-V2.5的登場，堪稱國產開源大模型賽道的一次“亮劍”交鋒。

一、兩款核心模型亮相：百萬上下文+超強Agent能力

此次開源的MiMo-V2.5系列包含兩款核心模型，均在4月23日開啟公測，經過5天打磨后正式開放權重，主打“強推理、長上下文、高適配性”三大亮點。

MiMo-V2.5-Pro：旗艦級智能體模型

作為小米迄今最強的語言模型，MiMo-V2.5-Pro是1.02萬億參數的混合專家（MoE）模型，其中420億參數處于激活狀態，專為復雜Agent任務、軟件工程和長時域場景打造。它支持100萬Token上下文，相當于一次性處理整本《三體》三部曲的文本量，能穩定完成單次近千輪工具調用的長任務，全程邏輯不脫節。

技術上，它繼承混合注意力架構，局部滑動窗口與全局注意力以6:1比例搭配，讓長文本處理時的顯存占用減少近7倍；搭配輕量級多標記預測（MTP）模塊，推理吞吐量直接提升3倍。預訓練階段使用27萬億Token，后訓練分監督微調、領域專精、多教師蒸餾三階段，把數學、安全、工具使用等能力拉滿。

MiMo-V2.5：全模態全能模型

另一款MiMo-V2.5是3100億參數的稀疏MoE模型，150億激活參數，主打原生全模態能力，能同時理解文本、圖像、視頻和音頻。訓練數據達48萬億Token，分五階段完成：先練文本主干，再對齊音視頻投影器，接著做多模態預訓練，隨后擴容上下文至100萬Token，最后用強化學習優化推理與執行能力。

在Claw-EvalText、Terminal-Bench2.0等測評中，MiMo-V2.5大幅超越DeepSeek-V4-Flash，成為開源模型中的第一梯隊選手。

二、硬實力碾壓：多項測評超越DeepSeek與閉源模型

開源當日，小米公布MiMo-V2.5-Pro的完整基準測試結果，成績堪稱“炸裂”。在GDPVal-AA（Elo）、Claw-Eval（pass^3）等權威測評中，它不僅超過最新開源的DeepSeek-V4-Pro，還力壓發布不久的KimiK2.6等主流閉源模型，拿下全球開源模型第一的位置。

簡單說，它的優勢體現在三點：

Agent能力拉滿：能獨立拆解復雜任務，自動調用工具完成操作，在代碼生成、文檔分析、多輪對話中表現穩定；

Token效率極高：完成同等任務，比ClaudeOpus4.6等模型少用40%-60%的Token，推理成本直接減半；

長文本無壓力：100萬上下文窗口，徹底解決傳統模型“長對話失憶、長任務斷檔”的痛點。

小米官方強調，模型的價值不止于榜單排名，更在于能幫開發者高效解決實際問題——從寫代碼、做數據分析，到生成視頻腳本、處理音頻內容，MiMo-V2.5系列都能勝任。

三、開源即適配：7大芯片廠商+2大推理框架無縫對接

大模型光有性能不夠，落地適配才是關鍵。MiMo-V2.5-Pro開源首日，就完成7家主流芯片廠商的接入適配，實現“發布即用”。

具體適配名單包括：阿里平頭哥（真武810E芯片）、亞馬遜云科技（Trainium2芯片）、AMD（ROCm軟件棧）、百度昆侖芯、燧原科技（L600芯片）、沐曦（曦云C系列）、天數智芯。同時，模型同步完成SGLang和vLLM兩大主流推理框架的Day0適配，開發者可直接用主流工具部署，無需額外修改代碼。

這種“開源即全適配”的節奏，在行業內實屬罕見。此前，不少模型開源后，還需數周甚至數月才能完成多芯片適配，而小米直接把適配周期壓縮到“0天”，大幅降低企業與開發者的部署門檻。

四、生態大動作：百萬億Token免費送，聯手Agent框架共建

除了開源模型，小米同步啟動MiMoOrbit計劃，包含兩大重磅舉措，直接降低AI創業與開發成本。

百萬億Token免費激勵：30天發完，最高領16億Credits

面向全球AI用戶，小米推出“百萬億Token創造者激勵計劃”，30天內免費發放100萬億Token權益，活動時間為4月28日至5月28日。活動采取申請制，通過者最高可獲得Max檔位，包含16億Credits，價值659元，相當于免費使用頂級大模型一整年。

Agent生態共建：聯手頭部框架，助力應用落地

針對Agent賽道，小米推出“Agent生態共建計劃”，已與OpenCode、HermesAgent、KiloCode等頭部Agent框架廠商深度合作。小米為這些框架提供MiMoToken限免支持，還參與贊助AIHackathon等共創活動，助力開發者基于MiMo快速搭建智能體應用。

從免費Token到生態共建，小米的思路很明確：不只是做模型技術，更要搭平臺、建生態，讓更多人能用得起、用得好頂級AI模型。

五、國產開源大模型“亮劍”：從拼參數到拼應用

近期，國產開源大模型賽道熱鬧非凡，DeepSeek、騰訊、月之暗面等廠商密集發布新一代模型，競爭焦點已從“比參數大小”轉向“拼推理效率、拼落地成本、拼生態完善度”。

小米MiMo-V2.5的開源，更是直接與DeepSeek-V4在開源賽道正面交鋒。此前，DeepSeek-V4憑借萬億參數與強性能，被視為國產開源模型的標桿；如今，MiMo-V2.5-Pro在多項測評中實現反超，打破了DeepSeek的“一家獨大”格局。

更重要的是，MiMo-V2.5采用MIT協議，完全開放商用權限，疊加百萬億Token免費計劃，大幅降低中小企業與個人開發者的AI使用門檻。這種“技術開放+成本下放”的模式，正是國產大模型突圍全球競爭的關鍵——用更低的成本、更完善的生態，倒逼行業加速從“技術軍備競賽”轉向“應用價值落地”。

從技術性能超越頭部競品，到開源即全芯片適配，再到百億級Token免費發放與生態共建，小米MiMo-V2.5系列的開源，不僅是自身技術實力的一次集中展示，更是國產開源大模型走向成熟的重要標志。

未來，隨著MiMo、DeepSeek、騰訊等國產模型持續發力，開源賽道的競爭會更激烈，但對開發者和企業而言，這意味著更多選擇、更低成本、更完善的生態。屬于國產AI的“黃金時代”，才剛剛開始。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.