![]()
4月28日凌晨,小米AI團隊正式開源由羅福莉帶隊研發的MiMo-V2.5系列大模型,瞬間引爆國內AI圈。這款模型不僅在多項權威測評中超越近期大熱的DeepSeek-V4-Pro,還采用寬松的MIT協議,支持商用部署與二次訓練,無需額外授權。更重磅的是,小米同步推出百萬億Token免費激勵計劃,聯手多家芯片與Agent廠商共建生態。從技術硬實力到生態布局,MiMo-V2.5的登場,堪稱國產開源大模型賽道的一次“亮劍”交鋒。
![]()
一、兩款核心模型亮相:百萬上下文+超強Agent能力
此次開源的MiMo-V2.5系列包含兩款核心模型,均在4月23日開啟公測,經過5天打磨后正式開放權重,主打“強推理、長上下文、高適配性”三大亮點。
MiMo-V2.5-Pro:旗艦級智能體模型
作為小米迄今最強的語言模型,MiMo-V2.5-Pro是1.02萬億參數的混合專家(MoE)模型,其中420億參數處于激活狀態,專為復雜Agent任務、軟件工程和長時域場景打造。它支持100萬Token上下文,相當于一次性處理整本《三體》三部曲的文本量,能穩定完成單次近千輪工具調用的長任務,全程邏輯不脫節。
技術上,它繼承混合注意力架構,局部滑動窗口與全局注意力以6:1比例搭配,讓長文本處理時的顯存占用減少近7倍;搭配輕量級多標記預測(MTP)模塊,推理吞吐量直接提升3倍。預訓練階段使用27萬億Token,后訓練分監督微調、領域專精、多教師蒸餾三階段,把數學、安全、工具使用等能力拉滿。
MiMo-V2.5:全模態全能模型
另一款MiMo-V2.5是3100億參數的稀疏MoE模型,150億激活參數,主打原生全模態能力,能同時理解文本、圖像、視頻和音頻。訓練數據達48萬億Token,分五階段完成:先練文本主干,再對齊音視頻投影器,接著做多模態預訓練,隨后擴容上下文至100萬Token,最后用強化學習優化推理與執行能力。
![]()
![]()
在Claw-EvalText、Terminal-Bench2.0等測評中,MiMo-V2.5大幅超越DeepSeek-V4-Flash,成為開源模型中的第一梯隊選手。
二、硬實力碾壓:多項測評超越DeepSeek與閉源模型
開源當日,小米公布MiMo-V2.5-Pro的完整基準測試結果,成績堪稱“炸裂”。在GDPVal-AA(Elo)、Claw-Eval(pass^3)等權威測評中,它不僅超過最新開源的DeepSeek-V4-Pro,還力壓發布不久的KimiK2.6等主流閉源模型,拿下全球開源模型第一的位置。
![]()
![]()
簡單說,它的優勢體現在三點:
Agent能力拉滿:能獨立拆解復雜任務,自動調用工具完成操作,在代碼生成、文檔分析、多輪對話中表現穩定;
Token效率極高:完成同等任務,比ClaudeOpus4.6等模型少用40%-60%的Token,推理成本直接減半;
長文本無壓力:100萬上下文窗口,徹底解決傳統模型“長對話失憶、長任務斷檔”的痛點。
小米官方強調,模型的價值不止于榜單排名,更在于能幫開發者高效解決實際問題——從寫代碼、做數據分析,到生成視頻腳本、處理音頻內容,MiMo-V2.5系列都能勝任。
三、開源即適配:7大芯片廠商+2大推理框架無縫對接
大模型光有性能不夠,落地適配才是關鍵。MiMo-V2.5-Pro開源首日,就完成7家主流芯片廠商的接入適配,實現“發布即用”。
具體適配名單包括:阿里平頭哥(真武810E芯片)、亞馬遜云科技(Trainium2芯片)、AMD(ROCm軟件棧)、百度昆侖芯、燧原科技(L600芯片)、沐曦(曦云C系列)、天數智芯。同時,模型同步完成SGLang和vLLM兩大主流推理框架的Day0適配,開發者可直接用主流工具部署,無需額外修改代碼。
這種“開源即全適配”的節奏,在行業內實屬罕見。此前,不少模型開源后,還需數周甚至數月才能完成多芯片適配,而小米直接把適配周期壓縮到“0天”,大幅降低企業與開發者的部署門檻。
四、生態大動作:百萬億Token免費送,聯手Agent框架共建
除了開源模型,小米同步啟動MiMoOrbit計劃,包含兩大重磅舉措,直接降低AI創業與開發成本。
百萬億Token免費激勵:30天發完,最高領16億Credits
面向全球AI用戶,小米推出“百萬億Token創造者激勵計劃”,30天內免費發放100萬億Token權益,活動時間為4月28日至5月28日。活動采取申請制,通過者最高可獲得Max檔位,包含16億Credits,價值659元,相當于免費使用頂級大模型一整年。
Agent生態共建:聯手頭部框架,助力應用落地
針對Agent賽道,小米推出“Agent生態共建計劃”,已與OpenCode、HermesAgent、KiloCode等頭部Agent框架廠商深度合作。小米為這些框架提供MiMoToken限免支持,還參與贊助AIHackathon等共創活動,助力開發者基于MiMo快速搭建智能體應用。
從免費Token到生態共建,小米的思路很明確:不只是做模型技術,更要搭平臺、建生態,讓更多人能用得起、用得好頂級AI模型。
五、國產開源大模型“亮劍”:從拼參數到拼應用
近期,國產開源大模型賽道熱鬧非凡,DeepSeek、騰訊、月之暗面等廠商密集發布新一代模型,競爭焦點已從“比參數大小”轉向“拼推理效率、拼落地成本、拼生態完善度”。
小米MiMo-V2.5的開源,更是直接與DeepSeek-V4在開源賽道正面交鋒。此前,DeepSeek-V4憑借萬億參數與強性能,被視為國產開源模型的標桿;如今,MiMo-V2.5-Pro在多項測評中實現反超,打破了DeepSeek的“一家獨大”格局。
更重要的是,MiMo-V2.5采用MIT協議,完全開放商用權限,疊加百萬億Token免費計劃,大幅降低中小企業與個人開發者的AI使用門檻。這種“技術開放+成本下放”的模式,正是國產大模型突圍全球競爭的關鍵——用更低的成本、更完善的生態,倒逼行業加速從“技術軍備競賽”轉向“應用價值落地”。
從技術性能超越頭部競品,到開源即全芯片適配,再到百億級Token免費發放與生態共建,小米MiMo-V2.5系列的開源,不僅是自身技術實力的一次集中展示,更是國產開源大模型走向成熟的重要標志。
未來,隨著MiMo、DeepSeek、騰訊等國產模型持續發力,開源賽道的競爭會更激烈,但對開發者和企業而言,這意味著更多選擇、更低成本、更完善的生態。屬于國產AI的“黃金時代”,才剛剛開始。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.