5月8日,在2026移動云大會主論壇上,中國移動發布移動模型服務平臺MoMA。平臺接入超300款業界主流AI模型,模型豐富度行業領先,首創Token集約化運營模式,推動AI像水和電一樣“隨時可得、隨處可用”,讓人工智能真正走進千家萬戶、服務千行百業。
![]()
開放普惠,讓AI觸手可及
MoMA構建了“一次接入、智能優選、普惠可用、安全可信” 的一站式模型服務體系,著力降低AI應用門檻。
提供統一API網關,用戶一次接入即可調用平臺全部模型資源。目前,MoMA已接入中國移動自研“九天”基座大模型,以及DeepSeek、通義千問、豆包、Kimi、GLM等業界優質模型,覆蓋文本生成、語音處理、多模態理解等多項能力,滿足政務、金融、工業、醫療、教育等多場景應用需求。
首創智能路由引擎,自動分析用戶需求,靈活切換“成本優先”“效果優先”“均衡優先”等三種策略,為用戶動態匹配最適合的模型。當模型出現超時、限流或故障時,平臺可自動實現秒級切換,確保業務連續不中斷。
降低模型使用成本,MoMA平臺基于國產算力部署自研推理引擎,結合智能路由對長尾模型資源調度,實現單位Token成本壓降約30%,降低資源占用率50%以上。此外,智能緩存、上下文復用、Token壓縮等相關技術手段運用進一步降低了使用成本。平臺的中立路由原則,為用戶在業務效果與算力成本之間找到了最優平衡。
服務保障安全可信,MoMA推出“機密模型”服務,將模型部署在機密容器中,基于硬件隔離技術保障計算過程的數據安全,做到“可用不可見”。這一能力覆蓋從芯片到應用的全鏈路機密計算,為政務、金融等數據安全要求較高的場景提供了可靠支撐。
集約運營,助力Token高效調用
開放普惠主要解決“用得起、用得上”的問題,集約化運營則聚焦“用得好、管得住”難點。MoMA圍繞Token全生命周期,構建了從精準計量、風險管控到經營分析的完整運營閉環體系,實現算力資源的清晰記錄、高效流轉與安全管控,推動算力資源規范、集約化利用。
實時精準計量,用多少、算多少。平臺實施流式實時計費,用戶使用Token計費端到端時延不超過1分鐘,實現“即用即付”,有效破解傳統按包計費模式的資源浪費以及賬單消費缺乏透明度的問題。
運用專屬風控,可追溯、可閉環。MoMA搭建了專屬風控機制,保證Token計費全流程可追溯、可審計、可閉環,從根源上杜絕資源擠占、費用超支以及服務中斷的風險,確保每一筆 Token消耗清晰透明。
提供鏈路觀測,有支撐、有依據。平臺提供全鏈路可觀測能力,實時采集時延、吞吐量、Token消耗、GPU資源等關鍵指標,將監控、預警、診斷整合為一體化運營指標體系,覆蓋客戶、訂購、使用、收入等多維度數據。AI投入與產出一目了然,為用戶經營決策提供了具體依據。
![]()
下一步,中國移動將不斷提升移動模型服務平臺MoMA服務質效,攜手產業伙伴,共同釋放算力新動能、拓展智能新空間,推動人工智能更加廣泛、高效、安全地服務經濟社會發展。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.