網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

騰訊混元開(kāi)源全新翻譯模型Hy-MT2 ，上線小程序「騰訊Hy翻譯」

2026-05-21 17:48:06　來(lái)源: 量子位

北京舉報(bào)

分享至

5月21日，騰訊混元宣布開(kāi)源全新翻譯模型Hy-MT2并上線翻譯小程序「騰訊Hy翻譯」。Hy-MT2 是支持 33 種語(yǔ)言互譯的多語(yǔ)言模型，其中7B 和 30B-A3B模型在各類翻譯任務(wù)上達(dá)到了開(kāi)源模型最佳效果，超越了幾十倍參數(shù)量的模型，輕量級(jí)的 1.8B 模型也超越了微軟等主流商業(yè) API，且得益于 AngelSlim 1.25-bit 極端量化，僅需 440MB 存儲(chǔ)空間，可以輕松部署在主流手機(jī)芯片上支持本地推理，相比Hy-MT1.5推理速度提升 1.5 倍。

Hy-MT2 包含 3個(gè)尺寸的模型 Hy-MT2-1.8B、Hy-MT2-7B、Hy-MT2-30B-A3B，分別側(cè)重端側(cè)輕量部署、均衡實(shí)力以及專業(yè)效果。

「騰訊Hy翻譯」小程序基于 Hy-MT2 打造，相比其他翻譯工具，不僅支持語(yǔ)音輸入，還優(yōu)化了自定義翻譯風(fēng)格和指令的能力，讓翻譯結(jié)果更符合預(yù)期，實(shí)用性更強(qiáng)。同時(shí)，用戶不僅可以在聯(lián)網(wǎng)環(huán)境下體驗(yàn)高速版的混元翻譯模型，也可以通過(guò)提前下載端側(cè)翻譯模型，在無(wú)網(wǎng)絡(luò)或者弱網(wǎng)絡(luò)場(chǎng)景中使用離線翻譯，解決了部分應(yīng)用場(chǎng)景中網(wǎng)絡(luò)條件受限的問(wèn)題。

在通用翻譯能力評(píng)測(cè)中，Hy-MT2系列三個(gè)模型在 FLORES-200 平均表現(xiàn)上已經(jīng)非常接近目前行業(yè)表現(xiàn)最好的翻譯模型（Gemini 3.1 Pro ）。同時(shí)，Hy-MT2-7B 和 Hy-MT2-30B-A3B 的實(shí)測(cè)得分已經(jīng)超過(guò)國(guó)內(nèi)主要的通用大模型，在輕量級(jí)模型的橫向?qū)Ρ戎校琀y-MT2-1.8B 也整體優(yōu)于頭部商業(yè)翻譯 API。

保持通用翻譯能力的同時(shí)，Hy-MT2 進(jìn)一步面向真實(shí)業(yè)務(wù)場(chǎng)景和專業(yè)領(lǐng)域翻譯進(jìn)行優(yōu)化。

在真實(shí)場(chǎng)景測(cè)試集上，Hy-MT2-30B-A3B 效果已經(jīng)超過(guò) Gemini 3.1 Pro，特別在垂直領(lǐng)域的測(cè)試集中，Hy-MT2-30B-A3B在金融、政治、教育幾個(gè)領(lǐng)域的翻譯效果已經(jīng)部分超過(guò)主流翻譯模型。

相比上一版本模型，Hy-MT2的最大提升體現(xiàn)在指令遵循能力上，模型能夠更準(zhǔn)確地理解并執(zhí)行用戶關(guān)于術(shù)語(yǔ)、風(fēng)格和輸出格式等方面的具體要求。騰訊混元自建數(shù)據(jù)集 IFMT Bench 測(cè)試結(jié)果表明，Hy-MT2-7B 和 Hy-MT2-30B-A3B的翻譯效果已經(jīng)超越等相近尺寸開(kāi)源模型，接近 Gemini 3.1 Pro。目前這一測(cè)試集也已經(jīng)開(kāi)源。

指令遵循能力見(jiàn)下面的例子，通過(guò)“個(gè)性化設(shè)定：翻譯結(jié)果簡(jiǎn)潔精煉，去掉冗余表達(dá)，每句不超過(guò)15個(gè)字”，模型可以很好的遵循指令，讓翻譯結(jié)果更符合要求。

本次升級(jí)的 Hy-MT2 模型進(jìn)一步探索極低比特量化方案，除 4-bit、8-bit 和 FP16 版本外，Hy-MT2 還基于混元自研技術(shù)提供了 1.25-bit 和 2-bit 版本，以適配不同硬件環(huán)境下的部署需求。基于混元自研 Sherry 框架實(shí)現(xiàn)的 1.25-bit 極低比特量化版本在蘋果 A15 上的推理速度相比 Hy-MT1.5 的 4-bit 量化版本提升了 1.5 倍，進(jìn)一步提升了實(shí)際可用性。

為了便于開(kāi)發(fā)者使用，Hy-MT2 開(kāi)源的模型已經(jīng)在 Github 和 Huggingface 等開(kāi)源社區(qū)上線，ARM、高通、Intel、沐曦、天數(shù)智芯等多個(gè)平臺(tái)均支持部署。

總體看來(lái)，Hy-MT2 是一個(gè)面向真實(shí)應(yīng)用場(chǎng)景的高質(zhì)量、高效率、多能力多語(yǔ)翻譯模型家族，在通用翻譯、專業(yè)領(lǐng)域翻譯、真實(shí)業(yè)務(wù)場(chǎng)景和翻譯指令遵循任務(wù)上均表現(xiàn)出較強(qiáng)競(jìng)爭(zhēng)力。

騰訊混元翻譯模型堅(jiān)持從社區(qū)和實(shí)際應(yīng)用場(chǎng)景中搜集真實(shí)反饋，不斷提升模型能力。同時(shí)，騰訊混元也希望通過(guò)開(kāi)源和社區(qū)活動(dòng)回饋社區(qū)，現(xiàn)在，騰訊混元也在與WMT26官方合作「視頻字幕翻譯比賽」（https://www2.statmt.org/wmt26/video-subtitle-translation.html），使用Hy-MT系列模型參與「通用機(jī)器翻譯比賽」（https://www2.statmt.org/wmt26/translation-task.html）和「視頻字幕翻譯比賽」有機(jī)會(huì)獲得混元特設(shè)獎(jiǎng)勵(lì)，誠(chéng)邀邀大家參與，共同推動(dòng)機(jī)器翻譯前沿技術(shù)發(fā)展。

開(kāi)源和體驗(yàn)鏈接，可訪問(wèn)：

l HuggingFace：https://huggingface.co/collections/tencent/hy-mt2

l Modelscope：https://modelscope.cn/collections/Tencent-Hunyuan/Hy-MT2

l Github：https://github.com/Tencent-Hunyuan/Hy-MT2

l 騰訊云：https://console.cloud.tencent.com/tokenhub/text

l 騰訊混元官網(wǎng)：https://aistudio.tencent.com/llm/zh?tabIndex=0

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.