![]()
5月21日,騰訊混元宣布開(kāi)源全新翻譯模型Hy-MT2并上線翻譯小程序「騰訊Hy翻譯」。Hy-MT2 是支持 33 種語(yǔ)言互譯的多語(yǔ)言模型,其中7B 和 30B-A3B模型在各類翻譯任務(wù)上達(dá)到了開(kāi)源模型最佳效果,超越了幾十倍參數(shù)量的模型,輕量級(jí)的 1.8B 模型也超越了微軟等主流商業(yè) API,且得益于 AngelSlim 1.25-bit 極端量化,僅需 440MB 存儲(chǔ)空間,可以輕松部署在主流手機(jī)芯片上支持本地推理,相比Hy-MT1.5推理速度提升 1.5 倍。
Hy-MT2 包含 3個(gè)尺寸的模型 Hy-MT2-1.8B、Hy-MT2-7B、Hy-MT2-30B-A3B,分別側(cè)重端側(cè)輕量部署、均衡實(shí)力以及專業(yè)效果。
![]()
「騰訊Hy翻譯」小程序基于 Hy-MT2 打造,相比其他翻譯工具,不僅支持語(yǔ)音輸入,還優(yōu)化了自定義翻譯風(fēng)格和指令的能力,讓翻譯結(jié)果更符合預(yù)期,實(shí)用性更強(qiáng)。同時(shí),用戶不僅可以在聯(lián)網(wǎng)環(huán)境下體驗(yàn)高速版的混元翻譯模型,也可以通過(guò)提前下載端側(cè)翻譯模型,在無(wú)網(wǎng)絡(luò)或者弱網(wǎng)絡(luò)場(chǎng)景中使用離線翻譯,解決了部分應(yīng)用場(chǎng)景中網(wǎng)絡(luò)條件受限的問(wèn)題。
![]()
![]()
在通用翻譯能力評(píng)測(cè)中,Hy-MT2系列三個(gè)模型在 FLORES-200 平均表現(xiàn)上已經(jīng)非常接近目前行業(yè)表現(xiàn)最好的翻譯模型 (Gemini 3.1 Pro )。同時(shí),Hy-MT2-7B 和 Hy-MT2-30B-A3B 的實(shí)測(cè)得分已經(jīng)超過(guò)國(guó)內(nèi)主要的通用大模型,在輕量級(jí)模型的橫向?qū)Ρ戎校琀y-MT2-1.8B 也整體優(yōu)于頭部商業(yè)翻譯 API。
![]()
保持通用翻譯能力的同時(shí),Hy-MT2 進(jìn)一步面向真實(shí)業(yè)務(wù)場(chǎng)景和專業(yè)領(lǐng)域翻譯進(jìn)行優(yōu)化。
在真實(shí)場(chǎng)景測(cè)試集上,Hy-MT2-30B-A3B 效果已經(jīng)超過(guò) Gemini 3.1 Pro,特別在垂直領(lǐng)域的測(cè)試集中,Hy-MT2-30B-A3B在金融、政治、教育幾個(gè)領(lǐng)域的翻譯效果已經(jīng)部分超過(guò)主流翻譯模型。
相比上一版本模型,Hy-MT2的最大提升體現(xiàn)在指令遵循能力上,模型能夠更準(zhǔn)確地理解并執(zhí)行用戶關(guān)于術(shù)語(yǔ)、風(fēng)格和輸出格式等方面的具體要求。騰訊混元自建數(shù)據(jù)集 IFMT Bench 測(cè)試結(jié)果表明,Hy-MT2-7B 和 Hy-MT2-30B-A3B的翻譯效果已經(jīng)超越等相近尺寸開(kāi)源模型,接近 Gemini 3.1 Pro。目前這一測(cè)試集也已經(jīng)開(kāi)源。
指令遵循能力見(jiàn)下面的例子,通過(guò)“個(gè)性化設(shè)定:翻譯結(jié)果簡(jiǎn)潔精煉,去掉冗余表達(dá),每句不超過(guò)15個(gè)字”,模型可以很好的遵循指令,讓翻譯結(jié)果更符合要求。
![]()
本次升級(jí)的 Hy-MT2 模型進(jìn)一步探索極低比特量化方案,除 4-bit、8-bit 和 FP16 版本外,Hy-MT2 還基于混元自研技術(shù)提供了 1.25-bit 和 2-bit 版本,以適配不同硬件環(huán)境下的部署需求。基于混元自研 Sherry 框架實(shí)現(xiàn)的 1.25-bit 極低比特量化版本在蘋果 A15 上的推理速度相比 Hy-MT1.5 的 4-bit 量化版本提升了 1.5 倍,進(jìn)一步提升了實(shí)際可用性。
為了便于開(kāi)發(fā)者使用,Hy-MT2 開(kāi)源的模型已經(jīng)在 Github 和 Huggingface 等開(kāi)源社區(qū)上線,ARM、高通、Intel、沐曦、天數(shù)智芯等多個(gè)平臺(tái)均支持部署。
總體看來(lái),Hy-MT2 是一個(gè)面向真實(shí)應(yīng)用場(chǎng)景的高質(zhì)量、高效率、多能力多語(yǔ)翻譯模型家族,在通用翻譯、專業(yè)領(lǐng)域翻譯、真實(shí)業(yè)務(wù)場(chǎng)景和翻譯指令遵循任務(wù)上均表現(xiàn)出較強(qiáng)競(jìng)爭(zhēng)力。
騰訊混元翻譯模型堅(jiān)持從社區(qū)和實(shí)際應(yīng)用場(chǎng)景中搜集真實(shí)反饋,不斷提升模型能力。同時(shí),騰訊混元也希望通過(guò)開(kāi)源和社區(qū)活動(dòng)回饋社區(qū),現(xiàn)在,騰訊混元也在與WMT26官方合作「視頻字幕翻譯比賽」(https://www2.statmt.org/wmt26/video-subtitle-translation.html),使用Hy-MT系列模型參與「通用機(jī)器翻譯比賽」(https://www2.statmt.org/wmt26/translation-task.html)和「視頻字幕翻譯比賽」有機(jī)會(huì)獲得混元特設(shè)獎(jiǎng)勵(lì),誠(chéng)邀邀大家參與,共同推動(dòng)機(jī)器翻譯前沿技術(shù)發(fā)展。
開(kāi)源和體驗(yàn)鏈接,可訪問(wèn):
l HuggingFace:https://huggingface.co/collections/tencent/hy-mt2
l Modelscope:https://modelscope.cn/collections/Tencent-Hunyuan/Hy-MT2
l Github:https://github.com/Tencent-Hunyuan/Hy-MT2
l 騰訊云:https://console.cloud.tencent.com/tokenhub/text
l 騰訊混元官網(wǎng):https://aistudio.tencent.com/llm/zh?tabIndex=0
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.