4月23日,騰訊混元Hy3 preview語言模型發布并開源。
這是混元重建后訓練的第一個模型,也是混元迄今最智能的模型,在復雜推理、指令遵循、上下文學習、代碼、智能體等能力及推理性能上實現了大幅的提升。
去年底,騰訊官宣姚順雨加入騰訊,成為騰訊首席AI科學家,本次混元Hy3 preview也是他在騰訊的“首秀”。
姚順雨表示,Hy3 preview是混元大模型重建的第一步,“我們希望通過這次開源和發布,獲得來自開源社區和用戶的真實反饋,幫助我們提升Hy3正式版的實用性。”
與此同時,騰訊也在繼續擴大預訓練和強化學習的規模,提升模型的智能上限,并通過與騰訊眾多產品的深度Co-Design,持續提升模型在真實場景中的綜合表現,并開始探索特色模型能力。
![]()
目前,Hy3 preview已在騰訊云、元寶、ima、CodeBuddy、WorkBuddy、QQ、QQ瀏覽器、騰訊文檔、騰訊樂享等首發上線,微信公眾號、和平精英、騰訊新聞、騰訊自選股、騰訊客服、微信讀書等多個主線產品也在陸續上線。
此外,Hy3 preview支持接入流行的開源智能體產品,如OpenClaw、OpenCode、KiloCode等,并已上架騰訊云大模型服務平臺TokenHub。
主打全面實用性,Agent能力大幅提升
騰訊混元Hy3 preview是一個快慢思考融合的混合專家模型,總參數295B,激活參數21B,最大支持256K上下文長度。
上下文學習和指令遵循能力:騰訊混元提出了CL-bench和 CL-bench-Life來創新性地評估模型的上下文學習能力,并在Hy3 preview顯著地提升了模型上下文學習和指令遵循能力。
![]()
復雜推理能力:Hy3preview在FrontierScience-Olympiad、IMOAnswerBench等高難度理工科推理任務中表現突出,并在最新的清華大學求真書院數學博資考(26春)和全國中學生生物學聯賽(CHSBO 2025)中取得優異成績,展現了可泛化的強推理能力。
![]()
代碼與智能體:得益于預訓練及強化學習框架的重建和強化學習任務規模的提升,騰訊混元以較快的速度在SWE-Bench Verified、Terminal-Bench 2.0等主流代碼智能體基準以及BrowseComp、WideSearch等評測中表現突出。
![]()
![]()
此外,無論是在后端工程任務集Hy-Backend,貼近真實用戶開發交互的Hy-Vibe Bench,還是高難度軟件工程開發任務集Hy-SWE Max上,Hy3preview均體現出了強競爭力。
![]()
騰訊核心業務已全面接入
正式上線之前,Hy3 preview在騰訊主要AI業務進行了產品測試,獲得明顯正收益。
在元寶端,混元與元寶進行了深度Co-Design,模型與產品的深度協同,為用戶帶來了更智能且更具“活人感”的交互體驗。
在ima知識庫問答和通用問答兩個場景下,測試結果顯示,Hy3 preview處理長文的能力出色,特別是檢索類任務,在回答信息的準確性、覆蓋度和全面性上表現較好。
在CodeBuddy、WorkBuddy產品上,Hy3 preview首token延遲降低54%、端到端時長降低47%、成功率提升至99.99%+。實際用戶環境中,Hy3preview已穩定驅動最長495步的復雜Agent工作流。
在公眾號AI分身和AI客服的場景專項評測中,Hy3 preview在用戶意圖理解、復雜上下文承接和知識信息組織方面表現更成熟,整體交互體驗更貼近“可信、自然、高效”的回復目標。
在和平精英AI NPC場景評測中,Hy3 Preview能夠精準理解角色設定,帶來了更加真實、自然、沉浸的對話體驗,展現出優秀的穩定性與出色的擬人化扮演能力。
在騰訊文檔AIPPT場景,生成成功率提升20%,評測得分提升10%,同時生成耗時縮短20%。
在QQ AI助手小Q產品評測中,在長文本首字節時延、整體響應速度與流式輸出效率方面顯著優化;核心能力上,數學推理表現提升尤為明顯,多場景指令遵循與泛化能力進一步增強。
此外,得益于模型和推理框架上的深度協同,以及在推理框架、算子性能、量化算法等全方面優化,整體推理效率提升40%,Hy3 preview的成本相比上一代模型大幅下降。
![]()
“重建混元”
據了解,2026年2月,騰訊混元重建了預訓練和強化學習的基礎設施,以及模型追求實用性的三個原則:
能力體系化:不推崇“偏科”,因為即使是代碼智能體的單一應用,也涉及推理、長文、指令、對話、代碼、工具等多種能力的深度協同。
評測真實性:主動跳出易被“刷榜”的公開榜單,通過自建題目、最新考試、人工評測、產品眾測等多種方式評估和改進模型的“真實戰斗力”。
性價比追求:實用性離不開商業合理性,深度協同模型架構和推理框架的設計,大幅降低任務成本,讓智能用得起、用得好。
Hy3 preview的推出可以視為混元快速探索實用性大模型、解決真實世界問題的一個開端。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.