網易首頁 > 網易號 > 正文申請入駐

Hy3 preview發布并開源：混元重建后首個模型，Agent能力大幅提升 | 前沿在線

2026-04-29 08:32:46　來源: 前沿在線

北京舉報

分享至

編輯：騰訊混元

4月23日，騰訊混元 Hy3 preview 語言模型發布并開源。這是一個快慢思考融合的混合專家模型，總參數 295B，激活參數 21B，最大支持 256K 上下文長度。

今年 2 月，我們重建了預訓練和強化學習的基礎設施，以及模型追求實用性的三個原則：

能力體系化：我們不推崇“偏科”，因為即使是代碼智能體的單一應用，也涉及推理、長文、指令、對話、代碼、工具等多種能力的深度協同。

評測真實性：我們主動跳出易被“刷榜”的公開榜單，通過自建題目、最新考試、人工評測、產品眾測等多種方式評估和改進模型的“真實戰斗力”。

性價比追求：實用性離不開商業合理性，我們深度協同模型架構和推理框架的設計，大幅降低任務成本，讓智能用得起、用得好。

Hy3 preview 是我們重建后訓練的第一個模型，也是混元迄今最智能的模型，在復雜推理、指令遵循、上下文學習、代碼、智能體等能力及推理性能上實現了大幅的提升。

·詳細Bench數據和Case可訪問混元博客（https://hy.tencent.com/hy3-preview）了解更多。

復雜推理

推理能力是模型解決各種問題的基礎。Hy3 preview 在FrontierScience Olympiad、IMO Answer Bench 等高難度理工科推理任務中表現突出，并在最新的清華大學求真書院數學博資考（26春）和全國中學生生物學聯賽（CHSBO 2025）中取得優異成績，展現出可泛化的強推理能力。

上下文學習和指令遵循

在各種真實的生產與生活場景，理解雜亂冗長的上下文并遵從復雜多變的規則是模型的首要挑戰。基于我們多種業務場景的靈感，我們提出了 CL-bench 和 CL-bench-Life 來創新性地評估模型的上下文學習能力，并在 Hy3 preview 顯著地提升了模型上下文學習和指令遵循能力。

· 更多Case可訪問混元博客（https://hy.tencent.com/hy3-preview）了解。

代碼和智能體

代碼和智能體是 Hy3 preview 提升最為顯著的方向。得益于預訓練及強化學習框架的重建和強化學習任務規模的提升，我們以較快的速度在 SWE-Bench Verified、Terminal-Bench 2.0 等主流代碼智能體基準以及 BrowseComp、WideSearch 等主流搜索智能體基準中取得了強競爭力的結果。

在數字世界中，代碼關注的是模型在開發環境中的執行能力，搜索則聚焦于開放信息空間中的檢索、篩選與整合能力，兩者共同決定了模型在復雜智能體場景（例如OpenClaw）中是否真正具備可用性。Hy3 preview 在 ClawEval 和 WildClawBench 等評測中表現突出，進一步表明我們的智能體能力的全面與實用性。

除了公開榜單，我們進一步構建了多個內部的評測集，對模型在真實開發場景中的表現進行評估。結果表明，無論是在后端工程任務集 Hy-Backend，貼近真實用戶開發交互的 Hy-Vibe Bench，還是高難度軟件工程開發任務集 Hy-SWE Max上，Hy3 preview 均體現出了強競爭力。

比較各個開源模型的大小與智能體綜合表現，Hy3 preview 展現出高性價比。

Case

prompt：請幫我使用微信小程序原生框架（或指定框架）開發一個完整、可直接編譯運行的徒步路線與旅游計劃推薦小程序，請一次性輸出包含 app.json 等全局配置、所有頁面（WXML/WXSS/JS/JSON）以及完整的 Mock數據，核心需求包括：一個帶有精美圖片輪播、‘當季推薦’及‘路線難度’分類導航的首頁；一個包含行程時間軸、精美沿途圖庫、適宜季節與裝備建議的路線詳情頁；以及一個支持本地緩存收藏功能的個人中心頁，UI設計需清新自然、圖文并茂，請確保代碼邏輯閉環、無缺失文件或引用錯誤，生成后我可以直接導入微信開發者工具成功預覽并體驗完整交互。

模型輸出

自然對話和用戶理解

在探索智能上限的同時，我們始終關注模型與人的交互和對人的理解。為此，我們與元寶團隊進行了深度的合作，使用 URM (User-Feedback RM) 對用戶的真實反饋進行建模，并結合 RLHF 技術進行了細粒度的優化。結合推理、長文、指令、智能體等能力的優化，這帶來了用戶體驗的大幅提升：Hy3 preview 的事實性錯誤顯著降低，能更精準理解用戶的模糊意圖和碎片化的輸入，回復風格更加共情，內容更具深度。在元寶的灰度測試上，我們看到 Hy3 preview 在元寶用戶活躍度上較之前模型實現了大幅增長。

· 更多Case可訪問混元博客（https://hy.tencent.com/hy3-preview）了解。

產品的上線和初步反饋

Hy3 preview 已在元寶、CodeBuddy、WorkBuddy、QQ、ima、QQ瀏覽器、騰訊文檔、騰訊樂享上線，并在微信公眾號、騰訊新聞、騰訊自選股、和平精英、騰訊客服等多個產品陸續上線中。另外，Hy3 preview 已支持流行的開源智能體產品，如 OpenClaw、OpenCode、KiloCode 等。

元寶產品經理 Logan 表示，Hy3 preview 研發過程中，混元與元寶進行了深度Co-Design。一方面針對性地提升了模型在意圖理解精準度、文本創作質量、深度搜索等硬核指標上的表現；另一方面對文風、文筆、情商、內容組織和內容專業度上進行了精細化調優。模型與產品的深度協同，為用戶帶來了更智能且更具“活人感”的交互體驗。

ima 產品經理 kaycee 表示，目前 ima 已經接入Hy3 Preview，在 ima 知識庫問答和通用問答兩個場景下，測試結果顯示，Hy3 preview 處理長文的能力出色，特別是檢索類任務，在回答信息的準確性、覆蓋度和全面性上表現較好。

在CodeBuddy、WorkBuddy 產品上，Hy3 preview 首 token 延遲降低 54%、端到端時長降低 47%、成功率提升至 99.99%+。實際用戶環境中，Hy3 preview 已穩定驅動最長 495 步的復雜 Agent 工作流，覆蓋文檔處理、數據分析、知識檢索、MCP 工具鏈編排等多樣化辦公場景。

微信公眾號產品經理 Astrid 表示，在公眾號AI 分身和 AI 客服的場景專項評測中，Hy3 preview 展現出相比 Hy2更全面的能力升級。新模型在用戶意圖理解、復雜上下文承接和知識信息組織方面表現更成熟，面對模糊提問、短句追問和多輪對話時，能夠更準確地把握用戶訴求，并輸出更清晰、更穩定的回復。結合知識庫、用戶記憶與上下文生成回答時更貼合AI 分身和 AI 客服的角色，過度腦補、主觀代入和情緒化表達顯著減少，使整體交互體驗更貼近“可信、自然、高效”的回復目標。

和平精英AI玩法負責人jessexue表示，Hy3 preview 模型上線后，和平精英第一時間在 AI NPC 場景中完成接入并開展評測，整體表現令人印象深刻。在游戲局外的人設扮演場景中，Hy3 preview 不僅能夠精準理解角色設定，還能針對開放性問題輸出高度關聯、富有增量價值的內容，帶來了更加真實、自然、沉浸的對話體驗。而在游戲局內的復雜對戰場景中，模型回復節奏貼近真實玩家聊天體驗，展現出優秀的穩定性與出色的擬人化扮演能力，整體效果表現亮眼。

騰訊文檔AI Agent 研發負責人 Johnny 表示，Hy3 preview 模型上線后，騰訊文檔 Agent 團隊圍繞核心場景開展綜合評測，以 AI PPT 場景為例，Hy3 preview模型較上一版本（Hy2）取得了顯著進步：生成成功率提升 20%，評測得分提升 10%，同時生成耗時縮短 20%。整體而言，新模型在評測場景中表現優異，在模版選擇，色彩匹配，生成大綱，補充內容多個階段，均體現出優秀的表現，無幻覺，契合主題，視覺效果好，展現了明顯的技術突破，后續應用值得期待。

QQ AI助手小Q產品負責人Tea表示，Hy3 preview 相較上一代Hy2，在小Q助手場景上，新模型在長文本首字節時延、整體響應速度與流式輸出效率方面顯著優化；核心能力上，數學推理表現提升尤為明顯，多場景指令遵循與泛化能力進一步增強；在工具調用推理及多輪指代消解方面表現更穩定高效，在 OpenClaw官方 PinchBench QQ智能體場景測試中取得突出效果，綜合體驗實現明顯躍升。

開源、API、Token Plan

Hy3 preview 的模型權重、代碼已在 GitHub、HuggingFace、ModelScope、GitCode 等平臺開源，支持 vLLM、SGLang 等主流推理框架，開發者可以直接下載使用。（詳細鏈接見文末）

得益于模型架構和推理框架的深度協同，以及我們在推理框架、算子性能、量化算法等方面的優化，Hy3 preview 的成本相比上一代模型大幅下降。在騰訊云上，我們推出了有競爭力的 API 價格以及定制化的 Token Plan，個人版定價最低28元/月。

Hy3 preview 是我們重建的第一步。雖然模型效果已經取得了巨大進步，但仍存在一些已知問題，我們希望通過這次開源和發布，獲得來自開源社區和用戶的真實反饋，幫助我們提升 Hy3 正式版的實用性。與此同時，我們也在繼續擴大預訓練和強化學習的規模，提升模型的智能上限，并通過與騰訊更多產品的深入協同，持續改進模型在真實場景中的實用性并探索差異化能力。

歡迎大家體驗并給我們反饋。

附：開源和 API & Token Plan 鏈接

Github：https://github.com/Tencent-Hunyuan/Hy3-preview
Hugging Face：https://huggingface.co/tencent/Hy3-preview
ModelScope：https://modelscope.cn/models/Tencent-Hunyuan/Hy3-preview
GitCode：https://ai.gitcode.com/tencent_hunyuan/Hy3-preview
騰訊云TokenPlan接入地址：https://console.cloud.tencent.com/tokenhub/tokenplan/hy?regionId=1
騰訊云API接入地址：
https://console.cloud.tencent.com/tokenhub/models/detail?modelId=hy3-preview&regionId=1

前沿動態前沿大會
前沿人物

點「在看」，給前前加雞腿

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.