<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      騰訊新模型發布,姚順雨交卷了

      0
      分享至



      新眸原創·作者 | 李小東

      大模型的牌局上,騰訊終于甩出了一張新牌。

      4月23日,騰訊混元Hy3 preview語言模型正式發布并開源。這是一款快慢思考融合的混合專家(MoE)模型,總參數295B(2950億),激活參數21B,最大支持256K上下文長度。官方給它的定義干脆利落:“混元重建后訓練的第一個模型”,以及“混元迄今最智能的模型”。

      如果把目光往回拉四個月,騰訊AI的日子并不好過。今年年會上,馬化騰親口承認“動作慢了”,慢了9個月到1年。劉熾平復盤,混元像高中生背題應考,成績單好看,一上真實考場就露餡。與此同時,字節豆包月活已達3.45億,阿里千問1.66億,而元寶約5700萬,差距不僅沒縮小還在拉大。

      所以當28歲的姚順雨——前OpenAI研究員、清華姚班出身、中國互聯網最受矚目的天才少年,在去年被正式任命為騰訊“CEO/總裁辦公室”首席AI科學家時,外界解讀只有一個意思:騰訊要動真格了。

      四個月后,Hy3 preview上線。交卷時刻似乎到了。

      01

      一場“推倒重來”式的重建

      Hy3 preview不是一次常規迭代。用騰訊自己的話說,這是一場底層工程的重構。2月,混元重建了預訓練和強化學習的基礎設施,原有的訓練框架沒有沿用,姚順雨到任后在一個月內完成了整個基礎設施的重建。

      重建的方向很明確,三個原則:能力體系化、評測真實性、性價比追求。翻譯一下就是,不做“偏科生”,不刷榜,不讓模型變成燒錢的無底洞。

      “不做偏科生”這條尤其值得展開。Hy3 preview從研發之初就圍繞智能體場景做了針對性設計,而姚順雨的判斷是,即便是代碼智能體的單一應用,也涉及推理、長文、指令、對話、代碼、工具等多種能力的深度協同。你不能讓模型只會寫代碼卻看不懂文檔,或者能聊天但調不了API。

      同時,姚順雨指出,過去的混元過度追逐榜單成績,將打榜語料放入訓練集導致數據被污染,影響了真實場景表現。他要求團隊“以后不要打榜”,主動跳出易被刷榜的公開榜單,通過自建題目、最新考試、人工評測、產品眾測等多種方式來評估模型的“真實戰斗力”。

      從研發節奏來看,Hy3 preview于2026年1月底正式啟動訓練,從訓練到上線用了不到三個月,被騰訊內部定義為混元大模型從“讀萬卷書”走向“行萬里路”、嘗試解決真實世界復雜問題的開端。

      不到三個月,重建基礎設施、定方向、訓模型、開源發布。這個速度放在大廠體系里,相當激進。

      Hy3 preview最核心的技術理念是“快慢思考融合”。

      這個概念對應的是認知科學中的雙系統理論:系統1(快思考)是快速、自動、直覺式的反應;系統2(慢思考)是緩慢、深度、需要調用大量計算資源的推理。傳統大模型在設計時通常兩條路只能選一條,要么快但能力有限,要么強但響應慢。

      Hy3 preview的做法是讓模型根據任務難度自動選擇思考模式:簡單任務用快思考,復雜任務切換到慢思考,在速度和能力之間找一個最優平衡點。

      工程上,這套機制依賴MoE架構來實現。295B的總參數中,每次推理只激活21B,激活占比約7.1%。這意味著實際計算量遠小于一個2950億的稠密模型。

      慢思考任務會激活更多專家、調用更多計算資源,快思考任務則只激活少數專家、節省算力。快慢思考的切換不是簡單疊加兩個模型,而是在一個模型內部根據任務自適應用分配計算量。

      這個設計思路并不新鮮,但能在不到三個月里完成架構選型、訓練和上線,背后的工程能力確實不容小覷。

      對騰訊這種手握微信、QQ、騰訊文檔等海量用戶產品的公司來說,推理成本的可控性很大程度上決定了模型能否真正進入產品,Hy3 preview的架構選擇也正因如此具備了現實的商業考量。

      02

      不刷榜的底氣是什么?

      既然說“不打榜”,評估體系就得自己建。

      騰訊混元提出了CL-bench和CL-bench-Life兩套評測框架,重點考察模型在長而雜亂的上下文中理解信息、遵循復雜規則并完成任務的能力。這兩套框架對應的正是許多真實生產和生活場景里最常見、也最難被傳統榜單覆蓋的問題。

      在具體性能表現上,Hy3 preview在幾個關鍵基準測試中取得了有競爭力的結果。在編程基準SWE-Bench Verified中,Hy3 preview得分74.4%,相比前代Hy2的53.0%提升超過40%,已接近GLM-4.7的水平。

      在復雜推理任務上,Hy3 preview在FrontierScience-Olympiad、IMOAnswerBench等高難度理工科推理任務中表現突出,全國中學生生物學聯賽(CHSBO 2025)等高難度推理任務中,Hy3 preview同樣取得優異成績,展現了其在復雜邏輯推理上的泛化能力。

      雖然沒有刻意追求任何單一維度的“SOTA”,但Hy3 preview在各個方向上都展現出了相當均衡的競爭力。這種選擇恰好印證了姚順雨在AGI-Next峰會上傳遞的信號,行業需要跳出“打榜”束縛,核心聚焦在真實用戶價值。

      不過也要看到,Hy3 preview的某些實測表現并不完美。

      有機構一手測試顯示,在一個覆蓋數據抓取、數值計算、可視化生成和文本分析的全鏈路綜合任務中,Hy3 preview在數據獲取階段反復受阻,接口認證失敗后接連切換多個數據源,部分數據因速率限制缺失而被迫用模擬數據替代;

      最關鍵的是,提示詞明確要求輸出500字的跨市場資產配置Memo,模型卻只給出了幾行Bullet point式的簡略配置比例,沒有成文的分析段落。

      這表明Hy3 preview在真實復雜場景下的交付完整性仍有不小提升空間。當然,作為一款preview版本,這些瑕疵大致在預期之內。

      除此以外,價格層面可能也是現在最受關注的問題之一,Hy3 preview在騰訊云大模型服務平臺TokenHub上的定價是:輸入價格最低1.2元/百萬tokens,輸入命中緩存價格0.4元/百萬tokens,輸出價格最低4元/百萬tokens。同時,騰訊云聯合混元推出的定制Token Plan套餐,個人版定價最低28元/月。

      放在當前的市場坐標系里,Hy3 preview的價格并不算激進。

      作為對比,DeepSeek-V4-Flash的輸入價格為0.2元/百萬tokens,V4-Pro在限時優惠后輸入緩存命中價格更是低至0.025元/百萬tokens。在OpenRouter平臺上,DeepSeek-V4-Flash每百萬Token的平均輸出價僅為GPT-5.5 Pro的1.55‰。

      但在“百模大戰”進入Agent時代的當下,騰訊的價格邏輯是清晰的:不拼絕對低價,追求“能力-成本-場景”的三角平衡。

      21B的激活參數本身就是一張成本牌的底,結合MoE架構的高效推理,它為Agent場景中高頻次、長鏈路的調用提供了一個相對可控的成本底座。

      換句話說,摸到了Agent落地的門檻。

      03

      騰訊AI的底牌仍然是自有生態

      模型的真正價值在于用起來。

      Hy3 preview目前在騰訊云、元寶、ima、CodeBuddy、WorkBuddy、QQ、QQ瀏覽器、騰訊文檔、騰訊樂享等首發上線,微信公眾號、和平精英、騰訊新聞、騰訊自選股、騰訊客服、微信讀書等多個主線產品也在陸續接入中。

      值得留意的是開源生態的接入:Hy3 preview支持接入OpenClaw、OpenCode、KiloCode等流行開源智能體產品。這意味著騰訊不僅在用自己的模型武裝自家的產品矩陣,也在試圖進入更廣泛的開源智能體生態。

      但產品側的挑戰同樣直接。元寶此前接入DeepSeek-R1后日活暴漲超20倍,但搜索鏈路分走混元和DeepSeek兩套系統,體驗不統一,留存轉化始終是難題。Hy3 preview全面接入后,能否解決這個“分流”問題,將是檢驗模型真實戰斗力的第一次試金。

      目前,騰訊旗下最大的AI應用元寶已全面接入Hy3 preview。從微信到QQ,從騰訊文檔到和平精英,騰訊的產品矩陣正在圍繞一個統一的模型底座進行集結。這種“自有生態+自有模型”的打法,和字節豆包依托火山引擎的路徑形成了有趣的對比。

      回到Hy3 preview,發布當天,同一天晚上,OpenAI發布GPT-5.5。不到24小時,DeepSeek V4預覽版跟著上線。

      這是一個縮影。今年大模型牌局,對手們出牌的速度遠比外界想象的快。

      Meta前段時間憑Muse Spark打了個翻身仗,股價當日大漲;Google的Gemini 3.1系列繼續保持強勢,AI聊天機器人市場份額已從不到6%攀升至約20%以上。國內方面,阿里的Qwen3.6-Max-Preview,月之暗面的Kimi K2.6。更早之前,豆包大模型2.0首次大版本跨代升級,百度也發了2.4萬億參數的原生全模態文心大模型5.0正式版。

      至于DeepSeek,V4-Pro在Agent能力、世界知識和推理性能上達到開源模型最佳水平,并在兩天內連續降價,部分價格降至原價的四十分之一,V4-Flash每百萬tokens輸入緩存命中價格僅為0.02元。

      行業里有了共識,跟DeepSeek拼價格,對任何廠商都不是劃算的買賣。

      在這一背景下,騰訊按自己的節奏走“實用主義+生態落地”的路線。正如湯道生此前判斷的,主流大模型的能力差距正在縮小,企業的核心需求已不再是擁有最好的模型,而是如何通過系統工程把模型的能力最大程度發揮出來,真正拉開差距的是“工程化交付能力”。

      04

      姚順雨:從“定義下半場”到“交出模型”

      整件事最特別的地方在于一個人:姚順雨。

      2025年4月,還在OpenAI的姚順雨發表了一篇博客《The Second Half》,提出AI已經從上半場走到下半場,重點不再是訓練出更強的模型,而是如何定義值得解決的問題,用更接近真實世界的方式評估模型。

      這篇博客讓他獲得了“定義AI下半場的人”這樣的標簽。

      加入騰訊后,他需要從提出判斷走向落地判斷。四個月,一套新的基礎設施,一個新模型,一次開源。對于外界來說,Hy3 preview是一個答案的開頭。

      姚順雨自己的表態很清醒:“Hy3 preview是混元大模型重建的第一步。我們希望通過這次開源和發布,獲得來自開源社區和用戶的真實反饋,幫助我們提升Hy3正式版的實用性”。

      這番話沒有任何夸口的成分,倒更像一個階段性的項目匯報。

      公開信息顯示,除了姚順雨,騰訊在過去一年從微軟、阿里、DeepSeek等頂尖團隊引入了不下10位AI大牛,包括前微軟亞洲研究院視覺計算組首席研究員胡瀚、微軟WizardLM項目創建者徐燦等。騰訊在AI人才上的投入力度,從薪資、職級到職責范圍,都給了候選人能在業內拿到的幾乎最高水平。

      Hy3 preview不是一個天才少年單槍匹馬的成果,而是一個重新集結后的團隊,在一個被重建的基礎上做出的第一款產品。

      對于騰訊而言,Hy3 preview本質上是在回答一個問題:騰訊大模型到底還行不行?從參數、架構、評測數據和產品落地來看,這份答卷至少在及格線之上。

      但一個preview版本只是起點。在這樣一個對手環伺、節奏加速的牌局里,騰訊需要的是一個能持續迭代、真正在自有生態里扎根、并最終跑出差異化價值的模型體系。

      這才是接下來真正值得關注的問題:Hy3正式版何時到來,騰訊的產品矩陣能否圍繞它形成一套真正自洽的“模型-應用-商業”閉環,元寶能否在混元自己的基座上跑出留存和增長,以及,在Agent時代真正到來時,騰訊的生態縱深能否轉化為實際的競爭優勢。

      四個月前,姚順雨拿到了一張新牌桌。四個月后,Hy3 preview是第一張牌。接下來怎么打,才是看功力的地方。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      浮嶋敏:不會因為是踢日本就有更高動力,但我對他們了解更多

      浮嶋敏:不會因為是踢日本就有更高動力,但我對他們了解更多

      懂球帝
      2026-05-08 12:25:02
      錄音曝光!81歲李家鼎哭著求長子別再啃老,李泳漢威脅拿祖屋套現

      錄音曝光!81歲李家鼎哭著求長子別再啃老,李泳漢威脅拿祖屋套現

      開開森森
      2026-05-08 10:44:56
      康熙長子被圈禁26年,瘋狂納妃生下20個孩子,卻因禍得福成贏家

      康熙長子被圈禁26年,瘋狂納妃生下20個孩子,卻因禍得福成贏家

      浩渺青史
      2026-05-06 00:41:01
      范元甄:與江青齊名的延安四美之一,嫁主席秘書,卻輸掉了一生

      范元甄:與江青齊名的延安四美之一,嫁主席秘書,卻輸掉了一生

      干史人
      2026-03-05 21:06:35
      NBA季后賽|湖人再度不敵雷霆,賽后全隊找裁判理論

      NBA季后賽|湖人再度不敵雷霆,賽后全隊找裁判理論

      北青網-北京青年報
      2026-05-08 15:47:14
      No!麻了,湖人麻了!東契奇親承復出時間

      No!麻了,湖人麻了!東契奇親承復出時間

      籃球實戰寶典
      2026-05-07 17:49:06
      意網協主席炮轟四大滿貫:壟斷可恥!我們要辦第五個大滿貫

      意網協主席炮轟四大滿貫:壟斷可恥!我們要辦第五個大滿貫

      體育妞世界
      2026-05-08 08:52:49
      1800億,「90后首富」被判25年!

      1800億,「90后首富」被判25年!

      新浪財經
      2026-05-08 18:05:52
      31分史詩逆轉!中國U17男籃轟29-0加時翻盤 姚嘉澤轟32+10

      31分史詩逆轉!中國U17男籃轟29-0加時翻盤 姚嘉澤轟32+10

      醉臥浮生
      2026-05-07 22:55:24
      北京局新任總經理已到位

      北京局新任總經理已到位

      軌道世界
      2026-05-07 23:53:47
      哈登致命失誤登全美熱搜!13中3在場-15夢游 名嘴曬2數據證偽巨星

      哈登致命失誤登全美熱搜!13中3在場-15夢游 名嘴曬2數據證偽巨星

      顏小白的籃球夢
      2026-05-08 10:13:08
      貝弗利:希望杜蘭特沒裝病,看到詹姆斯的表現我打封閉也要上

      貝弗利:希望杜蘭特沒裝病,看到詹姆斯的表現我打封閉也要上

      懂球帝
      2026-05-08 14:21:05
      炸裂!茅臺原董事長涉嫌受賄、洗錢

      炸裂!茅臺原董事長涉嫌受賄、洗錢

      財經三分鐘pro
      2026-05-08 17:37:12
      梁靖崑0-3慘敗不到24小時,令人擔心的事就發生了,王皓陷入兩難

      梁靖崑0-3慘敗不到24小時,令人擔心的事就發生了,王皓陷入兩難

      阿纂看事
      2026-05-07 20:35:39
      向導掐人中救醒高反昏迷女子反遭掌摑,有網友稱其“裝暈想免費下山”,女子否認:已報警;被打向導發聲:她嚴重高反或因幻覺打人,已道歉

      向導掐人中救醒高反昏迷女子反遭掌摑,有網友稱其“裝暈想免費下山”,女子否認:已報警;被打向導發聲:她嚴重高反或因幻覺打人,已道歉

      都市快報橙柿互動
      2026-05-08 12:27:22
      不敢相信!一個落選秀,首次打季后賽,三分命中率58%

      不敢相信!一個落選秀,首次打季后賽,三分命中率58%

      球毛鬼胎
      2026-05-08 13:06:01
      倫敦世乒賽:4強席位出爐!日本3:1晉級,張本智和成功登上領獎臺

      倫敦世乒賽:4強席位出爐!日本3:1晉級,張本智和成功登上領獎臺

      國乒二三事
      2026-05-07 21:57:30
      70歲之后,來日并不方長,身體再好,也要牢記8句話

      70歲之后,來日并不方長,身體再好,也要牢記8句話

      小談食刻美食
      2026-05-07 07:34:54
      中國差點變印度?黃巢讓中國躲過千年災難,毛主席的評價一針見血

      中國差點變印度?黃巢讓中國躲過千年災難,毛主席的評價一針見血

      掠影后有感
      2026-05-08 10:20:21
      26歲堪稱曼聯大腿,32歲卻遭曼城退貨,快馬貪得無厭毀了自己前途

      26歲堪稱曼聯大腿,32歲卻遭曼城退貨,快馬貪得無厭毀了自己前途

      足籃大世界
      2026-05-08 17:41:12
      2026-05-08 18:47:00
      新眸深度 incentive-icons
      新眸深度
      看見商業另一面。
      1494文章數 2479關注度
      往期回顧 全部

      科技要聞

      SK海力士平均獎金600萬 工服成相親神器

      頭條要聞

      伊朗成立新部門 所有想過霍爾木茲的船要先填40多道題

      頭條要聞

      伊朗成立新部門 所有想過霍爾木茲的船要先填40多道題

      體育要聞

      他把首勝讓給隊友,然后用一年時間還清賬單

      娛樂要聞

      古天樂被曝隱婚生子,新娘竟是她

      財經要聞

      輪到豆包收割了?

      汽車要聞

      智能雙艙大五座SUV 樂道L80將于5月15日正式上市

      態度原創

      時尚
      教育
      手機
      數碼
      軍事航空

      海魂衫搭配白色,更解暑!

      教育要聞

      南京江寧區2026年小學、初中招生入學工作實施細則

      手機要聞

      某廠驍龍2nm新機配置全曝光:2nm+2億像素,或為榮耀Magic 9系列

      數碼要聞

      AI時代 CPU依然中流砥柱!AMD加冕數據中心之王

      軍事要聞

      伊朗:最高領袖穆杰塔巴全面掌控局勢

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 久久综合色之久久综合色| 亚洲精品一品| 扒开双腿疯狂进出爽爽爽| 亚洲中文无码AV永不收费| 97色色资源站| 亚洲无码网站| 天天躁日日躁狠狠躁欧美老妇小说| 国产美女精品免费视频| jizzjizz亚洲| 女高中生自慰免费观看WWW| 国语精品一区二区三区| 亚洲国产a片。| 一级a爱片免费视频观看| 人妻系列中文字幕精品| videos欧美hd精品| 国产片一区二区三区视频| 91福利国产午夜亚洲精品| 性欧美三级在线观看| 在线午夜精品自拍小视频| 欧美国产高| 亚洲AV无码专区国产乱码电影| 成人午夜免费无码视频在线观看| 免费a级在线观看播放| 中文激情一区二区三区四区| 天天爽夜夜爽夜夜爽| 亚洲av永久无码精品水牛影视| 亚洲精品粉嫩小泬50P| 无码精品一区二区三区免费16| 国产一区二区亚洲一区二区三区| 中文字幕在线亚洲| 欧美性爱综合网| 好爽好紧好大的免费视频| 91九色首页| V一区无码内射国产| 2019亚洲午夜无码天堂| 波多野结衣一区二区| 日本一区不卡高清在线观看| 亚洲天堂视频在线观看| 69天堂| 国产制服丝袜在线视频观看| 中文字幕久久精品波多野结|