<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      RouteMoA:無需預(yù)推理的動態(tài)路由,實(shí)現(xiàn)高效多智能體混合

      0
      分享至



      本篇論文已被 ACL 2026 接收,主要作者來自上海交通大學(xué)自動化與感知學(xué)院 IWIN 中心團(tuán)隊(duì)。團(tuán)隊(duì)負(fù)責(zé)人為關(guān)新平教授,指導(dǎo)老師為陳彩蓮教授和樂心怡教授,合作作者還包括南洋理工大學(xué)陶大程教授。其他作者來自騰訊、上海人工智能實(shí)驗(yàn)室、香港中文大學(xué)等機(jī)構(gòu)。第一作者王驥澤為上海交通大學(xué)博士生,研究方向?yàn)榇竽P椭悄荏w。

      近年來,大語言模型的發(fā)展,正在從 “單模型能力提升” 走向 “多模型協(xié)作”。這是一個(gè)很自然的方向:既然不同模型各有所長,有的擅長數(shù)學(xué),有的擅長代碼,有的更懂醫(yī)學(xué),那為什么不讓它們協(xié)同起來,共同解決更復(fù)雜的問題?

      Mixture-of-Agents(MoA)正是在這樣的背景下提出的。它通過讓多個(gè)模型并行生成、逐層交互、反復(fù)融合,往往能夠得到比單一模型更強(qiáng)的結(jié)果。問題也很明顯:性能提升的同時(shí),成本和延遲也隨之迅速上升。

      在標(biāo)準(zhǔn) MoA 中,每一輪通常都要調(diào)用多個(gè)模型,再基于它們的輸出進(jìn)行篩選和融合。但究竟該讓哪些模型參與、哪些模型可以跳過,往往缺乏明確的選擇機(jī)制。模型越多、層數(shù)越深,整體開銷就越高,在大規(guī)模模型池場景下,系統(tǒng)效率和可擴(kuò)展性都會面臨很大挑戰(zhàn)。

      也正因如此,研究者開始嘗試讓 MoA 變稀疏。例如,一些方法如 Sparse MoA 會先讓模型池中的所有模型生成回答,再通過額外的評審模型進(jìn)行打分和篩選,只保留一部分模型進(jìn)入后續(xù)協(xié)作。這樣雖然減少了后續(xù)融合的負(fù)擔(dān),但本質(zhì)上仍然繞不開一個(gè)問題:為了決定該選誰,系統(tǒng)還是得先讓所有模型都推理一遍。

      于是,這篇工作的核心問題就變得非常直接:我們真的需要先讓所有模型都回答一遍,才能決定該選誰嗎?



      • 論文標(biāo)題:RouteMoA: Dynamic Routing without Pre-Inference Boosts Efficient Mixture-of-Agents
      • 論文鏈接:https://arxiv.org/abs/2601.18130
      • 代碼鏈接:https://github.com/Jize-W/RouteMoA

      一句話總結(jié):RouteMoA 的核心思想是,通過在推理前進(jìn)行模型能力預(yù)測,避免對所有模型進(jìn)行無效推理。





      現(xiàn)有方法的問題:

      效率瓶頸不在融合,而在全量推理

      當(dāng)前 MoA 系列方法的一個(gè)共同假設(shè)是:要判斷哪個(gè)模型更好,必須先看到它的輸出。因此,無論是經(jīng)典 MoA,還是引入 judge 的 Sparse MoA,本質(zhì)上都繞不開一個(gè)步驟:所有模型先推理 -> 再篩選 -> 再融合。

      這帶來兩個(gè)問題:

      第一,計(jì)算成本無法下降。即使最后只用少數(shù)模型,前面已經(jīng)為所有模型付出了推理代價(jià)。

      第二,難以擴(kuò)展到大模型池。當(dāng)模型數(shù)量增加時(shí),全量推理會迅速變得不可承受,甚至超出上下文限制。

      也就是說,瓶頸并不在 “如何選”,而在 “選之前已經(jīng)太貴了”。

      RouteMoA:

      把 “選模型” 前移到推理之前



      RouteMoA 的關(guān)鍵創(chuàng)新,是把模型選擇從 “后驗(yàn)判斷” 變成 “先驗(yàn)預(yù)測 + 輕量修正”。

      整個(gè)流程可以分為三個(gè)步驟:

      1. 先驗(yàn)篩選:不推理,也能判斷誰更可能做對

      RouteMoA 引入了一個(gè)輕量級 scorer,只根據(jù)用戶 query,就預(yù)測每個(gè)模型的潛在表現(xiàn)。這個(gè)過程不需要調(diào)用大模型推理,只做一個(gè)粗粒度打分,把模型池縮小到一個(gè)潛力子集。本質(zhì)上,這是在做一件過去被忽略的事情:用 query 本身的信息,提前判斷模型能力匹配度。

      2. 后驗(yàn)修正:用已有輸出做低成本評審

      初篩不可避免會有誤差,因此 RouteMoA 引入了 mixture-of-judges:

      • self-assessment:模型對自己的答案打分
      • cross-assessment:高質(zhì)量模型評估其他模型

      關(guān)鍵在于:這些評估只基于已經(jīng)生成的輸出,不引入額外推理調(diào)用。也就是說,系統(tǒng)通過已有信息進(jìn)行糾錯(cuò),而不是再算一輪。

      3. 綜合排序:性能、成本、延遲一起優(yōu)化

      最終,RouteMoA 在模型選擇時(shí)不僅僅考慮性能,而是同時(shí)考慮:

      • 輸出質(zhì)量
      • token 成本
      • 推理延遲

      從而在實(shí)際系統(tǒng)中實(shí)現(xiàn)一個(gè)更接近工程最優(yōu)的決策,而不是單純追求 accuracy。

      實(shí)驗(yàn)結(jié)果:

      少花 90% 的錢,反而更強(qiáng)

      在包含 15 個(gè)模型的大規(guī)模模型池實(shí)驗(yàn)中,RouteMoA 的結(jié)果非常直觀:

      • 成本降低 89.8%
      • 延遲降低 63.6%
      • 同時(shí)整體準(zhǔn)確率相對 MoA 和 SMoA 有所提升

      這說明一件事:減少無效計(jì)算,不僅不會傷害性能,反而會讓系統(tǒng)更專注于對的模型。



      一個(gè)關(guān)鍵洞察:

      多模型系統(tǒng)的本質(zhì)是稀疏的

      論文中一個(gè)非常重要的觀察是:在絕大多數(shù) query 上,真正關(guān)鍵的模型只占少數(shù)。只要初始階段能把這些模型保留下來,后續(xù)協(xié)作就足以放大正確答案。實(shí)驗(yàn)中,scorer 在 Top-3 內(nèi)命中正確模型的概率接近 98%,這意味著:系統(tǒng)并不需要看所有答案,只需要別漏掉對的模型。

      進(jìn)一步分析:

      失敗不在選錯(cuò)模型,而在融合階段



      一個(gè)很有意思的發(fā)現(xiàn)是,在失敗案例中:

      • 超過 50% 的錯(cuò)誤來自最終答案融合(aggregation drift)
      • 而真正因?yàn)檫x錯(cuò)模型的比例要低得多

      可見,多模型系統(tǒng)的瓶頸正在發(fā)生轉(zhuǎn)移:從 “選誰來回答”,轉(zhuǎn)向 “如何整合多個(gè)答案”。

      總結(jié):多模型時(shí)代,調(diào)度很重要

      RouteMoA 的意義,并不只是一個(gè)更高效的 MoA 變體,而是提供了一種新的范式:

      • 不再默認(rèn)所有模型都要參與
      • 而是先判斷誰值得參與
      • 再用協(xié)作機(jī)制校正和放大正確答案

      換句話說,隨著多模型協(xié)作的興起,系統(tǒng)層的調(diào)度與協(xié)同,正變得與模型能力同樣重要。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      2016年,黎明和助理陳泳儀的合影,2年后,陳助理成了黎夫人

      2016年,黎明和助理陳泳儀的合影,2年后,陳助理成了黎夫人

      喜文多見01
      2026-05-03 12:41:06
      母親喪事舅舅不來,后來舅舅辦壽宴,父親放話:誰敢去就別認(rèn)我了

      母親喪事舅舅不來,后來舅舅辦壽宴,父親放話:誰敢去就別認(rèn)我了

      匹夫來搞笑
      2026-03-13 13:44:33
      魔術(shù)總裁:不會因首輪失利拆散陣容 但教練崗位需要一個(gè)新的聲音

      魔術(shù)總裁:不會因首輪失利拆散陣容 但教練崗位需要一個(gè)新的聲音

      北青網(wǎng)-北京青年報(bào)
      2026-05-05 13:12:11
      拜仁名宿:世界級球隊(duì)后防不會丟5球,難說拜仁能進(jìn)歐冠決賽

      拜仁名宿:世界級球隊(duì)后防不會丟5球,難說拜仁能進(jìn)歐冠決賽

      硯底沉香
      2026-05-06 00:01:44
      13位師長兩山參戰(zhàn),2人授中、上將,8人升少將,3人無緣將官

      13位師長兩山參戰(zhàn),2人授中、上將,8人升少將,3人無緣將官

      云霄紀(jì)史觀
      2026-05-06 00:42:10
      一張“職高女生氛圍照”火了,被全網(wǎng)嘲笑:別給學(xué)不明白找借口了

      一張“職高女生氛圍照”火了,被全網(wǎng)嘲笑:別給學(xué)不明白找借口了

      世界圈
      2026-04-07 13:11:51
      叔圈頂流重新洗牌,王陽出局,于和偉換桌,張譯邊緣,榜首沒懸念

      叔圈頂流重新洗牌,王陽出局,于和偉換桌,張譯邊緣,榜首沒懸念

      白面書誏
      2026-05-04 15:54:34
      隨著山東泰山4-1大勝上海申花,縱觀全場,談以下五點(diǎn)個(gè)人感受!

      隨著山東泰山4-1大勝上海申花,縱觀全場,談以下五點(diǎn)個(gè)人感受!

      田先生籃球
      2026-05-05 22:42:56
      僅5集,熱度飆升至榜一,全網(wǎng)0差評,觀眾:看2小時(shí)被我媽罵了8次

      僅5集,熱度飆升至榜一,全網(wǎng)0差評,觀眾:看2小時(shí)被我媽罵了8次

      小娛樂悠悠
      2026-05-05 09:40:35
      原來警察也分系統(tǒng)!這5類不歸公安局管,越早知道越省心

      原來警察也分系統(tǒng)!這5類不歸公安局管,越早知道越省心

      細(xì)說職場
      2026-05-01 10:57:13
      央視再次盛贊國產(chǎn)游戲!出海收入連續(xù)六年破千億人民幣

      央視再次盛贊國產(chǎn)游戲!出海收入連續(xù)六年破千億人民幣

      游民星空
      2026-05-03 19:40:15
      剖析項(xiàng)英犧牲真相:為何多次拒絕毛澤東北上命令?因自己兩個(gè)私心

      剖析項(xiàng)英犧牲真相:為何多次拒絕毛澤東北上命令?因自己兩個(gè)私心

      阿胡
      2025-04-20 11:05:46
      關(guān)羽為什么要“月下斬貂蟬”,因?yàn)殛P(guān)羽發(fā)現(xiàn)了貂蟬的一個(gè)秘密

      關(guān)羽為什么要“月下斬貂蟬”,因?yàn)殛P(guān)羽發(fā)現(xiàn)了貂蟬的一個(gè)秘密

      千秋文化
      2026-03-05 23:19:21
      他曾擔(dān)任3個(gè)直轄市市委書記,40歲官至副國級,43歲粉碎重大陰謀

      他曾擔(dān)任3個(gè)直轄市市委書記,40歲官至副國級,43歲粉碎重大陰謀

      元哥說歷史
      2026-05-02 14:25:03
      世乒賽爆大冷!張本智和3連敗 怒批賽制,國乒男團(tuán)應(yīng)感謝新賽制

      世乒賽爆大冷!張本智和3連敗 怒批賽制,國乒男團(tuán)應(yīng)感謝新賽制

      好乒乓
      2026-05-05 12:31:33
      【U17亞洲杯】孔璽諾造險(xiǎn) 中國隊(duì)0比1印尼遭開門黑

      【U17亞洲杯】孔璽諾造險(xiǎn) 中國隊(duì)0比1印尼遭開門黑

      體壇周報(bào)
      2026-05-06 02:51:19
      網(wǎng)約車長時(shí)間違停外灘,司機(jī)竟然在吃飯?!交警一波操作,太意外了……

      網(wǎng)約車長時(shí)間違停外灘,司機(jī)竟然在吃飯?!交警一波操作,太意外了……

      上海黃浦
      2026-05-05 16:50:09
      回加拿大生活的大山,60歲須發(fā)皆白很滄桑,重慶妻子仍風(fēng)韻猶存

      回加拿大生活的大山,60歲須發(fā)皆白很滄桑,重慶妻子仍風(fēng)韻猶存

      素衣讀史
      2026-03-31 15:11:31
      相處久了,你就會發(fā)現(xiàn),一個(gè)男人也許會愛無數(shù)女人,但他心里總有一處角落,留給這兩個(gè)女人

      相處久了,你就會發(fā)現(xiàn),一個(gè)男人也許會愛無數(shù)女人,但他心里總有一處角落,留給這兩個(gè)女人

      心理觀察局
      2026-05-04 08:51:06
      世乒賽最新戰(zhàn)報(bào):梁靖崑王楚欽狂轟3-0,8強(qiáng)賽對陣出爐,龍隊(duì)觀賽

      世乒賽最新戰(zhàn)報(bào):梁靖崑王楚欽狂轟3-0,8強(qiáng)賽對陣出爐,龍隊(duì)觀賽

      凡知
      2026-05-05 20:53:17
      2026-05-06 03:43:00
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      12919文章數(shù) 142642關(guān)注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設(shè)備處理器

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      內(nèi)娛真情誼!楊紫為謝娜演唱會送花籃

      財(cái)經(jīng)要聞

      瀏陽煙花往事

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態(tài)度原創(chuàng)

      旅游
      家居
      時(shí)尚
      親子
      公開課

      旅游要聞

      女子體驗(yàn)瀑布秋千受傷后送醫(yī)途中離世 官方通報(bào)

      家居要聞

      靈動實(shí)用 生活藝術(shù)場

      衣服不用準(zhǔn)備太多,找到一些實(shí)用的單品才最重要,百搭又有性價(jià)比

      親子要聞

      這個(gè)五一,帶寶寶來北海看海啦~銀灘細(xì)沙海浪,是小朋友最愛的天

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 日日摸夜夜添夜夜添国产三级| 中文无码制服丝袜人妻AV| 久久精品亚洲中文无东京热| 成人啪精品视频网站午夜| 色欲人妻综合网站| 国产成人精品亚洲日本在线| 东京热一精品无码av| 91在线观看| 人妻精品久久久久中文字幕19| 中国精品国产yw在线观看| 免费无码成人AV在线播放不卡| 有码人妻动慢| 天天躁日日躁狠狠躁欧美| 日韩精品视频在线观看免费| 爱啪啪精品一区二区三区| 亚洲avav| 日本一区二区三本视频在线观看| 天天做夜夜爽熟女久久| 精品少妇后入一区二区三区| 国产精品白丝久久AV网站| 精品1区| 伊人久久大香线蕉综合AV| 人妻夜夜爽天天爽三区丁香花| 丰满的人妻hd高清日本| 亚洲激情二区| 三级在线视频观看| 日本中文字幕久久网站| 亚洲av精选一区二区| 国产av制服丝袜| 稷山县| 在线观看热久精品视频| 国产按头口爆吞精在线视频| 中文字幕成人精品久久不卡| 无码人妻h动漫| 欧美深度肠交惨叫| 久久国产成人av蜜臀| 俄罗斯老熟妇性爽xxxx| 精品久久久久久久久久中文字幕| 亚洲无码精品电影| 青青草原精品99久久精品66| 国产成人午夜精品福利|