<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      清華姚權銘團隊提出LMNet,讓語言模型學會自己「組網」

      0
      分享至



      大語言模型正在成為人工智能系統的核心組件。從文本生成、數學推理到代碼編寫,單個大模型已經展現出強大的能力。

      然而,隨著任務復雜度不斷提升,一個新的問題也逐漸浮現:未來的智能系統,是否一定要依賴一個越來越大的“單體模型”?還是可以像人類社會、神經系統和計算網絡一樣,通過多個智能單元之間的連接、通信與協同,形成更強大的系統能力?

      圍繞這一問題,清華大學姚權銘團隊提出了一種新的 AI 系統組織方式:Language Model Networks。相關論文發表于 ICML 2026,作者為 Shiguang Wu、Yaqing Wang 和 Quanming Yao。該工作進一步設計了LMNet,讓語言模型之間能夠通過稠密、可微、可訓練的方式進行通信,從而探索從“單模型智能”走向“模型網絡智能”的新路徑。



      • 論文標題:Language Model Networks: Supervision-Efficient Learning through Dense Communication
      • 論文鏈接:https://arxiv.org/abs/2505.12741

      一、從“更大的模型”到“更會協作的系統”

      過去幾年,大模型研究很大程度上圍繞“規模”展開:更大的參數量、更多的數據、更長的上下文、更強的訓練策略。規模擴展帶來了能力躍遷,也推動了大模型在真實場景中的廣泛應用。

      但當模型開始承擔更復雜、更持續、更需要分工的任務時,單體模型也面臨新的邊界:它需要同時完成規劃、推理、檢索、驗證、調用工具和生成結果,系統壓力不斷集中在一個模型內部。

      Language Model Networks 提供了另一種視角:預訓練語言模型不必只被看作一個獨立預測器,也可以被看作可復用的計算節點;模型之間的連接、通信和協同,也可以成為智能能力的重要來源。

      換句話說,AI 的能力不只來自“模型本身有多強”,也來自“模型被如何組織起來”。

      二、為什么僅靠自然語言“聊天”還不夠

      在現有的大模型推理 test-time scaling、多模型協作和多智能體系統中,模型之間通常通過自然語言進行交流。例如,一個模型先生成一段文字,另一個模型再讀取這段文字并繼續推理。這種方式直觀、易用,也方便人類理解,因此非常適合快速搭建應用型系統。

      但從機器通信的角度看,自然語言并不是最高效的媒介。

      語言是離散的、符號化的,模型之間每次交流都需要經歷“內部表示到文本、文本再到內部表示”的轉換過程。這個過程可能帶來信息損失,也會打斷梯度傳播,使得整個系統很難直接根據最終任務目標進行端到端優化。

      對于模型與模型之間的協同而言,真正關鍵的問題不只是“怎樣寫提示詞”,而是“怎樣讓通信本身變成可以學習的對象”。

      圖 1 :離散的自然語言對于模型間通信是非必需的,且傳遞信息效率低、難以優化;LMNet 利用稠密連續向量進行模型間通信。

      三、LMNet:在語言模型之上構建“模型級神經網絡”

      LMNet 的設計可以被直觀理解為:在語言模型之上,再構建一個“模型級神經網絡”。

      在普通神經網絡中,神經元通過連接形成層級結構;而在 LMNet 中,預訓練語言模型被視為可復用的計算節點,模型之間的通信模塊則構成可訓練的連接邊。

      具體來說,LMNet 保留系統最外層的自然語言輸入和輸出,但在中間模型節點之間,盡量繞開反復的文本生成與文本理解過程,讓節點直接交換連續的稠密向量。這樣一來,模型之間的溝通不再完全依賴人工設計的提示詞、角色分工或中間推理文本,而是可以在訓練過程中自動學習出來。



      圖 2 :LMNet 模型網絡結構示意圖。語言模型作為節點,通信模塊(如 attention block)作為邊,形成可端到端優化的模型網絡。

      四、讓通信從人工設計變為自己學習

      這項工作的關鍵意義在于,它把“通信”從外部設計的規則,推進為系統內部可優化的能力。系統不需要人為標注每個中間節點應該說什么,也不需要提前規定每個模型必須扮演什么角色。只要最終任務有監督信號,LMNet 就可以通過梯度優化自動調整模型節點之間的信息流,學習“誰該向誰傳遞什么信息”。

      從這個意義上看,LMNet 更像是一項關于“智能組織方式”的探索。它將大語言模型從單個預測器,推進為可連接、可組合、可協同的網絡化組件;也將 AI 系統設計從“如何提示一個模型”,進一步推進到“如何組織一組模型”。

      這與測試時推理、多智能體協作、工作流優化等方向存在自然聯系,但 LMNet 更進一步關注底層通信機制本身:讓通信變成可微、可訓練、可優化的系統能力。

      五、實驗數字:小額外成本下的能力提升

      實驗結果顯示,LMNet 在通用能力提升和有限監督適應兩個場景中均展現出良好效果。

      在通用能力提升實驗中,研究團隊以 Qwen2.5-0.5B 作為基礎語言模型節點,構建 1/4/4/4/1 結構(共 4 層通信,14 個節點共享參數)的約 1.14B 參數的 LMNet-1B。在額外訓練 token 少于 0.1T、訓練成本不到基礎模型預訓練成本 0.2% 的情況下,LMNet 在多個通用任務上取得了明顯提升(圖 3)。



      圖 3:相近參數規模 LLM 的性能比較

      此外,考慮利用單個模型進行推理時 test-time scaling 的方法,以在接近的推理時間開銷的條件下進行比較,LMNet 同樣展現了明顯的性能優勢(圖 4)。



      圖 4:Qwen2.5-0.5B 不同的 test-time scaling 方法的性能比較

      在有限監督適應的場景中,LMNet 通過學習如何交流通信來進行適應。構造更小型的 LMNet,并凍結節點大模型參數只訓練邊模型的參數,以防止更新大量參數導致的過擬合。和其他 SFT 包括 PEFT 方法相比,LMNet 也展現出明顯性能優勢(圖 5、6)。



      圖 5:以不同的 LLM 為底座/節點,在 MMLU 上微調并測試的性能比較



      圖 6:在 E2E 數據集上用不同的 PEFT 方法微調 GPT2-M 并測試的性能比較

      這些數字并不是全文最重要的部分,但它們提供了一個清晰信號:模型之間的可學習通信,確實可能成為提升系統能力的一條有效路徑。LMNet 的價值不只在于某個 benchmark 的提升,更在于它證明了一個方向:通信方式本身可以被學習,模型網絡可以從最終任務監督中自動形成更有效的信息流。

      六、從單體智能走向網絡智能

      這項工作提示了一種可能的未來方向:下一代 AI 系統未必只是一個不斷擴大的模型,而可能是由多個模型、工具、記憶和反饋模塊共同構成的可學習網絡。

      在這樣的系統中,智能不只來自單個模塊的能力,也來自模塊之間如何連接、如何交流、如何共同適應任務。

      “溝通即智能”并不是一句簡單的口號,而是對未來 AI 系統形態的一種判斷。當語言模型開始學會自己“組網”,人工智能將從單體模型能力的競爭,走向系統組織能力、通信效率和協同學習能力的競爭。

      值得注意的是,這一方向與技術已經受到大模型系統應用的國際前沿研究的持續關注。如近期的 Google DeepMind 和 AWS Agentic AI。這些工作也從不同角度說明:模型間通信媒介、通信拓撲和可學習接口,正在成為構建下一代 AI 系統的重要技術方向。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      鹽堿地種出的海水稻,口感難吃卻越種越多,國家為何要大力發展?

      鹽堿地種出的海水稻,口感難吃卻越種越多,國家為何要大力發展?

      向航說
      2026-05-30 00:30:03
      江浙滬父母到底有多能托舉?網友調侃:這輩子只剩喝咖啡的苦

      江浙滬父母到底有多能托舉?網友調侃:這輩子只剩喝咖啡的苦

      另子維愛讀史
      2026-06-01 09:59:38
      最高預售價200萬元尊界搭載國產朝陽輪胎引發熱議,余承東稱做高端拔高了中國汽車產業能力

      最高預售價200萬元尊界搭載國產朝陽輪胎引發熱議,余承東稱做高端拔高了中國汽車產業能力

      金融界
      2026-05-31 21:56:07
      6-2!巴西大輪換仍橫掃世界杯參賽隊,皇馬1.5億巨星傳射+世界波

      6-2!巴西大輪換仍橫掃世界杯參賽隊,皇馬1.5億巨星傳射+世界波

      我愛英超
      2026-06-01 07:34:53
      軍事 | 普京將此殘骸交于美方,到底什么意思?

      軍事 | 普京將此殘骸交于美方,到底什么意思?

      新民周刊
      2026-06-01 09:08:31
      中國降級后,美防長當場砸場子:怒懟40國,點名日歐少開對話會

      中國降級后,美防長當場砸場子:怒懟40國,點名日歐少開對話會

      說歷史的老牢
      2026-05-31 10:06:57
      界面調查|起底留神峪煤礦及實控人任鐵柱:草根出身,煤改中幸存,管理混亂釀成大禍

      界面調查|起底留神峪煤礦及實控人任鐵柱:草根出身,煤改中幸存,管理混亂釀成大禍

      界面新聞
      2026-05-31 16:40:39
      張雪機車收獲兩個第8名,張雪發文反對車手德比斯攬責:“知道短板了就改進,相信下一代賽車更強”

      張雪機車收獲兩個第8名,張雪發文反對車手德比斯攬責:“知道短板了就改進,相信下一代賽車更強”

      都市快報橙柿互動
      2026-06-01 08:57:58
      湖北襄陽“割四賠五”事件后續:主播翻車,官方發聲網上爭執不斷

      湖北襄陽“割四賠五”事件后續:主播翻車,官方發聲網上爭執不斷

      Mr王的飯后茶
      2026-05-31 23:17:57
      釋永信在監獄能申請吃素不能

      釋永信在監獄能申請吃素不能

      熊太行
      2026-05-30 14:45:23
      “考上有啥用?”33歲女環衛工考上研究生,母親一句話問懵全網

      “考上有啥用?”33歲女環衛工考上研究生,母親一句話問懵全網

      一絲不茍的法律人
      2026-05-31 09:49:02
      汽車變客廳?中國監管擬禁止零重力座椅

      汽車變客廳?中國監管擬禁止零重力座椅

      甜份超標的我
      2026-05-30 02:11:08
      從棄將到近億元先生!阿根廷天才2年身價暴漲13倍 皇馬回購賺翻了

      從棄將到近億元先生!阿根廷天才2年身價暴漲13倍 皇馬回購賺翻了

      萬花筒體育球球
      2026-05-31 17:03:36
      男子隱瞞病情和女友發生親密關系,致女友感染高危型HPV,被告上法庭;法院判了:存在明顯過錯,賠償1.5萬元

      男子隱瞞病情和女友發生親密關系,致女友感染高危型HPV,被告上法庭;法院判了:存在明顯過錯,賠償1.5萬元

      揚子晚報
      2026-06-01 07:49:01
      五年減少3900萬!兒童節,越來越冷清了

      五年減少3900萬!兒童節,越來越冷清了

      西部城市
      2026-06-01 11:30:39
      重磅!美記曝光雷霆灰熊交易方案:霍姆格倫成籌碼,西部要變天

      重磅!美記曝光雷霆灰熊交易方案:霍姆格倫成籌碼,西部要變天

      酷侃體壇
      2026-06-01 09:25:02
      大爺也難招!7月起保安崗沒人敢用了?大齡從業者該何去何從

      大爺也難招!7月起保安崗沒人敢用了?大齡從業者該何去何從

      復轉這些年
      2026-05-31 20:33:07
      云南瑞麗:請廣大市民保持冷靜,不恐慌、不聚集

      云南瑞麗:請廣大市民保持冷靜,不恐慌、不聚集

      黃河新聞網呂梁
      2026-06-01 10:43:02
      減肥神藥存在巨大副作用!不只減少你的體重,也剝奪了你的多巴胺,讓人失去快樂

      減肥神藥存在巨大副作用!不只減少你的體重,也剝奪了你的多巴胺,讓人失去快樂

      風向觀察
      2026-05-28 15:31:33
      馬刺尼克斯上一次打總決賽時,世界是這個樣子

      馬刺尼克斯上一次打總決賽時,世界是這個樣子

      年代回憶
      2026-05-31 12:36:23
      2026-06-01 12:20:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      13130文章數 142656關注度
      往期回顧 全部

      科技要聞

      關停三年后,天涯社區今起開放訪問

      頭條要聞

      牛彈琴:巴黎又亂了火光沖天 馬克龍都看得目瞪口呆

      頭條要聞

      牛彈琴:巴黎又亂了火光沖天 馬克龍都看得目瞪口呆

      體育要聞

      哭過之后,文班亞馬想給波波維奇打電話

      娛樂要聞

      張凌赫活動商場玻璃被擠爆5人受傷

      財經要聞

      網紅驅蚊產品,標注化妝品竟含農藥成分

      汽車要聞

      上市三周交付3603臺!華境S躋身旗艦大六座第一梯隊

      態度原創

      時尚
      藝術
      健康
      本地
      親子

      女人不管多大年紀,夏天都要準備一條白色闊腿褲,百搭又清爽

      藝術要聞

      吳鎮寫竹,清清爽爽

      嘗試干細胞療法如何避免踩坑?

      本地新聞

      用剪紙的方式,打開江蘇揚州

      親子要聞

      世界牛奶日遇上兒童節:這三種“奶制品”別給孩子當牛奶喝

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美日韩五月婷| 在线国产精品中文字幕| 黑人电影影音先锋在线播放| 亚洲av中文在我观看| 亚洲色精品vr一区区三区| 4480yy亚洲午夜私人影院剧情 | 九九在线视频精品播放| 欧美成人黄在线观看| 亚洲欧美日韩高清综合678| 一级一级特黄女人精品毛片视频| 99自拍视频| 99视频在线精品国自产拍| 免费观看日本污污ww网站| 国产本道久久一区二区三区| 成av免费大片黄在线观看 | 99riav国产精品视频| 五月综合网亚洲乱妇久久| 任我爽精品视频在线播放| 亚洲最大av一区二区三区| 日韩AV无码一区二区三不卡| 国产精品自在自线免费观看| 2021年最新久久久视精品爱| 国产麻豆精品久久一二三| 欧美人与禽ZOZO性伦交视频 | 日日躁亚洲精品| 一区二区av在线免费| 性饥渴人妻| 亚洲男人的天堂久久香蕉| 成年黄网站在线观看| 天天摸日日摸狠狠添| 在线中文字幕亚洲日韩2020| 丁香色婷婷国产精品视频| 91青青草原| 国产日产亚洲欧美综合另类| 亚洲人成人无码网WWW电影首页| 尤物yw午夜国产精品视频| 中文字幕?人妻熟女| 久久中文字幕无码专区| 少妇私密会所按摩到高潮呻吟| 久草福利资源| 免费三级网站|