<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      ICLR 2026 | LightMem:把大模型「長期記憶」的成本打下來

      0
      分享至



      大模型已經(jīng)很強,但一旦進入 “長對話、跨多輪、多任務(wù)” 的真實智能體交互場景,模型很快就會遇到兩類老問題:

      一是上下文窗口有限,越聊越長時不可避免地 “塞不下”;二是經(jīng)典的 lost in the middle,即使塞得下也未必用得好。

      于是,給大模型配 “外部記憶系統(tǒng)” 尤為重要:把對話寫進長期記憶、需要時再檢索出來。但現(xiàn)實很快給出了代價 —— 記憶系統(tǒng)往往非常貴:頻繁調(diào)用大模型做總結(jié) / 抽取、實時做沖突消解與更新、長鏈路的維護開銷,最終讓 “有記憶的智能體” 在工程上難以承受。

      這篇工作提出 LightMem:一個在 “效果” 和 “效率” 之間更平衡的記憶系統(tǒng)。核心目標很直接:

      在不犧牲準確率的前提下,把 token、API 調(diào)用次數(shù)和運行時延降下來。



      • 論文標題:LightMem: Lightweight and Efficient Memory-Augmented Generation
      • 論文鏈接:https://arxiv.org/abs/2510.18866
      • 代碼鏈接:https://github.com/zjunlp/LightMem

      為什么現(xiàn)有記憶系統(tǒng) “能用但太貴”?

      從主流范式來看,LLM 記憶系統(tǒng)大多是這樣工作的:把原始對話按 turn/session 切分;每一段都讓 LLM 做總結(jié) / 抽取,寫入向量庫 / 知識圖譜;新信息到來時,再讓 LLM 在線做更新 (add/delete/merge/ignore);推理時檢索相關(guān)記憶拼到 prompt 里回答。



      問題在于,不管是 user 側(cè)還是 assistant 側(cè),真實對話場景中含有非常多的冗余信息:寒暄、重復確認、冗余解釋等等。現(xiàn)有系統(tǒng)往往 照單全收,導致:

      1) 冗余信息直接進入管線:token 消耗飆升,而且可能反而干擾 in-context learning;

      2) 切分粒度僵硬:按 turn 太細會導致總結(jié)調(diào)用爆炸,按 session 太粗又容易主題混雜,最后總結(jié)不準;

      3) 在線更新太重:更新與遺忘在 test time 強綁定,長任務(wù)延遲高,而且 LLM 還可能在更新時 “誤刪” 信息。

      LightMem 的出發(fā)點是:人類記憶并不是 “所有信息都進長期記憶”,而是有一套高效的分層機制:

      感官記憶先過濾 → 短時記憶組織整合 → 長時記憶在睡眠時離線鞏固。

      LightMem 的核心思路:三段式 “類人記憶” 管線

      LightMem 把記憶系統(tǒng)拆成三個輕量模塊 (對應(yīng)如下的 Light1/Light2/Light3):

      Light1:感官記憶 (Sensory Memory)

      目標:快速過濾無用信息、把輸入壓縮到 “值得記” 的部分,并進行主題切分。

      Light2:短時記憶 (Short-Term Memory, STM)

      目標:按主題把對話組織成結(jié)構(gòu)化單元,降低總結(jié)調(diào)用次數(shù),同時減少主題混雜。

      Light3:長時記憶 (Long-Term Memory, LTM)+ 睡眠更新 (Sleep-time Update)

      目標:把昂貴的記憶更新從在線推理中 “拿出來”,在離線并行地做去重、合并、修復與鞏固。



      Light1:感官記憶 —— 先壓縮,再切主題

      輕量壓縮:把冗余 token 在系統(tǒng)輸入端過濾掉

      LightMem 使用一個輕量壓縮模型 (論文默認采用 LLMLingua-2) 對原始輸入做預壓縮:

      保留信息量更高、語義更關(guān)鍵的 token,把大量冗余 token 提前過濾掉并擋在 pipeline 之外。

      論文實驗也驗證:在合理壓縮率下 (50% 到 80%),LLM 依然能理解壓縮后的上下文,準確率基本不受影響。

      混合主題切分:避免 “按窗口切” 的粗暴做法

      僅靠固定窗口 (turn/session) 很難適配開放對話。LightMem 做了一個混合切分策略:

      • 用注意力信號找到候選 topic 邊界 (局部峰值);
      • 再用相鄰片段的語義相似度做二次確認;
      • 取二者交集作為最終切分點,降低 attention sink、注意力稀釋等噪聲影響。

      Light2:主題感知 STM—— 用 “內(nèi)容邊界” 替代 “窗口邊界”

      在拿到 topic segments 后,LightMem 把它們以 {topic, turns} 的結(jié)構(gòu)送入 STM buffer。

      當 buffer 達到 token 閾值時,才觸發(fā)一次 LLM 總結(jié),對每個 topic 生成更結(jié)構(gòu)化的 summary,并寫入 LTM。

      相比 “每一輪都總結(jié)一次”,這種做法直接帶來兩點收益:

      • 調(diào)用次數(shù)降低:總結(jié)不再是 N 次,而是按 buffer 觸發(fā)的更少次數(shù);
      • 總結(jié)更準確:輸入被 topic 約束,不容易 “把 A 主題的細節(jié)總結(jié)進 B 主題里”。

      論文的消融實驗也顯示:去掉 topic segmentation 會帶來明顯準確率下降 (GPT/Qwen 都一致)。

      Light3:睡眠更新 —— 把開銷最高的部分從在線推理中剝離

      記憶系統(tǒng)最貴、也最容易出錯的一步,往往是 “更新 / 遺忘”。

      現(xiàn)有系統(tǒng)經(jīng)常在 test time 做 hard update:合并、刪改、沖突消解都在線執(zhí)行,延遲高且風險大。

      LightMem 的策略是 “兩段式更新”:

      在線只做 Soft Update:先寫入,不糾結(jié)

      測試時新記憶條目到來,LightMem 直接插入 LTM (帶時間戳),不做復雜更新。

      這極大降低了在線延遲,并避免 LLM 在實時更新中誤判沖突導致信息丟失。

      離線做 Parallel Update:每條記憶維護 “可更新隊列”

      離線階段 (sleep time) 觸發(fā)更新:

      對每個條目構(gòu)建一個 update queue (只允許 “新的更新舊的”,即時間戳約束 tj ≥ ti),然后把這些更新操作并行執(zhí)行。

      并行化的關(guān)鍵好處是:

      傳統(tǒng)在線更新存在順序依賴 (讀寫約束) 導致串行累計延遲;而 LightMem 把更新拆成多個獨立隊列,可以離線并行,整體更快。

      結(jié)果:不僅更準,而且便宜很多

      論文在兩個長記憶基準上驗證了 LightMem 的效果與效率:

      • LongMemEval (LongMemEval-S)
      • LoCoMo

      并在不同 backbone 上測試:GPT-4o-mini 、 Qwen3-30B-A3B、GLM4.6。





      整體結(jié)論非常清晰:LightMem 在準確率上超過基線,同時把成本打下來。

      論文報告的代表性結(jié)果包括:

      • 在 LongMemEval 上,LightMem 相比強基線準確率最高提升約 7.7% / 29.3% (不同設(shè)置與 backbone);
      • 總 token 消耗降低最高可達 38× / 20.9×,API 調(diào)用次數(shù)降低最高可達 30× / 55.5×;
      • 如果只看在線 test-time 成本,節(jié)省幅度更夸張:token 最高 106× / 117×,API 調(diào)用最高 159× / 310×。

      LightMem 是一套面向真實長交互場景的 “輕量記憶系統(tǒng)” 答案:

      它不追求讓記憶機制越來越復雜,而是用更接近人類記憶分工的方式,把冗余擋在入口,把維護放到離線,把代價控制在可部署的范圍內(nèi)。

      如果你正在做長對話助手、長期在線 agent、或者任何需要 “記憶但又怕貴” 的系統(tǒng),這篇工作值得細讀。

      我們將 LightMem 的方法論與工程經(jīng)驗沉淀到 OpenMem 社區(qū) ,推動記憶機制的開放共建與演進。

      OpenMem 旨在共建一個 AI 記憶科學探索與產(chǎn)業(yè)實踐的全球協(xié)作社區(qū),讓記憶成為 AI 的新 computer layer,促進 Memory Engineering 開源開放,成為 “記憶研究者的家” 與 “記憶技術(shù)的標準化基地”,支撐企業(yè)級學術(shù)級開發(fā)者級的記憶應(yīng)用生態(tài)。

      作者簡介

      方繼展,浙江大學人工智能碩士在讀,師從張寧豫副教授。研究方向為 Continual Learning、LLM/Agent Memory 與大模型知識編輯,聚焦記憶系統(tǒng)、自進化 Agent 與模型可控更新。以第一/共一作者身份在 ICLR、ACL、ACM MM等國際頂級會議發(fā)表/接收多篇論文。提出并開源面向 Agent 的輕量化長期記憶框架 LightMem,獲得較高社區(qū)關(guān)注(GitHub 600+ Star),受到MIT technology review邀請專訪,并收到國內(nèi)多家投資機構(gòu)/大模型廠商的創(chuàng)業(yè)交流邀請。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      特朗普:如果伊朗在波斯灣 或霍爾木茲海峽附近向美國船只開火 將被“從地球表面抹去”

      特朗普:如果伊朗在波斯灣 或霍爾木茲海峽附近向美國船只開火 將被“從地球表面抹去”

      每日經(jīng)濟新聞
      2026-05-05 09:25:33
      普京簽署法令將長城汽車工廠投資合同延長至2034年

      普京簽署法令將長城汽車工廠投資合同延長至2034年

      俄羅斯衛(wèi)星通訊社
      2026-05-04 15:09:10
      零緩沖,全國一刀切!從6月1日起,車主自己去車管所“橫著走”!

      零緩沖,全國一刀切!從6月1日起,車主自己去車管所“橫著走”!

      夜深愛雜談
      2026-05-05 10:14:28
      FIFA徹底急了!原來除了央視,還有這么多國家不給世界杯買單了!

      FIFA徹底急了!原來除了央視,還有這么多國家不給世界杯買單了!

      小娛樂悠悠
      2026-05-05 10:36:39
      被打臉?顏丙濤曾表示:趙心童是頂級高手,吳宜澤只能算是高手

      被打臉?顏丙濤曾表示:趙心童是頂級高手,吳宜澤只能算是高手

      風過鄉(xiāng)
      2026-05-05 07:30:04
      公然拒掛國旗,訂單全給日韓,長榮如今的結(jié)局早已注定

      公然拒掛國旗,訂單全給日韓,長榮如今的結(jié)局早已注定

      素玉姑娘
      2026-05-04 16:03:12
      中東徹底炸了,伊朗突襲阿聯(lián)酋導致巨輪大爆炸,美軍參戰(zhàn)擊沉快艇

      中東徹底炸了,伊朗突襲阿聯(lián)酋導致巨輪大爆炸,美軍參戰(zhàn)擊沉快艇

      春風笑語
      2026-05-05 10:56:00
      中美放下電話,不到24小時,聯(lián)合國傳來重要消息,中方身份變了

      中美放下電話,不到24小時,聯(lián)合國傳來重要消息,中方身份變了

      健身狂人
      2026-05-04 20:03:17
      為何只有中國人打仗講究戰(zhàn)術(shù),而外國靠正面硬剛?其實道理很簡單

      為何只有中國人打仗講究戰(zhàn)術(shù),而外國靠正面硬剛?其實道理很簡單

      掠影后有感
      2026-05-05 08:47:11
      馬克龍時代將畫上句號,梅朗雄宣布競選法國總統(tǒng),對華態(tài)度已曝光

      馬克龍時代將畫上句號,梅朗雄宣布競選法國總統(tǒng),對華態(tài)度已曝光

      達文西看世界
      2026-05-05 09:47:35
      游客拍巴塘公廁臟亂被工作人員圍堵,兩次報警脫身,官方通報致歉

      游客拍巴塘公廁臟亂被工作人員圍堵,兩次報警脫身,官方通報致歉

      阿豐聊娛
      2026-05-04 20:33:57
      廣東一上門女婿被老丈人趕出去后,帶著妻兒在橋洞下住了一個月

      廣東一上門女婿被老丈人趕出去后,帶著妻兒在橋洞下住了一個月

      阿天愛旅行
      2026-05-05 11:11:16
      五一最堵10大景點出爐!網(wǎng)友:第1名堵到懷疑人生,第5名直接勸退

      五一最堵10大景點出爐!網(wǎng)友:第1名堵到懷疑人生,第5名直接勸退

      奇思妙想草葉君
      2026-05-02 16:12:40
      瘋狂3-3!補時絕平,曼城意外翻車,爭冠形勢惡化,落后阿森納5分

      瘋狂3-3!補時絕平,曼城意外翻車,爭冠形勢惡化,落后阿森納5分

      足球狗說
      2026-05-05 05:00:42
      美出新高度,Lisa亮相2026年MetGala

      美出新高度,Lisa亮相2026年MetGala

      無情有思可
      2026-05-05 11:44:20
      范冰冰遠東電影節(jié)奪獎,身穿越南設(shè)計師高定驚艷全場

      范冰冰遠東電影節(jié)奪獎,身穿越南設(shè)計師高定驚艷全場

      緬甸中文網(wǎng)
      2026-05-03 15:25:26
      日本部署消耗性超廉價紙板無人機:售價2000美元 可在5到10分鐘內(nèi)組裝完成

      日本部署消耗性超廉價紙板無人機:售價2000美元 可在5到10分鐘內(nèi)組裝完成

      快科技
      2026-05-05 10:29:05
      公安部提醒:換身份證后別急著走!這3個關(guān)鍵步驟多數(shù)人忽略

      公安部提醒:換身份證后別急著走!這3個關(guān)鍵步驟多數(shù)人忽略

      老特有話說
      2026-05-04 16:04:22
      隨著馬刺失絕殺,尼克斯大勝39分,NBA季后賽最新排名出爐!

      隨著馬刺失絕殺,尼克斯大勝39分,NBA季后賽最新排名出爐!

      薇說體育
      2026-05-05 13:52:18
      首個00后斯諾克世錦賽冠軍,吳宜澤:我的父母才是真正的冠軍;其父親曾關(guān)停經(jīng)營多年店鋪,賣掉全家唯一住房、打多份零工培養(yǎng)兒子

      首個00后斯諾克世錦賽冠軍,吳宜澤:我的父母才是真正的冠軍;其父親曾關(guān)停經(jīng)營多年店鋪,賣掉全家唯一住房、打多份零工培養(yǎng)兒子

      極目新聞
      2026-05-05 09:25:55
      2026-05-05 14:12:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      12908文章數(shù) 142642關(guān)注度
      往期回顧 全部

      科技要聞

      OpenAI/Anthropic同日被曝拉攏華爾街建合資公司

      頭條要聞

      吳宜澤18-17奪冠:1家3口"兵分兩路"10年 已押上一切

      頭條要聞

      吳宜澤18-17奪冠:1家3口"兵分兩路"10年 已押上一切

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      英皇25周年演唱會 張敬軒被救護車拉走

      財經(jīng)要聞

      五一假期,中國年輕人的“首爾病”犯了

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態(tài)度原創(chuàng)

      本地
      房產(chǎn)
      數(shù)碼
      游戲
      公開課

      本地新聞

      用青花瓷的方式,打開西溪濕地

      房產(chǎn)要聞

      五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

      數(shù)碼要聞

      蘋果正考慮與英特爾和三星合作 為其生產(chǎn)主要設(shè)備芯片

      索尼大招藏不住了!PS6自研幀生成技術(shù)曝光

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 国产福利91精品一区二区| 国产乱理伦片在线观看| 久久久久亚洲AV无码专区网站| 三级免费观看| 一本色道婷婷久久欧美| 国产午夜成人久久无码一区二区| 无码 人妻 在线 视频| 国产精品第| 手机看片日韩永久福利盒子| 亚州少妇无套内射激情视频| 蜜臀av久久国产午夜福利软件| 亚洲欧洲精品国产二码| www.啪啪白浆| 狠狠亚洲丁香综合久久| 亚洲精品美女久久久久网站| 国产又黄又湿又刺激网站| 网友偷拍视频一区二区三区| 日韩精品一二区在线视频 | 狠狠躁夜夜躁人人爽天天天天| 亚洲一精品一区二区三区| 69久蜜桃人妻无码精品一区| 黄色精品996| 中国又粗又大又爽的毛片| 熟妇啊轻点灬大JI巴太粗| 国产精品免费中文字幕| 永久免费AV无码网站YY| 亚洲第一无码AV无码专区| 国产一区av在线| 亚洲福利精品一区二区三区| 国产美女69视频免费观看| 人妻伦理在线一二三区| 亚洲精品久久久久玩吗| 黄色三级小说| 极品少妇伦理一区二区| 亚洲av成人在线一区| 日韩AV导航| 国产精品无码av天天爽| 中文字幕中文字幕一区二区| 中国精品久久精品三级| 狠狠?亚洲?一区| 综合久久av一区二区三区|