<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      別再把長文切碎了,HiLight讓AI直接在原文里劃重點

      0
      分享至



      在實際應用中,模型常常會忽略關鍵線索,這就是 “Lost in the Middle” 現象,即模型對出現在輸入中間位置的信息關注度明顯下降。現有的優化思路大致分為兩類:

      • 硬選擇:先檢索或裁剪出相關片段,再送入模型,但可能會丟失對推理至關重要的上下文。
      • 軟選擇:通過摘要或壓縮來縮短輸入,但有損壓縮難免引入失真。

      兩類方法都在 “動” 原始輸入或原始權重。那么,能不能既保留完整的上下文,又能準確地告訴模型 “重點看哪里”?HiLight 提出一條 “輸入側干預” 的新路徑:在原文中插入少量高亮標簽,引導模型的注意力。

      方法概述

      在實際部署當中,大模型往往是API 付費調用、規模巨大,甚至權重不開放的黑盒服務,直接對它做 SFT 或 RL 微調往往不現實。因此,HiLight 選擇了一條更實用的路徑:凍結推理模型,訓練一個輕量的 “助手模型” 來幫助它劃重點。



      • 論文標題:Learning Evidence Highlighting for Frozen LLMs
      • 論文地址:https://arxiv.org/abs/2604.22565
      • 作者:Shaoang Li1,?, Yanhang Shi1,?, Yufei Li2, Mingfu Liang2, Xiaohan Wei2, Yunchen Pu2, Fei Tian2, Chonglin Sun2, Frank Shyu2, Luke Simon2, Sandeep Pandey2, Xi Liu2,?, Jian Li1,?
      • 機構:1 石溪大學(Stony Brook University),2 Meta AI
      • 說明:? 共同第一作者;? 共同通訊作者

      流程如下:

      1. 輕量模型(Emphasis Actor)閱讀完整的上下文,為每個 token 打出重要性分數。

      2. 輕量模型在得分最高的片段兩邊插入高亮標簽,如 < start_important > 和 < end_important>。

      3. 凍結的推理模型(Solver LLM)接收帶標簽的文本,完成推理并輸出結果。



      該訓練過程只用 Solver 的任務獎勵作為反饋信號,不需要任何人工標注的證據。在訓練方式上,因為沒有 token 級別的證據標注,研究者將高亮選擇建模為強化學習問題,用下游任務指標(如 HR@10、EM、F1)作為獎勵信號,通過分組策略梯度來更新 Actor。

      為了防止 Actor “全部高亮” 的偷懶行為,該框架還引入了高亮預算機制:輕量語言模型最多只能標注一定比例的 token,并通過 span 合并策略將零散的 token 級選擇合并為語義連貫的片段。



      實驗表明,HiLight 對預算取值并不敏感。這意味著,在實際部署時無需精細調參,選取一個合理的中間值即可。

      實驗結果

      研究者在四個任務上進行了評測:Amazon-Beauty(序列推薦)、HotpotQA(多跳問答)、SQuAD 2.0(閱讀理解)和 PubMedQA(生物醫學分類)。對比方法涵蓋了當前主流的 prompt optimization 方法,包括 PRL、BFRS、OPRO、DSPy(MIPROv2)和 APE。



      提升幅度最大的是序列推薦(Amazon-Beauty),在其它任務上,雖然提升相對溫和,但依然一致正向。

      高亮>裁剪,保留上下文的優勢

      消融實驗做了一個有趣的對比:把 Actor 選擇的高亮片段單獨裁剪出來喂給 Solver,會怎么樣?



      結果顯示,在 Amazon-Beauty 上,裁剪也能取得不錯的效果。但在 HotpotQA 上出現了相反的情況。因為多跳問答推理需要保留連接性的上下文,裁剪雖然能選出關鍵證據,卻破壞了語義的完整性。而HiLight 在標注重點的同時保留了完整語境。

      一個高亮模型,服務多個大模型

      Actor 學習到的高亮策略具有很強的遷移能力。研究者用 Qwen3-14B 作為 Solver 訓練 Actor,直接將其應用到五個從未見過的 Solver 上。與之相對比的做法是讓目標 Solver 自己先高亮證據再作答。



      結果顯示,HiLight 的 Actor 高亮在五個 Solver 上的效果都明顯優于自我高亮。原因也很簡單,專門訓練的輕量模型,比大模型自己猜 “哪里重要” 更靠譜。HiLight 的 Actor 是通過任務獎勵顯式訓練出來的,知道什么樣的證據能真正提升下游指標。

      沒有人工標注,卻與人工高度重合

      盡管訓練過程中沒有任何 token 級別的證據標注,但Actor 的高亮區域與 HotpotQA 數據集中人工標注的支持事實高度重合,最高達到 0.78 F1。隨著 Actor 規模從 0.6B 增大到 8B,F1 從 0.68 單調上升到 0.78。



      如圖所示,Precision、Recall、F1 三項指標都隨 Actor 規模單調提升,Precision 甚至達到 0.84,說明Actor 高亮的 token 中,絕大多數都是人工判定的關鍵證據。



      上圖展示了一個 HotpotQA 樣本上的 token 級分數分布:藍色曲線是 Actor 打出的重要性分數,紅色陰影區是人工標注的支持事實所在區間。在一個包含 1200 多個 token 的長上下文中,Actor 只在兩個狹窄的區域打出高分,而這兩個區域正是數據集標注的 ground-truth 證據所在。

      低部署成本

      • Solver 端 token 開銷:< 1.01 倍(僅插入少量標簽 token)。
      • Actor 推理延遲:0.6B 模型約 0.05 秒,4B 模型約 0.23 秒(p50),相比 Solver 的 8 至 18 秒可忽略不計。
      • 訓練成本:僅需約 12K 次 Solver 調用,而 PRL 需要 120K 次,APE 需要 60K 次。

      一個直觀案例:序列推薦優化

      在 Amazon-Beauty 的一個典型案例中,模型需要通過給定的用戶歷史購買摘要和一批候選商品,依據用戶下一個可能感興趣的商品,對候選商品進行重排序。Actor 精準地高亮標記了兩個關鍵內容。這兩個信號幫助 Solver 將真實目標商品(一款主打 “Grips Makeup To Last” 的底妝產品)的推薦排序從第 14 名提升到第 5 名,是一個顯著的排序改進。



      與黑盒注意力機制不同,HiLight 直接告訴用戶:模型之所以提升該商品的排名,是因為看到了這兩段高亮文本。這大大提升了模型推薦結果的可信度。

      結語

      HiLight 的思路非常簡單,用一個輕量模型劃重點,讓大模型集中精力推理。這種方式帶來了幾個好處:

      • 性能提升:推薦任務性能提升可達 27%,問答任務也正向提升。
      • 不用改模型:Solver 凍結,API 友好。
      • 可解釋:高亮標簽能夠直接告訴人類 “模型在看哪里”,以及模型決策的依據。
      • 可遷移:一個 Actor 可以服務于多個不同的大模型。
      • 低成本:訓練成本低,額外延遲和推理成本小。

      隨著越來越多系統通過 API 調用大模型,HiLight 提供了一種不必改動 Solver 也能實現性能提升的辦法。

      值得一提的是,本文作者名單與 Meta 的 GR2(Generative Reasoning Re-ranker,arXiv:2602.07774)團隊有相當程度的重疊,HiLight 這套做法很可能在不遠的將來被用進 GR2 這樣的生產級 re-ranking 系統里。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      工黨慘敗,斯塔默何去何從

      工黨慘敗,斯塔默何去何從

      新京報
      2026-05-10 11:01:36
      張本智和父親:請中國人不要罵我兒子,他比你們99%的人都優秀!

      張本智和父親:請中國人不要罵我兒子,他比你們99%的人都優秀!

      拳擊時空
      2026-05-10 07:42:20
      八路軍最慘痛一戰,看完犧牲高級將領名單,主席:取消政委決定權

      八路軍最慘痛一戰,看完犧牲高級將領名單,主席:取消政委決定權

      馬捗在解說
      2026-05-08 14:50:30
      周總理只是讓他去經商,為黨賺取經費,他卻給組織賺回個商業帝國

      周總理只是讓他去經商,為黨賺取經費,他卻給組織賺回個商業帝國

      文史達觀
      2026-04-18 09:29:56
      大廠永遠理解不了梁文鋒

      大廠永遠理解不了梁文鋒

      鳳凰網科技
      2026-05-09 15:41:13
      32GB + 1TB!新機官宣:5月15日,全面開售!

      32GB + 1TB!新機官宣:5月15日,全面開售!

      科技堡壘
      2026-05-11 11:40:47
      央視頂住啊,我們可以不看世界杯:李嘉誠兒子拿下轉播權全網炸鍋

      央視頂住啊,我們可以不看世界杯:李嘉誠兒子拿下轉播權全網炸鍋

      林子說事
      2026-05-10 20:16:21
      隨巴薩奪得西甲冠軍,拉什福德職業生涯首次奪得聯賽冠軍

      隨巴薩奪得西甲冠軍,拉什福德職業生涯首次奪得聯賽冠軍

      懂球帝
      2026-05-11 05:17:17
      左派、右派、左傾、右傾、左翼、右翼有什么區別?

      左派、右派、左傾、右傾、左翼、右翼有什么區別?

      長風文史
      2026-05-07 12:13:11
      養老院院長透露:那些晚年過得舒坦的老人,手里都攥著這兩張“王牌”,子女再孝順都沒用

      養老院院長透露:那些晚年過得舒坦的老人,手里都攥著這兩張“王牌”,子女再孝順都沒用

      心理觀察局
      2026-05-11 08:46:10
      寶媽就兒子割包皮跟寶爸吵了八百回,網友說:割了能更持久?

      寶媽就兒子割包皮跟寶爸吵了八百回,網友說:割了能更持久?

      燈錦年
      2026-05-10 19:22:52
      體育總局人力中心發文,親宣陳若琳新身份,戀情傳聞早真相大白

      體育總局人力中心發文,親宣陳若琳新身份,戀情傳聞早真相大白

      觀察鑒娛
      2026-05-10 10:38:12
      楊子離婚 3個月就和新歡產子,黃圣依17年青春喂了狗,體面盡失

      楊子離婚 3個月就和新歡產子,黃圣依17年青春喂了狗,體面盡失

      橙星文娛
      2026-04-29 10:30:58
      人民日報證實莫言的警告:人真的會被氣死!70%的重病跟情緒有關,這3個致命傷害往往來自3種身邊人!

      人民日報證實莫言的警告:人真的會被氣死!70%的重病跟情緒有關,這3個致命傷害往往來自3種身邊人!

      職場火鍋
      2026-05-06 21:52:40
      消費級芯片上車能讓成本大降!汽車跟手機一樣屬快消品嗎 多位車企大佬發聲

      消費級芯片上車能讓成本大降!汽車跟手機一樣屬快消品嗎 多位車企大佬發聲

      快科技
      2026-05-11 11:38:04
      除夕夜大嫂不準我女兒動筷,我果斷帶娃回娘家,初二老公卻來急電

      除夕夜大嫂不準我女兒動筷,我果斷帶娃回娘家,初二老公卻來急電

      白云故事
      2026-03-02 17:35:07
      明知是飲鴆止渴,唐朝為何非要搞節度使?

      明知是飲鴆止渴,唐朝為何非要搞節度使?

      輿圖司馬
      2026-05-10 21:00:03
      冠軍體質,坎塞洛成為第一個在四大聯賽中奪得聯賽冠軍的球員

      冠軍體質,坎塞洛成為第一個在四大聯賽中奪得聯賽冠軍的球員

      懂球帝
      2026-05-11 05:06:32
      央視三胎宣傳片惹爭議,脫離現實強行把孕婦塑造成超人式幸福?

      央視三胎宣傳片惹爭議,脫離現實強行把孕婦塑造成超人式幸福?

      今朝牛馬
      2026-05-07 20:36:33
      羅斯:我們能把握住機會的話,至少能進九個

      羅斯:我們能把握住機會的話,至少能進九個

      懂球帝
      2026-05-10 22:35:27
      2026-05-11 12:11:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12965文章數 142648關注度
      往期回顧 全部

      科技要聞

      黃仁勛:你們趕上了一代人一次的大機會

      頭條要聞

      特朗普時隔9年再度訪華 今年特朗普還贊嘆中國儀仗隊

      頭條要聞

      特朗普時隔9年再度訪華 今年特朗普還贊嘆中國儀仗隊

      體育要聞

      那個曾讓詹姆斯抱頭的兄弟,40歲從大學畢業了

      娛樂要聞

      謝霆鋒沒想到,王菲靠張藝謀重返巔峰

      財經要聞

      "手搓汽車"曝光:偽造證件、電池以舊代新

      汽車要聞

      全球化成國內車企未來勝負手,誰是出海最強"水手"?

      態度原創

      健康
      教育
      時尚
      公開課
      軍事航空

      干細胞能讓人“返老還童”嗎

      教育要聞

      家長的基本修養是“不拖后腿”

      輕松拿捏又甜又酷的造型,試試這些輕熟穿搭,溫柔有女人味兒

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      伊朗革命衛隊深夜警告

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲精品无码高潮喷水在线| 人人妻人人爽人人澡av| 无码人妻精品一区二区三区蜜臀百度| 国产亚洲sss在线观看| 凹凸国产熟女精品视频| 精品成人中文无码专区| 中文字幕无码视频手机免费看| 日本一区二区三区在线 |观看| 亚洲国产欧美在线人成人| 国产激情文学亚洲区综合| 亚洲欧洲∨国产一区二区三区| 在线污网站| 亚洲人妻一区二区精品| 亚洲中文字幕免费| 一级7777| 99热国产在线精品99| 好姑娘高清影视在线观看| 97资源超碰| 亚洲免费成人小说| 久久久波多野结衣av一区二区| 亚洲成亚洲成网| 国产精品人成在线播放| 国产精品自拍毛片一区| 国产精一品亚洲二区在线播放| 2021亚洲国产精品无码| 国产精品疯狂输出jk草莓视频| 91精品国产一区自在线拍| 国精品无码一区二区三区在线看 | 国产精品无码无需播放器| 中文字幕在线高清| 久久久久久久97| 亚洲线精品一区二区三区八戒| 午夜综合网| 婷婷色综合成人成人网小说 | 四虎海外在线永久免费看| 国产成人精品二三区波多野| 日韩av裸体在线播放| 午夜三级理论在线观看无| 欧美黑巨大videos精品| 亚洲熟妇AV午夜无码不卡| 亚洲综合网一区中文字幕|