<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      AAAI 2026 Oral|InfiGUI-G1模型來了,刷新GUI Grounding SOTA

      0
      分享至



      隨著多模態大語言模型(MLLM)的飛速發展,能夠像人類一樣通過視覺輸入操作圖形用戶界面(GUI)的智能體(Agent)正逐漸成為現實。然而,在通往通用計算機控制的道路上,如何讓模型精準地將自然語言指令對應到屏幕上的具體元素 —— 即 GUI Grounding 任務,依然是一大難題。

      現有的方法,特別是基于驗證獎勵的強化學習(RLVR),雖然在提升 “指得準”(空間對齊)方面表現出色,卻往往在 “指得對”(語義對齊)上遭遇瓶頸。模型常常陷入 “自信陷阱”,在復雜的語義場景下無法通過有效探索找到正確的功能圖標。

      針對這一痛點,來自浙江大學、香港理工大學及 InfiX.ai 的研究團隊提出了一種全新的自適應探索策略優化框架(AEPO),并推出了InfiGUI-G1系列模型。該模型通過多答案生成與自適應獎勵機制,徹底打破了傳統 RLVR 的探索瓶頸。僅憑 3B 和 7B 的參數量,InfiGUI-G1 便在多個高難度 GUI 基準測試中刷新了 SOTA,部分指標甚至大幅超越了閉源模型。

      本文將深入介紹這項被 AAAI 2026 接收為 Oral 的工作,解讀其如何通過 “學會探索” 來實現更精準的 GUI 語義理解。



      • 論文標題:InfiGUI-G1: Advancing GUI Grounding with Adaptive Exploration Policy Optimization
      • 論文鏈接:https://arxiv.org/abs/2508.05731
      • 代碼鏈接:https://github.com/InfiXAI/InfiGUI-G1

      從 “空間對齊” 到 “語義對齊”:被忽視的探索瓶頸

      GUI Grounding 任務的核心是將自然語言指令(如 “打開相機”)映射到屏幕上的特定元素坐標。研究團隊指出,這一任務可以解構為兩個正交的維度:

      1. 空間對齊(Spatial Alignment):能否精確地定位到元素(即 “指得準”)。

      2. 語義對齊(Semantic Alignment):能否識別出功能正確的元素(即 “指得對”)。

      現有的 RLVR 方法(如 Naive RLVR)雖然能通過優化坐標生成來提升定位精度,但在面對語義模糊或復雜的指令時卻顯得力不從心。

      例如,當指令是 “使用相機搜索物體” 時,屏幕上可能同時存在普通的 “相機應用” 和具有視覺搜索功能的 “Google Lens”。缺乏深度語義理解的模型往往會自信地死磕 “相機應用” 圖標。由于傳統 RL 依賴當前策略采樣,模型會不斷重復這個高置信度的錯誤,陷入“自信陷阱”(Confidence Trap),從而無法發現真正正確的 “Google Lens” 圖標,導致無法獲得修正語義誤解所需的學習信號。



      GUI Grounding 的主要失敗模式: (a) 空間對齊失敗,(b) 語義對齊失敗

      InfiGUI-G1:自適應探索策略優化(AEPO)

      為了解決這一探索效率低下的問題,InfiGUI-G1 引入了AEPO(Adaptive Exploration Policy Optimization)框架。與傳統的單次回答生成不同,AEPO 旨在通過更廣泛且高效的探索來捕捉低概率但正確的選項。

      AEPO 框架由三個協同工作的核心組件構成:

      1.多答案生成機制(Multi-Answer Generation)傳統的 RL 方法通常只采樣一個動作,一旦模型 “固執己見” 地選錯,梯度的學習信號就會消失。AEPO 強制模型在一次前向傳遞中生成 N 個候選坐標點。這一機制迫使模型跳出單一的高置信度預測,去探索策略分布長尾中的可能性,從而大幅增加了發現正確答案(如上述例子中的 Google Lens)的概率。

      2.自適應探索獎勵(Adaptive Exploration Reward, AER)僅僅生成多個答案是不夠的,如何評價這些答案的質量至關重要。研究團隊基于效率第一性原理(效率 = 效用 / 成本)設計了 AER 函數。

      • 動態激勵:如果模型在靠前的排名(Rank k)就找到了正確答案,給予高額獎勵;如果失敗,則給予較小的懲罰以鼓勵繼續探索。
      • 這種非線性的獎勵設計在失敗時鼓勵模型 “廣撒網”,在成功時引導模型追求 “快準狠”,實現了探索與利用的動態平衡。

      3.共線懲罰(Collinear Penalty)為了防止模型通過生成近似直線的點來 “作弊”(簡單的線性掃描策略),研究引入了共線懲罰。如果生成的多個候選點在幾何上近似共線,將被視為低質量探索并受到嚴厲懲罰。這強制模型在語義空間而非單純的幾何空間中進行多樣化探索。



      AEPO 與 Naive 強化學習基準方法的對比

      實驗結果:小參數量實現性能越級

      研究團隊在 MMBench-GUI、ScreenSpot-Pro、UI-Vision 等五個極具挑戰性的基準上對 InfiGUI-G1(3B 和 7B 版本)進行了全面評估。

      1.綜合性能全面領先:在 MMBench-GUI 基準測試中,InfiGUI-G1-7B 在 Windows、iOS、Android 等多個平臺上的表現均刷新了開源模型的最佳成績。值得注意的是,InfiGUI-G1-7B 在部分指標上甚至優于參數量大得多的 Qwen2.5-VL-72B 和閉源模型 GPT-4o。

      2.攻克高難度語義理解任務ScreenSpot-Pro 基準專門區分了文本類(Text)和圖標類(Icon)任務。結果顯示,InfiGUI-G1 在更依賴語義理解的 “圖標” 任務上提升尤為明顯。這直接證明了 AEPO 策略有效解決了語義對齊的瓶頸,讓模型真正 “看懂” 了抽象圖標背后的功能含義,而不僅僅是進行簡單的文本匹配。

      3.讓 “不可學習” 變得 “可學習”為了驗證 AEPO 是否真的解決了探索難題,研究團隊將樣本按難度分為簡單、中等和困難。實驗發現,InfiGUI-G1 在 “困難” 樣本(即基座模型幾乎無法答對的樣本)上的提升最為巨大,相對 Naive RLVR 基線提升了超過60%。這意味著 AEPO 成功挖掘出了那些以往因缺乏探索而被模型 “放棄” 的長尾知識。



      ScreenSpot-Pro 基準測試的性能對比

      總結與展望

      InfiGUI-G1 的成功表明,GUI 智能體的性能瓶頸不僅僅在于視覺識別能力,更在于如何通過有效的強化學習策略來解決語義對齊問題。通過引入自適應探索機制,InfiGUI-G1 以極高的數據效率和較小的模型規模,實現了超越大模型的 GUI Grounding 能力。這項工作為未來開發更通用、更智能的 GUI 交互助手提供了堅實的技術基礎。

      目前,InfiGUI-G1 的代碼、模型權重及相關資源已在 GitHub 開源,歡迎社區進一步研究與使用。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      “鄉下父母全是這樣被騙的”,中職女孩穿廉價警服,過來人說實話

      “鄉下父母全是這樣被騙的”,中職女孩穿廉價警服,過來人說實話

      澤澤先生
      2026-05-08 18:29:22
      美軍剛射戰斧,不到24小時,解放軍直接回擊,亮出南海最硬底牌

      美軍剛射戰斧,不到24小時,解放軍直接回擊,亮出南海最硬底牌

      云上烏托邦
      2026-05-09 14:53:05
      19歲戀老渣男同居7年,46歲臉腫發福似蔡明

      19歲戀老渣男同居7年,46歲臉腫發福似蔡明

      楓塵余往逝
      2026-05-09 13:43:55
      這是迄今為止,見過身材最美的女人之一,不接受反駁

      這是迄今為止,見過身材最美的女人之一,不接受反駁

      阿廢冷眼觀察所
      2026-05-10 03:30:01
      巨爽啊啊啊啊啊啊啊啊啊!!!黏糊糊熱醒的夜晚,是時候和這條A類深睡被鎖死了

      巨爽啊啊啊啊啊啊啊啊啊!!!黏糊糊熱醒的夜晚,是時候和這條A類深睡被鎖死了

      英國報姐
      2026-05-08 21:15:35
      深圳最大造富潮

      深圳最大造富潮

      投資界
      2026-05-09 15:28:05
      大快人心!中國民航新規出爐:日本航空過境中國好日子即將到頭!

      大快人心!中國民航新規出爐:日本航空過境中國好日子即將到頭!

      影像溫度
      2026-05-09 10:27:26
      白嫖190元榴蓮升級!女子被刑拘后又迎三大噩耗,恐將變刑事審判

      白嫖190元榴蓮升級!女子被刑拘后又迎三大噩耗,恐將變刑事審判

      糖逗在娛樂
      2026-05-09 18:12:30
      德國出局后,邱黨不忍了!炮轟國際乒聯:這樣的賽制,意義何在?

      德國出局后,邱黨不忍了!炮轟國際乒聯:這樣的賽制,意義何在?

      十點街球體育
      2026-05-09 15:57:44
      阿斯:阿韋洛亞開了上任以來最艱難的發布會,他一度眼含淚水

      阿斯:阿韋洛亞開了上任以來最艱難的發布會,他一度眼含淚水

      懂球帝
      2026-05-09 21:38:55
      3-0!3-0!中國隊徹底爆發,決賽名單曝光,王皓再出奇招日本危險了

      3-0!3-0!中國隊徹底爆發,決賽名單曝光,王皓再出奇招日本危險了

      曹說體育
      2026-05-09 10:48:29
      美媒終于意識到,中國人既不期待特朗普訪華,也不把美國放在眼里

      美媒終于意識到,中國人既不期待特朗普訪華,也不把美國放在眼里

      小影的娛樂
      2026-05-10 04:45:37
      馬龍為男團半決賽開球!張本智和3-1林昀儒,日本隊率先打進決賽

      馬龍為男團半決賽開球!張本智和3-1林昀儒,日本隊率先打進決賽

      乒談
      2026-05-10 01:46:26
      克里斯遭棄!山東28分慘敗,陶漢林流淚,鞏曉彬看得準:一語道破

      克里斯遭棄!山東28分慘敗,陶漢林流淚,鞏曉彬看得準:一語道破

      話體壇
      2026-05-09 22:11:12
      申花球迷意難平!不止因為2-2憾平銅梁龍,更多在于以下這五點!

      申花球迷意難平!不止因為2-2憾平銅梁龍,更多在于以下這五點!

      田先生籃球
      2026-05-09 22:11:34
      虎父無犬女!曹德旺女兒罕見現身,不與哥哥爭家產,不是美國國籍

      虎父無犬女!曹德旺女兒罕見現身,不與哥哥爭家產,不是美國國籍

      白面書誏
      2026-05-09 14:49:29
      記者:卡塞米羅缺陣意味著無法觸發續約條款,但他已放棄條款

      記者:卡塞米羅缺陣意味著無法觸發續約條款,但他已放棄條款

      懂球帝
      2026-05-09 21:07:05
      50歲趙薇臉頰凹陷滄桑得認不出!今低調和網友合影,再無往日明媚

      50歲趙薇臉頰凹陷滄桑得認不出!今低調和網友合影,再無往日明媚

      丹妮觀
      2026-05-09 12:48:06
      卡魯索夫妻近照,8100萬超值,2次奪冠,超模妻子顏值高身材好

      卡魯索夫妻近照,8100萬超值,2次奪冠,超模妻子顏值高身材好

      大西體育
      2026-05-09 21:39:25
      章子怡沒想到,清空賬號、劃清界限的森林北,揭開汪峰僅剩的體面

      章子怡沒想到,清空賬號、劃清界限的森林北,揭開汪峰僅剩的體面

      好賢觀史記
      2026-05-08 15:53:17
      2026-05-10 07:32:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12957文章數 142646關注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協議

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      體育要聞

      成立128年后,這支升班馬首奪頂級聯賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認不出!

      財經要聞

      多地號召,公職人員帶頭繳納物業費

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      旅游
      藝術
      親子
      健康
      軍事航空

      旅游要聞

      行走多彩貴州 感知活力中國

      藝術要聞

      陽光,此刻醉美

      親子要聞

      剪給媽媽看的視頻,當然全部都是愛

      干細胞能讓人“返老還童”嗎

      軍事要聞

      美伊突然再次交火 伊朗外長:戰爭準備程度是1000%

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品美女一区二区三| 日本熟妇浓毛hdsex| 亚洲无码天堂| 法国白嫩大屁股xxxx| 爽到高潮漏水大喷视频软件| 天堂在线精品亚洲综合网| 88XV日韩| 亚洲人成在线精品| 99re6免费精品视频播放| 精品国产乱码久久久人妻| 国产亚洲精品AA片在线播放天| 2022最新国产在线不卡a| 噜噜噜动态图超猛烈| 国产午夜成人久久无码一区二区| 国产精品亚洲综合第一页| 亚洲人成影网站~色| 国产稚嫩高中生呻吟激情在线视频| 亚洲精品中文字幕二区| 亚洲中文无码线在线观看| 成年午夜精品久久精品| 国产精品青青青在线观看| 亚洲精品一区二区三区片| 四虎av| 人妻白浆-ThePorn| 无码一区二区波多野结衣播放搜索| 377P欧洲日本亚洲大胆| 94人妻少妇偷人精品| 性色综合网| 亚洲AV永久青草无码性色av| 特黄 做受又硬又粗又大视频| 国产午夜福利av在线麻豆| 日韩精品久久久中文字幕人妻 | 欧美va| 久久鸭综合久久国产| 日本人妻中文字幕乱码系列| 国产亚洲精品成人aa片新蒲金| 欧美中文字幕精品人妻| 国产二级一片内射视频插放| 亚洲AV无码专区国产乱码电影| 色成人亚洲| 97精品亚成在人线免视频|