<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      曲率感知期望自由能:貝葉斯優化采集函數

      0
      分享至

      曲率感知期望自由能:貝葉斯優化采集函數

      Curvature-aware Expected Free Energy as an Acquisition Function for Bayesian Optimization*

      https://arxiv.org/pdf/2603.26339


      摘要

      我們提出一種基于期望自由能的貝葉斯優化采集函數,用于解決聯合學習與優化問題,即同時優化并學習底層函數。我們證明,在特定假設下,期望自由能可簡化為上置信界、下置信界和期望信息增益。我們證明期望自由能對凹函數具有無偏收斂保證。基于這些推導結果,我們為期望自由能引入了一種曲率感知更新律,并通過范德波爾振蕩器的系統辨識問題驗證了其概念。通過嚴格的仿真實驗,我們表明,我們自適應的基于期望自由能的采集函數在最終簡單遺憾值和高斯過程學習誤差方面均優于最先進的采集函數。

      I. 引言
      聯合優化與學習是機器人與控制領域的核心問題,智能體必須同時獲取環境(或現象)的精確地圖并識別高價值區域(例如搜救中人類高密度區域或目標搜索中高檢測概率區域)。快速高效的信息采集可提高精準農業的生產效率,在搜救行動中挽救生命,并助力工業檢測與維護[1]。由于現實世界中的查詢代價高昂,開發能夠以最快速度進行高效查詢以實現聯合優化與學習的方法至關重要。然而,大多數采集函數(AF)旨在實現高效優化,而非精確學習底層函數[2]。我們旨在通過提出一種用于貝葉斯優化(BO)的采集函數來彌合這一差距,該函數利用曲率信息來平衡探索與利用,不僅是為了優化,也是為了學習底層函數[3]。受主動推理[4](關于人腦如何進行推理的前沿計算神經科學理論)的啟發,我們提出期望自由能(EFE)作為一種新的采集函數。我們指出,EFE是一種通用采集函數,其他采集函數如上置信界(UCB)[5]、下置信界(LCB)和期望信息增益(EIG)均可從中推導出來。

      關于黑箱優化的采集函數,BO已有大量文獻[6],包括信息論遺憾界[5]。由于BO對于評估代價高昂的多模態函數優化尤為有用,它已廣泛應用于控制系統中以調整控制器[7]和進行系統辨識[8]。利用梯度信息改進BO的想法也得到了廣泛研究,特別是關于觀測梯度[9][10]和后驗梯度[11]的研究。我們的方法不同于這些方法,因為我們使用高斯過程(GP)后驗的二階梯度來調整探索與利用之間的平衡。近年來,將主動推理思想用于BO的興趣日益增長。最近的一項相關工作通過將基于玻爾茲曼分布的能量函數置于偏好分布上,提出了一種基于主動推理的采集函數[12]。我們的工作不同之處在于,我們特別從高斯偏好先驗出發推導EFE,將其作為一個特例。這條路徑更為簡潔,因為一個簡單的線性化步驟就能直接恢復UCB和LCB,而無需做出不現實的假設[12]。我們進一步通過提出一種曲率感知規則來改進這一EFE,以提升性能。另一項類似工作是[13],它提出了一種基于主動推理的采集函數。他們使用了期望未來的自由能[14]作為目標,而非EFE,這在根本上與我們的公式不同,并且未能揭示UCB與主動推理之間的等價性。我們工作的核心創新在于,在EFE采集函數中利用曲率信息來平衡聯合優化與學習問題中的探索與利用。我們在數學上證明了EFE的駐點與曲率無關。基于這一結果,我們為EFE提出了一種新穎的曲率感知自適應規則,該規則鼓勵在高曲率區域重新采樣,并探索低曲率的不確定區域。本文的核心貢獻包括:i) 證明在特定假設下,EFE可簡化為UCB、LCB和EIG(第III-B節);ii) 證明EFE對凹函數的無偏收斂性(第IV-A節);iii) 引入EFE的曲率感知更新規則(第IV-B節);iv) 展示我們自適應的(曲率感知)EFE在聯合優化與學習方面優于最先進的采集函數(第V節)。

      II 問題陳述


      III. EFE 與其他采集函數

      本節推導 GP 下的 EFE,并證明 UCB 和 LCB 是 EFE 的線性代理。

      A. GP 模型下的 EFE

      我們將未知函數的優化問題視為一個智能體必須通過與環境的交互進行學習以達到目標的問題。探索指的是學習函數(發現其形狀),利用指的是優化。行動由下一個查詢位置的選擇來表示,傳感器觀測值由該查詢位置上的未知函數值表示。我們隱含地假設環境是時不變的,即 f ( x ) 不會因選擇了哪些查詢點而改變。在主動推理中,通過最小化一個 EFE 泛函來找到最優平衡探索與利用的行動 [4]。我們將 GP 上候選查詢位置 x x的單步(短視)EFE 定義為 [15]:






      B. 與已知采集函數的關系

      EFE 是貝葉斯優化采集函數的一個推廣,因為它包含了若干已知的采集函數。下面我們證明這一論斷,并展示導致 LCB、UCB 和 EIG 的具體限制條件。





      因此,在假設 1 和一個簡單的線性化步驟下,當 EFE 的不同項被丟棄時,EFE 可以簡化為 UCB、LCB 和 EIG。表 I 總結了這些結果。我們推測這表明,完整形式的 EFE 是一種具有優越性能的通用采集函數。例如,在不采用假設 1 的情況下,EFE 將考慮完整 GP 上的凈信息增益。在能夠利用問題的子模性的情形下,這可能會帶來 EFE 更優越的性能:由于數據之間的相關性,在一個位置進行查詢可以提供關于地圖中其他位置信息的有用信息。例如,在搜救地圖上找到一個受害者,可以讓智能體了解地圖上其他受害者的位置。
      為簡化起見,本文其余部分將考慮假設 1 下的 EFE。


      IV. EFE 作為采集函數

      在本節中,我們給出 EFE 在局部嚴格凹函數上收斂的充分條件,并提出一種曲率感知的更新規則。

      A. 基于 EFE 的采集函數的收斂性分析

      定理 IV.1(EFE 無偏局部收斂的充分條件)。設 f f具有唯一最大化點 x ? ,并且








      V. 仿真實驗

      本節旨在展示我們提出的自適應 EFE 在聯合學習與優化問題上相較于最先進采集函數的優越性能。我們首先在一個簡單的系統辨識問題上驗證自適應 EFE 的概念,然后在一個高度隨機化的函數空間上,將結果與其他六種基準方法進行對比。

      A. 自適應 EFE 與非自適應 EFE

      本節通過在范德波爾振蕩器上的系統辨識問題,展示了我們提出的自適應 EFE 相較于非自適應 EFE 的優勢。該振蕩器由下式給出:



      B. 學習與優化

      為了評估自適應 EFE 在不同形態函數上的性能,我們在一個由 10 個正弦和余弦分量(具有隨機幅度、頻率和相位)構成的隨機生成的一維目標函數集合上,對所有采集函數進行了基準測試。每個目標函數定義在 [ ? 8 , 8 ] 區間上,并在固定的 400 個網格點上進行評估。在 50 個獨立的目標函數上,所有貝葉斯優化方法都從相同的三個初始設計點開始,并在相同的觀測噪聲
      下運行 50 次迭代。仿真設置的詳細內容見附錄 D。

      性能通過最終 GP 回歸誤差(整個定義域上的均方誤差)和相對于真實全局最大值的簡單遺憾值來報告,從而能夠在異質測試函數上公平比較平均性能和變異性。圖 2 顯示了將自適應 EFE 與基準方法 UCB、期望改進(EI)、改進概率(PI)、VAR(以標準差 σ 為目標)、湯普森采樣(TS)和知識梯度(KG)進行比較的結果。由于 EFE 位于圖的左下角區域,它是用于聯合優化與學習的最佳方法。

      表 II 報告了所有方法在最終均方誤差和最終簡單遺憾值上的均值。EFE 具有最低的簡單遺憾值,并且其 GP 均方誤差接近純探索策略(VAR)。這表明,在高度隨機化的通用一維函數空間中,EFE 在聯合優化與學習問題上優于其他采集函數。



      VI. 結論

      期望自由能(EFE)以一種原理性的方式統一了探索與利用,因此具有成為下一代貝葉斯優化采集函數的強大潛力。受此啟發,我們針對聯合學習與優化問題,提出了一種新穎的曲率感知的 EFE 貝葉斯優化采集函數。我們從數學上證明了 UCB 和 LCB 是 EFE 的線性代理,并且 EFE 對凹函數具有無偏收斂保證。仿真結果表明,與最先進的采集函數相比,EFE 具有很強的競爭力。

      未來的一個自然發展方向是開發可擴展的、類模型預測控制(MPC)風格的多步 EFE 規劃器,沿候選動作序列傳播高斯過程信念,從而實現非短視的查詢選擇,能夠預見未來后驗狀態的完整演變。這類規劃器有望大幅提升信息采集的效率,使智能體能夠高效執行現實世界中的探索、監測和決策任務。

      原文鏈接:https://arxiv.org/pdf/2603.26339

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      電力利潤暴降435%,19個電力業績暴雷,僅14個高增長,別踩雷了

      電力利潤暴降435%,19個電力業績暴雷,僅14個高增長,別踩雷了

      鵬哥投研
      2026-05-18 12:31:31
      黃三、李四是誰?廣州荔灣多部門回應拆遷公告人名和地址質疑:房屋早已滅失,未實際補償

      黃三、李四是誰?廣州荔灣多部門回應拆遷公告人名和地址質疑:房屋早已滅失,未實際補償

      澎湃新聞
      2026-05-18 14:10:27
      夫妻本是同林鳥!但抱歉,這一次郭富城也救不了“作妖”的方媛

      夫妻本是同林鳥!但抱歉,這一次郭富城也救不了“作妖”的方媛

      攬星河的筆記
      2026-05-15 20:11:07
      沉默96小時后,中方準時反擊,戈蘭高地主權已定,以色列必須撤軍

      沉默96小時后,中方準時反擊,戈蘭高地主權已定,以色列必須撤軍

      云舟史策
      2026-05-18 07:23:03
      福建楊梅泡藥水事件持續發酵,浙江商販改口本地楊梅

      福建楊梅泡藥水事件持續發酵,浙江商販改口本地楊梅

      奇思妙想生活家
      2026-05-18 16:27:51
      特朗普公開反對“臺獨”,日本緊跟著表態,對中國的稱呼也變了

      特朗普公開反對“臺獨”,日本緊跟著表態,對中國的稱呼也變了

      阿鼵評論哥
      2026-05-18 12:08:05
      拒絕6000萬年薪 華子硬氣拒簽!主動降薪騰空間,點名死要哈登加盟

      拒絕6000萬年薪 華子硬氣拒簽!主動降薪騰空間,點名死要哈登加盟

      海闊山遙YAO
      2026-05-18 15:33:24
      項羽舉的鼎是千斤鼎,換算成現在的計算單位,一些運動員能做到嗎

      項羽舉的鼎是千斤鼎,換算成現在的計算單位,一些運動員能做到嗎

      抽象派大師
      2026-05-18 00:10:52
      太牛!成都蓉城胸前廣告賣出超1000萬歐:排進意甲前5位

      太牛!成都蓉城胸前廣告賣出超1000萬歐:排進意甲前5位

      邱澤云
      2026-05-18 15:02:52
      福建漳州楊梅泡藥風波持續發酵,無人收購,果農欲哭無淚,被害慘

      福建漳州楊梅泡藥風波持續發酵,無人收購,果農欲哭無淚,被害慘

      魔都姐姐雜談
      2026-05-17 09:52:03
      情緒穩定度最高的三個星座

      情緒穩定度最高的三個星座

      星座不求人
      2026-05-17 21:47:43
      中國焊死了工業化大門?真相很殘酷:不是中國卷,是游戲規則變了

      中國焊死了工業化大門?真相很殘酷:不是中國卷,是游戲規則變了

      奇葩游戲醬
      2026-05-18 15:58:48
      本賽季MVP公布后,最佳一陣也基本出爐,榜單前五,入選實至名歸

      本賽季MVP公布后,最佳一陣也基本出爐,榜單前五,入選實至名歸

      你的籃球頻道
      2026-05-18 14:06:52
      紀委大數據有多厲害?這幾類行為一查一個準,公職人員別再僥幸

      紀委大數據有多厲害?這幾類行為一查一個準,公職人員別再僥幸

      細說職場
      2026-05-18 09:37:45
      姚晨刪除《監獄來的媽媽》宣傳內容,未回應負面爭議,評論區淪陷

      姚晨刪除《監獄來的媽媽》宣傳內容,未回應負面爭議,評論區淪陷

      四斤
      2026-05-18 10:51:37
      正負值+31!哈登騎士第一,米切爾賽后動情發聲,他還承認錯誤

      正負值+31!哈登騎士第一,米切爾賽后動情發聲,他還承認錯誤

      巴叔體育
      2026-05-18 12:01:09
      大手筆,亞歷山大當選MVP后送全隊AP手表+Burberry風衣

      大手筆,亞歷山大當選MVP后送全隊AP手表+Burberry風衣

      懂球帝
      2026-05-18 09:37:54
      原來如此!樊振東決賽兩敗勒布倫兄弟后,國乒長盛不衰原因曝光

      原來如此!樊振東決賽兩敗勒布倫兄弟后,國乒長盛不衰原因曝光

      林雁飛
      2026-05-18 14:20:00
      解放臺灣,難上加難?中國解放臺灣,到底存在哪些困難和阻礙?

      解放臺灣,難上加難?中國解放臺灣,到底存在哪些困難和阻礙?

      靜夜史君
      2026-05-11 23:59:39
      10億都救不了一命!京東副總裁蔡磊,生命進入倒計時

      10億都救不了一命!京東副總裁蔡磊,生命進入倒計時

      聽風喃
      2026-04-06 11:16:04
      2026-05-18 19:56:49
      CreateAMind incentive-icons
      CreateAMind
      CreateAMind.agi.top
      1409文章數 19關注度
      往期回顧 全部

      科技要聞

      同一公司,有人獎金是6年工資,我卻只有半年

      頭條要聞

      585人村莊62人患癌 村民舉報泡花堿工廠4年未得到解決

      頭條要聞

      585人村莊62人患癌 村民舉報泡花堿工廠4年未得到解決

      體育要聞

      41歲,他還想第5次踢世界杯

      娛樂要聞

      票房會破14億!口碑第一電影出現了

      財經要聞

      中國芯片,怎么突然不便宜了?

      汽車要聞

      二排座椅能躺能轉/三排座椅能收納 零跑D99座艙玩法多樣

      態度原創

      房產
      旅游
      健康
      教育
      時尚

      房產要聞

      突發!海口重磅調規!碧桂園要解套;新埠島要起飛了!

      旅游要聞

      以花開,待君來!519?中國旅游日主會場廣州活動明日啟幕

      專家揭秘干細胞回輸的安全風險

      教育要聞

      項目式學習:學生如何從課堂走向生活?

      夏天褲子不用多買,提前準備幾條休閑的闊腿褲,百搭舒適顯瘦

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 777天堂麻豆爱综合视频| 久久久久国产精品电影| 无码人妻系列| 亚洲成a人无码| 国产成人人综合亚洲欧美丁香花 | 亚州无码片| 熟年中出交尾六十路七十路| 久久99精品久久久大学生| 久久av色欲av久久蜜桃网| 欧美色资源站| 91精产国品一二三区| 亚洲精品动漫免费二区| 国产又大又黑又粗免费视频| 日欧一片内射va在线影院| 国产精品人成视频免费国产| 黑人大战日本人妻嗷嗷叫| 色噜噜狠狠狠色综合久| 2020国产欧洲精品网站| 老司机亚洲精品影院| 免费无码av片在线观看中文| 亚洲国产一区二区三区视频在线| 各种姿势玩小处雏女视频| 免费jizz| 精品国产大片中文字幕| 日本一区二区三区四区黄色| 精品无码一区二区三区在线| 常州市| 亚洲不卡1卡2卡三卡2021麻豆| 国产日韩精品欧美一区喷水| 亚洲av永久无码精品漫画| 国产视频最新| av无码免费在线观看| 欧美精品久久96人妻无码| 国产精品视频色尤物yw| 日韩欧美精品| 国产精品国产三级国产试看| 国产乱人伦真实精品视频| 日韩av激情在线| 国产成人啪精品午夜网站| 中文字幕av无码不卡| 好大好硬好爽免费视频|