貝葉斯置信傳播神經(jīng)網(wǎng)絡(luò):原生可解釋的可信類腦框架
Native Explainability for Bayesian Confidence Propagation Neural Networks: A Framework for Trusted Brain-Like AI
https://arxiv.org/pdf/2605.11595
![]()
![]()
![]()
摘要
歐盟《人工智能法案》(條例2024/1689)自2026年8月起全面適用于高風險系統(tǒng),這對同時具備可信賴性、透明性,且能夠在資源受限的邊緣設(shè)備上可行部署的人工智能架構(gòu)產(chǎn)生了迫切需求。基于貝葉斯置信傳播神經(jīng)網(wǎng)絡(luò)(BCPNN)形式構(gòu)建的類腦神經(jīng)網(wǎng)絡(luò)已重新成為反向傳播驅(qū)動的深度學(xué)習(xí)的可信替代方案。它們提供了最先進的無監(jiān)督表示學(xué)習(xí)、對神經(jīng)形態(tài)計算友好的稀疏性,以及針對邊緣部署的現(xiàn)有FPGA實現(xiàn)。盡管有此發(fā)展勢頭,但目前仍缺乏用于解釋BCPNN決策的系統(tǒng)性框架——本文填補了這一空白。我們認為,在Rudin“設(shè)計即解釋”議程的意義上,BCPNN是一種內(nèi)在透明的模型,其架構(gòu)原語可直接映射到既有的可解釋人工智能(XAI)類別。本文作出四項貢獻。首先,我們提出了首個面向BCPNN的XAI分類體系。它將權(quán)重、偏置、超列后驗概率、結(jié)構(gòu)可塑性使用評分、吸引子動力學(xué)以及輸入重構(gòu)群體映射到歸因、原型、概念、反事實及機制解釋模式上。其次,我們引入了十六個架構(gòu)級解釋原語(P1–P16),其中多個在標準人工神經(jīng)網(wǎng)絡(luò)中沒有對應(yīng)物。我們提供了閉式算法,用于從模型已維護的量中計算每一個原語。第三,我們引入了五個設(shè)計時的“配置即解釋”原語(Config-P1至Config-P5),將BCPNN超參數(shù)選擇視為可審計的部署前解釋工件。第四,我們勾勒了將其集成到工業(yè)物聯(lián)網(wǎng)部署中的路線圖,并討論了與歐盟《人工智能法案》的對齊、邊緣可行性以及對工業(yè)5.0的意義。
索引詞——可解釋人工智能,BCPNN,類腦神經(jīng)網(wǎng)絡(luò),神經(jīng)形態(tài)計算,邊緣AI,歐盟《人工智能法案》,工業(yè)5.0,赫布學(xué)習(xí),可解釋性,可信賴人工智能
I. 引言
物聯(lián)網(wǎng)(IoT)、人工智能(AI)與信息物理系統(tǒng)的融合正在重塑工業(yè)決策。歐洲工業(yè)5.0范式倡導(dǎo)一種以人為本、可持續(xù)且具有韌性的技術(shù)轉(zhuǎn)型,其中人工智能系統(tǒng)旨在增強而非取代人類專業(yè)知識[1]。這些系統(tǒng)必須在嚴格的能耗預(yù)算下于邊緣端運行,同時滿足日益增長的關(guān)于透明度的監(jiān)管期望。歐盟《人工智能法案》(條例 (EU) 2024/1689)于2024年8月生效。第13條規(guī)定,高風險人工智能系統(tǒng)應(yīng)“以使其運行足夠透明的方式進行設(shè)計與開發(fā),從而確保部署者能夠解讀系統(tǒng)輸出并予以恰當使用”[2]。該法案將于2026年8月起全面適用于高風險系統(tǒng)。
這一監(jiān)管時間線與兩項技術(shù)趨勢發(fā)生碰撞。一方面,深度學(xué)習(xí)模型已擴展至安全關(guān)鍵領(lǐng)域,同時除最復(fù)雜的事后分析外,它們對所有人而言仍然不透明[3], [4]。另一方面,神經(jīng)形態(tài)計算與類腦計算已成熟為可行的替代方案,其原生實現(xiàn)了稀疏性、局部性與概率推理[5], [6], [7]。在這些方案中,貝葉斯置信傳播神經(jīng)網(wǎng)絡(luò)(BCPNN)[8], [9], [10]脫穎而出。它基于貝葉斯推理,通過局部赫布規(guī)則進行學(xué)習(xí),通過超列組織的軟勝者通吃(WTA)競爭產(chǎn)生稀疏分布式表示,并在亞瓦級能耗預(yù)算的商業(yè)FPGA上運行[7]。
盡管有此發(fā)展勢頭,目前仍不存在用于解釋BCPNN決策的系統(tǒng)性框架——本文填補了這一空白。
貢獻。我們認為,在Rudin“設(shè)計即解釋”議程[11]的意義上,BCPNN是一種內(nèi)在透明的架構(gòu)。每個權(quán)重均為逐點互信息,每個偏置均為對數(shù)先驗,每個超列輸出均為針對離散屬性的校準后驗概率,而稀疏的斑塊狀連接性則源于由互信息驅(qū)動的結(jié)構(gòu)可塑性規(guī)則。因此,主流的可解釋人工智能(XAI)類別(歸因、原型、概念、反事實、機制)要么開箱即用,要么只需極小的適配即可得到支持。
? 原生XAI分類體系。我們提出了首個面向BCPNN的系統(tǒng)性XAI分類體系,該體系沿近期綜述[3], [12], [13]所確立的(范圍、階段、模型依賴性)軸進行組織。
? 十六個架構(gòu)級原語。我們識別出十六個BCPNN專用的解釋原語(P1–P16),其中多個在標準人工神經(jīng)網(wǎng)絡(luò)中無直接對應(yīng)物。我們提供了閉式算法,用于從模型已維護的量中計算每一個原語。
? 配置即解釋。我們引入了五個設(shè)計時原語(Config-P1至Config-P5),將BCPNN的超參數(shù)選擇視為可審計的部署前解釋工件,從而能夠在訓(xùn)練開始前生成符合歐盟《人工智能法案》第13條的合規(guī)文檔(第五節(jié))。
? 路線圖。我們勾勒了將其集成至工業(yè)物聯(lián)網(wǎng)部署的路線圖,并包含與歐盟《人工智能法案》的對齊分析及邊緣可行性分析(第六節(jié))。
本文結(jié)構(gòu)如下。第二節(jié)回顧XAI分類體系與BCPNN形式體系。第三節(jié)呈現(xiàn)所提出的映射。第四節(jié)給出計算各架構(gòu)級原語(P1–P16)的算法。第五節(jié)引入“配置即解釋”原語。第六節(jié)探討監(jiān)管與邊緣部署的影響。第七節(jié)闡明開放性挑戰(zhàn)。第八節(jié)總結(jié)。
II. 背景與相關(guān)工作
A. 可解釋人工智能:類別與分類體系
現(xiàn)代可解釋人工智能(XAI)綜述在組織解釋方法的三個正交軸上達成共識:范圍(局部與全局)、階段(內(nèi)在與事后),以及模型依賴性(特定模型與模型無關(guān))[3], [4], [12], [13]。在這些軸內(nèi),五個方法家族在文獻中占據(jù)主導(dǎo)地位。
歸因方法為每個輸入特征分配一個重要性分數(shù)以進行預(yù)測;代表性方法包括SHAP [14]、LIME [15]、積分梯度 [16]、逐層相關(guān)性傳播 [17] 和 DeepLIFT [18]。也已開發(fā)出適配時間序列的歸因方法,結(jié)合LIME和Grad-CAM用于多變量信號[19]。
基于原型的方法通過與學(xué)習(xí)到的范例的相似性來解釋決策;ProtoPNet [20] 引入了“這看起來像那個”范式。
基于概念的方法將預(yù)測建立在人類可解釋的變量上。TCAV [21] 量化沿用戶指定概念方向的敏感性;概念瓶頸模型 [22] 在輸入和輸出之間結(jié)構(gòu)上強制執(zhí)行概念層,并引發(fā)了關(guān)于概念泄漏 [23] 的大量后續(xù)工作。
反事實解釋回答“什么輸入改變會改變決策?”;Wachter等人 [24] 將該方法建立在GDPR第22條的解釋權(quán)基礎(chǔ)上,歐盟《人工智能法案》的第13條進一步強調(diào)了其對高風險決策的相關(guān)性。
機制可解釋性將密集激活分解為稀疏的、單語義的潛在代碼。稀疏自編碼器 [25] 已成為從大型Transformer中檢索可解釋特征的主導(dǎo)工具,但它們計算量大且屬于事后方法。
該文獻中的一個反復(fù)出現(xiàn)的觀察是,對于高風險決策,內(nèi)在的、特定模型的可解釋性優(yōu)于事后的代理模型 [11], [22]。我們將BCPNN堅定地定位在這一陣營。
B. 貝葉斯置信傳播神經(jīng)網(wǎng)絡(luò)
BCPNN起源于Lansner和Ekeberg對貝葉斯-赫布學(xué)習(xí)規(guī)則的推導(dǎo) [8],并已被逐步擴展以支持吸引子動力學(xué) [9]、生物物理細節(jié) [10],以及在標準基準測試上具有競爭力的準確性的現(xiàn)代無監(jiān)督表示學(xué)習(xí) [5], [6]。近期在SpiNNaker [26]、FPGA [27], [7] 和嵌入式平臺上的神經(jīng)形態(tài)實現(xiàn)已將BCPNN帶入邊緣部署不再僅僅是理論的領(lǐng)域,在嵌入式FPGA平臺上實現(xiàn)了亞瓦級推理 [7]。
架構(gòu)。 一個BCPNN層被組織為 H 個超列,每個包含 M 個微列。在每個超列內(nèi),活動通過軟勝者通吃(soft-WTA)競爭進行歸一化,
![]()
![]()
![]()
公式 (2) 將偏置表達為突觸后微列的自信息(驚訝度)[5], [8], [9]。換言之,每個權(quán)重記錄了突觸前和突觸后微列是共激活高于隨機水平(正值)、統(tǒng)計獨立(零值),還是相互回避(負值)。這正是 SHAP 和 LRP 試圖通過昂貴的事后代理過程來估計的量;而 BCPNN 將其作為訓(xùn)練的副作用精確計算出來。
![]()
![]()
![]()
混合架構(gòu)。 為了實現(xiàn)模式補全、知覺競爭和抗失真能力,混合 BCPNN 在隱藏群體(HID)中添加了層內(nèi)循環(huán)連接,并添加了一個反饋群體(INPRC)以從隱藏表示中重構(gòu)輸入 [6]。循環(huán)動力學(xué)實現(xiàn)了基于吸引子的聯(lián)想記憶。
脈沖變體。 一種直接的脈沖翻譯 [6] 用泊松樣本替換了基于速率的激活,并引入了 z-trace(突觸前和突觸后脈沖的短期濾波)和 p-trace(長期概率估計),它們在期望上恢復(fù)了基于速率的學(xué)習(xí)規(guī)則,從而使得在神經(jīng)形態(tài)硬件上的部署成為可能。
C. 相關(guān)架構(gòu)的可解釋性
據(jù)我們所知,尚無已發(fā)表的研究為BCPNN提出系統(tǒng)性的XAI框架。最接近的相關(guān)工作包括:適配于脈沖神經(jīng)網(wǎng)絡(luò)(SNN)的特征歸因方法[28], [29], [30];概念瓶頸模型[22],其架構(gòu)模式與BCPNN的超列結(jié)構(gòu)相匹配;以及基于稀疏自編碼器的機制可解釋性[25],其單語義特征在概念上與BCPNN的微列相呼應(yīng)。近期關(guān)于以用戶為中心的XAI評估研究[31]進一步激勵了針對每個屬性進行因子化解釋的思路。我們從這三條研究路線中汲取靈感,同時充分利用了這樣一個事實:BCPNN的概率語義使得大多數(shù)適配工作變得不必要。
III. BCPNN的可解釋性分類體系
我們現(xiàn)在闡述本文的核心論點:BCPNN的每個架構(gòu)元素同時充當原生解釋原語。表I總結(jié)了該映射關(guān)系;圖1提供了示意圖。
![]()
A. 為何BCPNN權(quán)重是解釋而非參數(shù)
在標準人工神經(jīng)網(wǎng)絡(luò)(ANN)中,權(quán)重是一個不透明的標量,其解釋依賴于周圍網(wǎng)絡(luò)的狀態(tài)。在BCPNN中,公式(3)保證每個權(quán)重在構(gòu)造上即為逐點互信息——對于高于隨機水平的共現(xiàn)為正值,對于獨立性為零值,對于負相關(guān)為負值[5]。由于逐點互信息正是SHAP [14]、LRP [17]和TCAV [21]試圖事后估計的量,BCPNN將其作為訓(xùn)練的副作用直接計算出來,并且與作為對數(shù)先驗的偏置(2)相結(jié)合,支持計算可讀作貝葉斯對數(shù)似然更新[11], [24]。
B. 為何超列輸出解決了校準問題
標準ANN可解釋性中的一個持續(xù)問題是,softmax輸出通常并非概率;現(xiàn)代深度網(wǎng)絡(luò)系統(tǒng)性地表現(xiàn)出過度自信。在BCPNN中,公式(1)通過構(gòu)造產(chǎn)生一個校準的離散后驗概率,因為軟勝者通吃(soft-WTA)動力學(xué)在BCPNN生成模型下實現(xiàn)了一個歸一化的似然比檢驗[8], [9]。因此,每個超列報告其自身的每屬性置信度,滿足《人工智能法案》第13條關(guān)于系統(tǒng)傳達“準確度水平”[2]的每屬性基礎(chǔ)要求。
C. 為何結(jié)構(gòu)可塑性是內(nèi)在特征選擇
![]()
D. 為何微列是原型
在每個超列內(nèi)部,軟勝者通吃(WTA)競爭(1)確保了通常每個輸入僅由單個微列主導(dǎo)。每個微列在數(shù)據(jù)分布上的激活輪廓——即關(guān)于輸入狀態(tài)的調(diào)諧曲線——表現(xiàn)為一個學(xué)習(xí)到的原型,在無需任何輔助原型損失的情況下,實現(xiàn)了ProtoPNet [20] 的“這看起來像那個”語義。困擾概念瓶頸模型 [22], [23] 的概念泄漏問題被軟勝者通吃量化所抑制:未投射到主導(dǎo)微列的信息將被丟棄。
E. 為何吸引子動力學(xué)揭示了決策路徑
在混合BCPNN中,循環(huán)動力學(xué)讓網(wǎng)絡(luò)狀態(tài)從前饋驅(qū)動的初始估計演化為一個清晰的吸引子,而穿過狀態(tài)空間的軌跡(P8)本身即是一種解釋——一條漫長的振蕩路徑表明存在知覺競爭,而一條短促直接的路徑則表明高置信度。INPRC反饋群體(P9)提供了一個分布內(nèi)生成式反事實——即“網(wǎng)絡(luò)認為輸入應(yīng)該看起來像這樣”——在無需外部生成模型的情況下,滿足了Wachter等人 [24] 提出的反事實解釋要求。
IV.從BCPNN量計算解釋
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
V.配置即解釋:設(shè)計時的可信賴性
![]()
![]()
![]()
![]()
VI.討論:可信賴性、邊緣人工智能、工業(yè) 5.0
A. 與歐盟《人工智能法案》的對齊
歐盟《人工智能法案》第 13 條要求高風險人工智能系統(tǒng)具備足夠的透明度,以便部署者能夠“解讀系統(tǒng)輸出并予以恰當使用”,而第 14 條則要求有效的人類監(jiān)督 [2]。BCPNN 原語直接映射到這些要求上:逐超列校準置信度(P3)支持“準確度水平”條款;結(jié)構(gòu)可塑性圖(P4, P5)支持“能力與局限性”條款;反事實解釋(P9)和決策路徑診斷(P8)支持可爭辯性(contestability)[24]。“配置即解釋”原語進一步提供了部署前的審計追蹤(Config-P1, Config-P2, Config-P4),這是任何事后方法都無法產(chǎn)生的。因此,邊緣端的合規(guī)開銷極小。
B. 邊緣可行性
諸如 SHAP、LIME 和稀疏自編碼器等事后 XAI 流程通常在邊緣端不可行,因為它們需要重復(fù)的前向傳播、代理模型訓(xùn)練或大量的額外內(nèi)存 [14], [15], [25]。我們的框架增加了零運行時成本:每個量已經(jīng)在推理過程中計算完畢。最新的嵌入式 FPGA BCPNN 加速器在嵌入式平臺上實現(xiàn)了亞瓦級推理 [7],因此我們的框架繼承了相同的能效特性。
C. 工業(yè) 5.0 與以人為本的人工智能
工業(yè) 5.0 強調(diào)人機協(xié)作優(yōu)于自動化 [1]。BCPNN 的超列結(jié)構(gòu)非常適合這一范式:每個超列對應(yīng)一個人類可解釋的屬性,而逐超列的解釋沿著領(lǐng)域?qū)<铱梢詫徲嫽蚍駴Q的軸對決策進行分解。與單片的特征重要性向量相比,這種分解更緊密地鏡像了專家的推理過程。
D. 應(yīng)用 vignettes(應(yīng)用實例)
金融時間序列。 對于在金融指標上訓(xùn)練的 BCPNN,Config-P1 直接聲明了一個本體——即在看到任何數(shù)據(jù)之前,針對 {波動率, 成交量, 動量, 價差, 情緒} 設(shè)置 H = 5 個超列。訓(xùn)練后,P11(模塊化因子分解)產(chǎn)生逐屬性的對數(shù)證據(jù)(log-evidence);在一個說明性場景中,波動率超列可能對崩盤類別貢獻 +1.8 nats,而成交量超列貢獻 -0.3 nats。此類因子化解釋是可審計的,并且符合 EBA(歐洲銀行管理局)和 ESMA(歐洲證券和市場管理局)對自動化信貸和市場決策的期望,并且它們能與像 DeepVaR [33] 這樣的風險感知模型自然集成,后者已經(jīng)消耗逐通道的情緒和波動率信號 [19]。向非技術(shù)利益相關(guān)者對話式地傳遞這些解釋已在 HumAIne-Chatbot 部署中得到展示 [34],而對 resulting workflow(結(jié)果工作流)的以用戶為中心的評估遵循 VirtualXAI [31] 的協(xié)議。
物聯(lián)網(wǎng)傳感與網(wǎng)絡(luò)安全。 對于多模態(tài)傳感器數(shù)據(jù),結(jié)構(gòu)可塑性圖(P4)揭示了網(wǎng)絡(luò)已學(xué)會依賴哪些傳感器通道,從而支持傳感器剪枝和故障診斷。相同的原語可遷移至網(wǎng)絡(luò)防御監(jiān)控,其中逐通道證據(jù)分解已被證明能提高分析師的信任度和分診時間 [35]。
![]()
VII. 開放挑戰(zhàn)與未來工作
四重挑戰(zhàn)仍然存在。
(i) 擴展性與抽象性。 架構(gòu)層面的原語在超列(hypercolumn)數(shù)量上呈線性關(guān)系,但對于深度BCPNN堆棧而言,解釋圖的人類可解釋性——包括P4/P5使用圖和P8吸引子軌跡——可能會下降;需要原則性的抽象層、概念層次結(jié)構(gòu)以及Config-P2效率監(jiān)控,以在規(guī)模化時保持解釋價值。
(ii) 忠實性驗證。 盡管每個原語都是從模型用于推理的量計算得出的,但應(yīng)在完整規(guī)模的BCPNN系統(tǒng)上,與運行生產(chǎn)級BCPNN部署的合作伙伴共同測量形式化的忠實性指標。
(iii) 用戶研究。 解釋質(zhì)量是一個人機交互因素問題 [36]。應(yīng)與臨床和金融領(lǐng)域的領(lǐng)域?qū)<疫M行對照研究,就決策時間、準確性和信任校準等方面,將每超列解釋與SHAP和LIME進行基準比較。
(iv) 新原語的經(jīng)驗驗證。 原語P12–P16是分析推導(dǎo)得出的,但尚未在完整規(guī)模的BCPNN部署上針對標準基線進行基準測試;與維護大規(guī)模BCPNN系統(tǒng)的合作伙伴進行聯(lián)合驗證是直接的下一步工作。
VIII. 結(jié)論
我們論證了貝葉斯置信傳播神經(jīng)網(wǎng)絡(luò)(Bayesian Confidence Propagation Neural Network, BCPNN)按其構(gòu)造是一種"設(shè)計即可解釋"的模型,其架構(gòu)原語直接對應(yīng)于主流的可解釋人工智能(XAI)家族。我們提出了首個面向BCPNN的XAI分類法,將其結(jié)構(gòu)元素映射到歸因(attribution)、原型(prototype)、概念(concept)、反事實(counterfactual)和機制(mechanistic)等模態(tài)。我們引入了十六個架構(gòu)層面的解釋原語(P1–P16),其中若干在標準人工神經(jīng)網(wǎng)絡(luò)中沒有對應(yīng)物,每個原語均可從網(wǎng)絡(luò)已維護的量以閉式形式(closed form)計算得出。我們進一步引入了五個設(shè)計時的"配置即解釋"原語(Config-P1至Config-P5),將BCPNN的超參數(shù)選擇轉(zhuǎn)化為部署前的審計工件,在訓(xùn)練開始之前即滿足歐盟《人工智能法案》第13條的文檔要求。我們勾勒了將其集成到工業(yè)物聯(lián)網(wǎng)部署中的路線圖,并進行了邊緣可行性分析與工業(yè)5.0對齊分析。綜上所述,這些貢獻為實現(xiàn)同時具備可信賴性、透明性,且在歐盟《人工智能法案》框架下可在邊緣側(cè)可行部署的AI系統(tǒng)提供了一條可信路徑。
原文鏈接:https://arxiv.org/pdf/2605.11595
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.