網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

貝葉斯置信傳播神經(jīng)網(wǎng)絡(luò)：原生可解釋的可信類腦框架

2026-05-14 19:00:25　來源: CreateAMind

上海舉報

分享至

貝葉斯置信傳播神經(jīng)網(wǎng)絡(luò)：原生可解釋的可信類腦框架

Native Explainability for Bayesian Confidence Propagation Neural Networks: A Framework for Trusted Brain-Like AI

https://arxiv.org/pdf/2605.11595

摘要

歐盟《人工智能法案》（條例2024/1689）自2026年8月起全面適用于高風險系統(tǒng)，這對同時具備可信賴性、透明性，且能夠在資源受限的邊緣設(shè)備上可行部署的人工智能架構(gòu)產(chǎn)生了迫切需求。基于貝葉斯置信傳播神經(jīng)網(wǎng)絡(luò)（BCPNN）形式構(gòu)建的類腦神經(jīng)網(wǎng)絡(luò)已重新成為反向傳播驅(qū)動的深度學(xué)習(xí)的可信替代方案。它們提供了最先進的無監(jiān)督表示學(xué)習(xí)、對神經(jīng)形態(tài)計算友好的稀疏性，以及針對邊緣部署的現(xiàn)有FPGA實現(xiàn)。盡管有此發(fā)展勢頭，但目前仍缺乏用于解釋BCPNN決策的系統(tǒng)性框架——本文填補了這一空白。我們認為，在Rudin“設(shè)計即解釋”議程的意義上，BCPNN是一種內(nèi)在透明的模型，其架構(gòu)原語可直接映射到既有的可解釋人工智能（XAI）類別。本文作出四項貢獻。首先，我們提出了首個面向BCPNN的XAI分類體系。它將權(quán)重、偏置、超列后驗概率、結(jié)構(gòu)可塑性使用評分、吸引子動力學(xué)以及輸入重構(gòu)群體映射到歸因、原型、概念、反事實及機制解釋模式上。其次，我們引入了十六個架構(gòu)級解釋原語（P1–P16），其中多個在標準人工神經(jīng)網(wǎng)絡(luò)中沒有對應(yīng)物。我們提供了閉式算法，用于從模型已維護的量中計算每一個原語。第三，我們引入了五個設(shè)計時的“配置即解釋”原語（Config-P1至Config-P5），將BCPNN超參數(shù)選擇視為可審計的部署前解釋工件。第四，我們勾勒了將其集成到工業(yè)物聯(lián)網(wǎng)部署中的路線圖，并討論了與歐盟《人工智能法案》的對齊、邊緣可行性以及對工業(yè)5.0的意義。

索引詞——可解釋人工智能，BCPNN，類腦神經(jīng)網(wǎng)絡(luò)，神經(jīng)形態(tài)計算，邊緣AI，歐盟《人工智能法案》，工業(yè)5.0，赫布學(xué)習(xí)，可解釋性，可信賴人工智能

I. 引言

物聯(lián)網(wǎng)（IoT）、人工智能（AI）與信息物理系統(tǒng)的融合正在重塑工業(yè)決策。歐洲工業(yè)5.0范式倡導(dǎo)一種以人為本、可持續(xù)且具有韌性的技術(shù)轉(zhuǎn)型，其中人工智能系統(tǒng)旨在增強而非取代人類專業(yè)知識[1]。這些系統(tǒng)必須在嚴格的能耗預(yù)算下于邊緣端運行，同時滿足日益增長的關(guān)于透明度的監(jiān)管期望。歐盟《人工智能法案》（條例 (EU) 2024/1689）于2024年8月生效。第13條規(guī)定，高風險人工智能系統(tǒng)應(yīng)“以使其運行足夠透明的方式進行設(shè)計與開發(fā)，從而確保部署者能夠解讀系統(tǒng)輸出并予以恰當使用”[2]。該法案將于2026年8月起全面適用于高風險系統(tǒng)。

這一監(jiān)管時間線與兩項技術(shù)趨勢發(fā)生碰撞。一方面，深度學(xué)習(xí)模型已擴展至安全關(guān)鍵領(lǐng)域，同時除最復(fù)雜的事后分析外，它們對所有人而言仍然不透明[3], [4]。另一方面，神經(jīng)形態(tài)計算與類腦計算已成熟為可行的替代方案，其原生實現(xiàn)了稀疏性、局部性與概率推理[5], [6], [7]。在這些方案中，貝葉斯置信傳播神經(jīng)網(wǎng)絡(luò)（BCPNN）[8], [9], [10]脫穎而出。它基于貝葉斯推理，通過局部赫布規(guī)則進行學(xué)習(xí)，通過超列組織的軟勝者通吃（WTA）競爭產(chǎn)生稀疏分布式表示，并在亞瓦級能耗預(yù)算的商業(yè)FPGA上運行[7]。

盡管有此發(fā)展勢頭，目前仍不存在用于解釋BCPNN決策的系統(tǒng)性框架——本文填補了這一空白。

貢獻。我們認為，在Rudin“設(shè)計即解釋”議程[11]的意義上，BCPNN是一種內(nèi)在透明的架構(gòu)。每個權(quán)重均為逐點互信息，每個偏置均為對數(shù)先驗，每個超列輸出均為針對離散屬性的校準后驗概率，而稀疏的斑塊狀連接性則源于由互信息驅(qū)動的結(jié)構(gòu)可塑性規(guī)則。因此，主流的可解釋人工智能（XAI）類別（歸因、原型、概念、反事實、機制）要么開箱即用，要么只需極小的適配即可得到支持。

? 原生XAI分類體系。我們提出了首個面向BCPNN的系統(tǒng)性XAI分類體系，該體系沿近期綜述[3], [12], [13]所確立的（范圍、階段、模型依賴性）軸進行組織。

? 十六個架構(gòu)級原語。我們識別出十六個BCPNN專用的解釋原語（P1–P16），其中多個在標準人工神經(jīng)網(wǎng)絡(luò)中無直接對應(yīng)物。我們提供了閉式算法，用于從模型已維護的量中計算每一個原語。

? 配置即解釋。我們引入了五個設(shè)計時原語（Config-P1至Config-P5），將BCPNN的超參數(shù)選擇視為可審計的部署前解釋工件，從而能夠在訓(xùn)練開始前生成符合歐盟《人工智能法案》第13條的合規(guī)文檔（第五節(jié)）。

? 路線圖。我們勾勒了將其集成至工業(yè)物聯(lián)網(wǎng)部署的路線圖，并包含與歐盟《人工智能法案》的對齊分析及邊緣可行性分析（第六節(jié)）。

本文結(jié)構(gòu)如下。第二節(jié)回顧XAI分類體系與BCPNN形式體系。第三節(jié)呈現(xiàn)所提出的映射。第四節(jié)給出計算各架構(gòu)級原語（P1–P16）的算法。第五節(jié)引入“配置即解釋”原語。第六節(jié)探討監(jiān)管與邊緣部署的影響。第七節(jié)闡明開放性挑戰(zhàn)。第八節(jié)總結(jié)。

II. 背景與相關(guān)工作

A. 可解釋人工智能：類別與分類體系

現(xiàn)代可解釋人工智能（XAI）綜述在組織解釋方法的三個正交軸上達成共識：范圍（局部與全局）、階段（內(nèi)在與事后），以及模型依賴性（特定模型與模型無關(guān)）[3], [4], [12], [13]。在這些軸內(nèi)，五個方法家族在文獻中占據(jù)主導(dǎo)地位。

歸因方法為每個輸入特征分配一個重要性分數(shù)以進行預(yù)測；代表性方法包括SHAP [14]、LIME [15]、積分梯度 [16]、逐層相關(guān)性傳播 [17] 和 DeepLIFT [18]。也已開發(fā)出適配時間序列的歸因方法，結(jié)合LIME和Grad-CAM用于多變量信號[19]。

基于原型的方法通過與學(xué)習(xí)到的范例的相似性來解釋決策；ProtoPNet [20] 引入了“這看起來像那個”范式。

基于概念的方法將預(yù)測建立在人類可解釋的變量上。TCAV [21] 量化沿用戶指定概念方向的敏感性；概念瓶頸模型 [22] 在輸入和輸出之間結(jié)構(gòu)上強制執(zhí)行概念層，并引發(fā)了關(guān)于概念泄漏 [23] 的大量后續(xù)工作。

反事實解釋回答“什么輸入改變會改變決策？”；Wachter等人 [24] 將該方法建立在GDPR第22條的解釋權(quán)基礎(chǔ)上，歐盟《人工智能法案》的第13條進一步強調(diào)了其對高風險決策的相關(guān)性。

機制可解釋性將密集激活分解為稀疏的、單語義的潛在代碼。稀疏自編碼器 [25] 已成為從大型Transformer中檢索可解釋特征的主導(dǎo)工具，但它們計算量大且屬于事后方法。

該文獻中的一個反復(fù)出現(xiàn)的觀察是，對于高風險決策，內(nèi)在的、特定模型的可解釋性優(yōu)于事后的代理模型 [11], [22]。我們將BCPNN堅定地定位在這一陣營。

B. 貝葉斯置信傳播神經(jīng)網(wǎng)絡(luò)

BCPNN起源于Lansner和Ekeberg對貝葉斯-赫布學(xué)習(xí)規(guī)則的推導(dǎo) [8]，并已被逐步擴展以支持吸引子動力學(xué) [9]、生物物理細節(jié) [10]，以及在標準基準測試上具有競爭力的準確性的現(xiàn)代無監(jiān)督表示學(xué)習(xí) [5], [6]。近期在SpiNNaker [26]、FPGA [27], [7] 和嵌入式平臺上的神經(jīng)形態(tài)實現(xiàn)已將BCPNN帶入邊緣部署不再僅僅是理論的領(lǐng)域，在嵌入式FPGA平臺上實現(xiàn)了亞瓦級推理 [7]。

架構(gòu)。 一個BCPNN層被組織為 H 個超列，每個包含 M 個微列。在每個超列內(nèi)，活動通過軟勝者通吃（soft-WTA）競爭進行歸一化，

公式 (2) 將偏置表達為突觸后微列的自信息（驚訝度）[5], [8], [9]。換言之，每個權(quán)重記錄了突觸前和突觸后微列是共激活高于隨機水平（正值）、統(tǒng)計獨立（零值），還是相互回避（負值）。這正是 SHAP 和 LRP 試圖通過昂貴的事后代理過程來估計的量；而 BCPNN 將其作為訓(xùn)練的副作用精確計算出來。

混合架構(gòu)。 為了實現(xiàn)模式補全、知覺競爭和抗失真能力，混合 BCPNN 在隱藏群體（HID）中添加了層內(nèi)循環(huán)連接，并添加了一個反饋群體（INPRC）以從隱藏表示中重構(gòu)輸入 [6]。循環(huán)動力學(xué)實現(xiàn)了基于吸引子的聯(lián)想記憶。

脈沖變體。 一種直接的脈沖翻譯 [6] 用泊松樣本替換了基于速率的激活，并引入了 z-trace（突觸前和突觸后脈沖的短期濾波）和 p-trace（長期概率估計），它們在期望上恢復(fù)了基于速率的學(xué)習(xí)規(guī)則，從而使得在神經(jīng)形態(tài)硬件上的部署成為可能。

C. 相關(guān)架構(gòu)的可解釋性

據(jù)我們所知，尚無已發(fā)表的研究為BCPNN提出系統(tǒng)性的XAI框架。最接近的相關(guān)工作包括：適配于脈沖神經(jīng)網(wǎng)絡(luò)（SNN）的特征歸因方法[28], [29], [30]；概念瓶頸模型[22]，其架構(gòu)模式與BCPNN的超列結(jié)構(gòu)相匹配；以及基于稀疏自編碼器的機制可解釋性[25]，其單語義特征在概念上與BCPNN的微列相呼應(yīng)。近期關(guān)于以用戶為中心的XAI評估研究[31]進一步激勵了針對每個屬性進行因子化解釋的思路。我們從這三條研究路線中汲取靈感，同時充分利用了這樣一個事實：BCPNN的概率語義使得大多數(shù)適配工作變得不必要。

III. BCPNN的可解釋性分類體系

我們現(xiàn)在闡述本文的核心論點：BCPNN的每個架構(gòu)元素同時充當原生解釋原語。表I總結(jié)了該映射關(guān)系；圖1提供了示意圖。

A. 為何BCPNN權(quán)重是解釋而非參數(shù)

在標準人工神經(jīng)網(wǎng)絡(luò)（ANN）中，權(quán)重是一個不透明的標量，其解釋依賴于周圍網(wǎng)絡(luò)的狀態(tài)。在BCPNN中，公式(3)保證每個權(quán)重在構(gòu)造上即為逐點互信息——對于高于隨機水平的共現(xiàn)為正值，對于獨立性為零值，對于負相關(guān)為負值[5]。由于逐點互信息正是SHAP [14]、LRP [17]和TCAV [21]試圖事后估計的量，BCPNN將其作為訓(xùn)練的副作用直接計算出來，并且與作為對數(shù)先驗的偏置(2)相結(jié)合，支持計算可讀作貝葉斯對數(shù)似然更新[11], [24]。

B. 為何超列輸出解決了校準問題

標準ANN可解釋性中的一個持續(xù)問題是，softmax輸出通常并非概率；現(xiàn)代深度網(wǎng)絡(luò)系統(tǒng)性地表現(xiàn)出過度自信。在BCPNN中，公式(1)通過構(gòu)造產(chǎn)生一個校準的離散后驗概率，因為軟勝者通吃（soft-WTA）動力學(xué)在BCPNN生成模型下實現(xiàn)了一個歸一化的似然比檢驗[8], [9]。因此，每個超列報告其自身的每屬性置信度，滿足《人工智能法案》第13條關(guān)于系統(tǒng)傳達“準確度水平”[2]的每屬性基礎(chǔ)要求。

C. 為何結(jié)構(gòu)可塑性是內(nèi)在特征選擇

D. 為何微列是原型

在每個超列內(nèi)部，軟勝者通吃（WTA）競爭（1）確保了通常每個輸入僅由單個微列主導(dǎo)。每個微列在數(shù)據(jù)分布上的激活輪廓——即關(guān)于輸入狀態(tài)的調(diào)諧曲線——表現(xiàn)為一個學(xué)習(xí)到的原型，在無需任何輔助原型損失的情況下，實現(xiàn)了ProtoPNet [20] 的“這看起來像那個”語義。困擾概念瓶頸模型 [22], [23] 的概念泄漏問題被軟勝者通吃量化所抑制：未投射到主導(dǎo)微列的信息將被丟棄。

E. 為何吸引子動力學(xué)揭示了決策路徑

在混合BCPNN中，循環(huán)動力學(xué)讓網(wǎng)絡(luò)狀態(tài)從前饋驅(qū)動的初始估計演化為一個清晰的吸引子，而穿過狀態(tài)空間的軌跡（P8）本身即是一種解釋——一條漫長的振蕩路徑表明存在知覺競爭，而一條短促直接的路徑則表明高置信度。INPRC反饋群體（P9）提供了一個分布內(nèi)生成式反事實——即“網(wǎng)絡(luò)認為輸入應(yīng)該看起來像這樣”——在無需外部生成模型的情況下，滿足了Wachter等人 [24] 提出的反事實解釋要求。

IV.從BCPNN量計算解釋

V.配置即解釋：設(shè)計時的可信賴性

VI.討論：可信賴性、邊緣人工智能、工業(yè) 5.0

A. 與歐盟《人工智能法案》的對齊

歐盟《人工智能法案》第 13 條要求高風險人工智能系統(tǒng)具備足夠的透明度，以便部署者能夠“解讀系統(tǒng)輸出并予以恰當使用”，而第 14 條則要求有效的人類監(jiān)督 [2]。BCPNN 原語直接映射到這些要求上：逐超列校準置信度（P3）支持“準確度水平”條款；結(jié)構(gòu)可塑性圖（P4, P5）支持“能力與局限性”條款；反事實解釋（P9）和決策路徑診斷（P8）支持可爭辯性（contestability）[24]。“配置即解釋”原語進一步提供了部署前的審計追蹤（Config-P1, Config-P2, Config-P4），這是任何事后方法都無法產(chǎn)生的。因此，邊緣端的合規(guī)開銷極小。

B. 邊緣可行性

諸如 SHAP、LIME 和稀疏自編碼器等事后 XAI 流程通常在邊緣端不可行，因為它們需要重復(fù)的前向傳播、代理模型訓(xùn)練或大量的額外內(nèi)存 [14], [15], [25]。我們的框架增加了零運行時成本：每個量已經(jīng)在推理過程中計算完畢。最新的嵌入式 FPGA BCPNN 加速器在嵌入式平臺上實現(xiàn)了亞瓦級推理 [7]，因此我們的框架繼承了相同的能效特性。

C. 工業(yè) 5.0 與以人為本的人工智能

工業(yè) 5.0 強調(diào)人機協(xié)作優(yōu)于自動化 [1]。BCPNN 的超列結(jié)構(gòu)非常適合這一范式：每個超列對應(yīng)一個人類可解釋的屬性，而逐超列的解釋沿著領(lǐng)域?qū)＜铱梢詫徲嫽蚍駴Q的軸對決策進行分解。與單片的特征重要性向量相比，這種分解更緊密地鏡像了專家的推理過程。

D. 應(yīng)用 vignettes（應(yīng)用實例）

金融時間序列。 對于在金融指標上訓(xùn)練的 BCPNN，Config-P1 直接聲明了一個本體——即在看到任何數(shù)據(jù)之前，針對 {波動率, 成交量, 動量, 價差, 情緒} 設(shè)置 H = 5 個超列。訓(xùn)練后，P11（模塊化因子分解）產(chǎn)生逐屬性的對數(shù)證據(jù)（log-evidence）；在一個說明性場景中，波動率超列可能對崩盤類別貢獻 +1.8 nats，而成交量超列貢獻 -0.3 nats。此類因子化解釋是可審計的，并且符合 EBA（歐洲銀行管理局）和 ESMA（歐洲證券和市場管理局）對自動化信貸和市場決策的期望，并且它們能與像 DeepVaR [33] 這樣的風險感知模型自然集成，后者已經(jīng)消耗逐通道的情緒和波動率信號 [19]。向非技術(shù)利益相關(guān)者對話式地傳遞這些解釋已在 HumAIne-Chatbot 部署中得到展示 [34]，而對 resulting workflow（結(jié)果工作流）的以用戶為中心的評估遵循 VirtualXAI [31] 的協(xié)議。

物聯(lián)網(wǎng)傳感與網(wǎng)絡(luò)安全。 對于多模態(tài)傳感器數(shù)據(jù)，結(jié)構(gòu)可塑性圖（P4）揭示了網(wǎng)絡(luò)已學(xué)會依賴哪些傳感器通道，從而支持傳感器剪枝和故障診斷。相同的原語可遷移至網(wǎng)絡(luò)防御監(jiān)控，其中逐通道證據(jù)分解已被證明能提高分析師的信任度和分診時間 [35]。

VII. 開放挑戰(zhàn)與未來工作

四重挑戰(zhàn)仍然存在。

(i) 擴展性與抽象性。 架構(gòu)層面的原語在超列（hypercolumn）數(shù)量上呈線性關(guān)系，但對于深度BCPNN堆棧而言，解釋圖的人類可解釋性——包括P4/P5使用圖和P8吸引子軌跡——可能會下降；需要原則性的抽象層、概念層次結(jié)構(gòu)以及Config-P2效率監(jiān)控，以在規(guī)模化時保持解釋價值。

(ii) 忠實性驗證。 盡管每個原語都是從模型用于推理的量計算得出的，但應(yīng)在完整規(guī)模的BCPNN系統(tǒng)上，與運行生產(chǎn)級BCPNN部署的合作伙伴共同測量形式化的忠實性指標。

(iii) 用戶研究。 解釋質(zhì)量是一個人機交互因素問題 [36]。應(yīng)與臨床和金融領(lǐng)域的領(lǐng)域?qū)＜疫M行對照研究，就決策時間、準確性和信任校準等方面，將每超列解釋與SHAP和LIME進行基準比較。

(iv) 新原語的經(jīng)驗驗證。 原語P12–P16是分析推導(dǎo)得出的，但尚未在完整規(guī)模的BCPNN部署上針對標準基線進行基準測試；與維護大規(guī)模BCPNN系統(tǒng)的合作伙伴進行聯(lián)合驗證是直接的下一步工作。

VIII. 結(jié)論

我們論證了貝葉斯置信傳播神經(jīng)網(wǎng)絡(luò)（Bayesian Confidence Propagation Neural Network, BCPNN）按其構(gòu)造是一種"設(shè)計即可解釋"的模型，其架構(gòu)原語直接對應(yīng)于主流的可解釋人工智能（XAI）家族。我們提出了首個面向BCPNN的XAI分類法，將其結(jié)構(gòu)元素映射到歸因（attribution）、原型（prototype）、概念（concept）、反事實（counterfactual）和機制（mechanistic）等模態(tài)。我們引入了十六個架構(gòu)層面的解釋原語（P1–P16），其中若干在標準人工神經(jīng)網(wǎng)絡(luò)中沒有對應(yīng)物，每個原語均可從網(wǎng)絡(luò)已維護的量以閉式形式（closed form）計算得出。我們進一步引入了五個設(shè)計時的"配置即解釋"原語（Config-P1至Config-P5），將BCPNN的超參數(shù)選擇轉(zhuǎn)化為部署前的審計工件，在訓(xùn)練開始之前即滿足歐盟《人工智能法案》第13條的文檔要求。我們勾勒了將其集成到工業(yè)物聯(lián)網(wǎng)部署中的路線圖，并進行了邊緣可行性分析與工業(yè)5.0對齊分析。綜上所述，這些貢獻為實現(xiàn)同時具備可信賴性、透明性，且在歐盟《人工智能法案》框架下可在邊緣側(cè)可行部署的AI系統(tǒng)提供了一條可信路徑。

原文鏈接：https://arxiv.org/pdf/2605.11595

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.