上智院、復旦等提出CLEAR-HUG框架實現(xiàn)診斷性能與可解釋性雙突破

2026-01-16 14:20:26　來源: ScienceAI

河北舉報

分享至

作者團隊丨上海科學智能研究院、復旦大學團隊

編輯丨ScienceAI

在心血管疾病診斷中，心電圖（Electrocardiogram, ECG）是無可替代的基礎工具，其中 12 導聯(lián)心電圖是臨床使用的金標準。作為觀察心臟電活動的“視角”，導聯(lián)是由一正一負兩個電極構成的一個記錄電路，12 導聯(lián)心電圖即是通過體表 10 個電極組合構建出 12 個獨特的電信號“視角”，同步捕捉心臟的電活動，形成一套多維度的波形圖譜。

然而，面對海量的心電圖數(shù)據(jù)，現(xiàn)有基于自監(jiān)督學習的分析方法盡管提供了無需大規(guī)模標注數(shù)據(jù)的解決方案，其局限仍非常明顯：它們往往未能充分建模心臟傳導過程中細微的個體心搏差異，也缺乏與臨床“從心搏到導聯(lián)，再從導聯(lián)到整體”的遞進診斷邏輯相對齊的推理結構，導致在復雜病例診斷中表現(xiàn)受限。

為此，上海科學智能研究院（下稱上智院）與復旦大學聯(lián)合提出了 CLEAR-HUG 雙階段框架。該框架從心電圖信號的生理本質(zhì)出發(fā)，在預訓練階段顯式建模心臟傳導特征，并在診斷階段緊密貼合臨床判讀的層級思維，實現(xiàn)了從信號表征到診斷推理的全流程優(yōu)化。實驗表明，該方法在六個權威公開數(shù)據(jù)集上平均性能提升達 6.84%，為開發(fā)高性能、可解釋的 AI 輔助心電圖診斷工具開辟了新路徑。

論文鏈接：https://arxiv.org/pdf/2512.24002

該研究成果已被 AAAI 2026 接收。研究項目由星河啟智科學智能開放平臺和復旦大學 CFFF 智算平臺提供技術和算力支持。

星河啟智平臺鏈接：https://aistudio.ai4s.com.cn

現(xiàn)有方法的兩大局限

既往的心電圖自監(jiān)督學習（electrocardiogram self-supervised learning, eSSL）方法雖取得一定進展，但存在兩個面向臨床的關鍵短板：

一是忽視個體差異。

現(xiàn)有方法學會了看“大概”和“通常”，卻難以識別那些“例外”與“異常”，而后者往往是臨床診斷中更需要關注的信號。具體來說，現(xiàn)有方法主要讓模型學習心電圖信號中重復出現(xiàn)和普遍存在的模式——比如不同導聯(lián)之間波形的同步性，或連續(xù)心搏間的形態(tài)相似性，卻忽略了一個生理事實：每個心搏的傳導路徑存在自然的細微差異，而不同導聯(lián)觀察的解剖角度也本就不同。這些細節(jié)往往承載著重要的生理與病理信息，例如，一個偶發(fā)的、形態(tài)異常的室性早搏，在標準心電圖中看起來就“很不合群”，但這恰恰是臨床診斷需要捕捉的關鍵線索。

二是脫離臨床邏輯。

為確保診斷的精確性和全面性，心電圖臨床診斷通常遵循“心搏→單導聯(lián)→多導聯(lián)組合”的層級流程：醫(yī)生首先觀察單個心搏的形態(tài)細節(jié)，判斷其是否異常；然后在一個特定的導聯(lián)上，分析連續(xù)心搏的節(jié)律和模式，確認異常是否持續(xù)存在；最后，綜合所有 12 個導聯(lián)的信息，像拼圖一樣將不同導聯(lián)的發(fā)現(xiàn)進行組合與空間對應，從而精確定位心臟的病變部位并做出最終診斷。但是，現(xiàn)有模型在下游任務中常忽視這一遞進式診斷邏輯，導致特征提取與診斷需求脫節(jié)。

為解決這些問題，研究團隊從心臟傳導機制和臨床診斷規(guī)范雙重視角出發(fā)，構建了 CLEAR-HUG 框架，實現(xiàn)從信號表征到診斷推理的全流程優(yōu)化。該框架與人類專家的知識體系對齊，使得醫(yī)生不僅能夠獲知“診斷結果是什么”，更能理解“模型為何做出該診斷”，從而推動心電圖AI分析更加可解釋。

圖示：心臟傳導機制。

CLEAR-HUG 的雙階段創(chuàng)新設計

CLEAR-HUG 框架包含預訓練和微調(diào)兩個階段，分別對應特征學習與診斷適配，形成完整的技術閉環(huán)。

第一階段，團隊設計了名為“傳導-導聯(lián)重構器”（Conduction-LEAdReconstructor, CLEAR）的自監(jiān)督模型，該模型能同時捕捉心跳的特異性變異與普遍共性。通過將每個心搏視為獨特實體，該模型采用簡潔高效的稀疏注意力機制，在排除其他心搏干擾的情況下重構信號。

第二階段，團隊構建了“分層導聯(lián)統(tǒng)一分組頭”（Hierarchical lead-UnifiedGroup head, HUG頭）診斷模塊，模擬臨床診斷流程。

圖示：雙階段訓練

1.CLEAR 預訓練，捕捉傳導級細微特征

預訓練階段的核心是 CLEAR 模型，通過傳導引導和視角引導的雙重信息學習，精準重建心電圖信號：

雙重視角建模：將心電圖信號分解為傳導引導信息（同一心搏在各導聯(lián)的時間同步特征）和視角引導信息（同一導聯(lián)的空間異質(zhì)性特征），全面捕捉信號本質(zhì)。
稀疏注意力機制：設計專屬注意力掩碼，確保心搏重建僅依賴對應的心搏傳導信息和導聯(lián)全局上下文，避免其他心搏干擾，高效提取特異性特征。
掩碼重建訓練：采用 80% 的高掩碼率，通過重建被掩蓋的心搏 token，迫使模型學習深層生理特征而非表面模式，提升表征魯棒性。

2.HUG 微調(diào) ，模擬臨床診斷流程

微調(diào)階段引入 HUG 頭，完全貼合臨床心電圖診斷的層級邏輯：

導聯(lián)分組：按臨床標準將 12 導聯(lián)分為 3 組（雙極肢體導聯(lián)、加壓單極肢體導聯(lián)、胸前導聯(lián)），每組通過獨立線性層學習特征并平均。
成對組合：將三組特征進行兩兩組合，進一步捕捉導聯(lián)間的互補信息。
全局聚合：整合所有組合特征，形成完整的多導聯(lián)全局表征，作為最終診斷依據(jù)。

這種層級設計不僅提升了模型的可解釋性，更讓特征提取過程與醫(yī)生診斷思維高度一致，實現(xiàn)從數(shù)據(jù)驅(qū)動到臨床驅(qū)動的轉(zhuǎn)變。

在六大數(shù)據(jù)集上超越現(xiàn)有最優(yōu)方法

本研究在 MIMIC-IV-ECG 數(shù)據(jù)集上完成預訓練后，于 PTB-XL、CPSC2018 及 CSN 三個公開數(shù)據(jù)集的六個下游任務上進行了系統(tǒng)評估，結果全面超越了現(xiàn)有最優(yōu)方法（SOTA）。

具體而言，模型在平均性能上較當前 SOTA 提升了 6.84%，其中 CLEAR 單模型在預訓練階段貢獻了 3.94% 的提升，而加入 HUG 診斷頭后性能得到進一步改善，充分驗證了雙階段設計的有效性。在低數(shù)據(jù)場景下，該方法展現(xiàn)出卓越的少樣本遷移能力，例如，在僅使用 1% 訓練數(shù)據(jù)的 PTBXL-Rhythm 任務中，CLEAR-HUG 較 SOTA 提升超 17%。

同時，在細粒度疾病分類任務上，層級分組策略的價值尤為凸顯——在 CSN 數(shù)據(jù)集的 38 類疾病分類中，使用 1%、10% 與 100% 訓練數(shù)據(jù)時，HUG 頭相較基礎模型分別帶來 9.21%、5.81% 與 3.18% 的性能增益。

此外，該方法在關鍵特性上也表現(xiàn)出顯著優(yōu)勢。其一，模型具有更強的穩(wěn)健性，即使在部分導聯(lián)缺失、僅保留兩個核心導聯(lián)的極端情況下，其性能仍優(yōu)于現(xiàn)有 SOTA，能夠很好地適應臨床中數(shù)據(jù)不完整的實際場景。其二，模型展現(xiàn)出高度的臨床適配性，通過激活可視化，HUG 頭對不同疾病所激活的導聯(lián)組合模式，與臨床診斷標準高度一致，顯著提升了模型的可解釋性。

核心模塊的必要性驗證

為驗證 CLEAR-HUG 框架中各核心組件的貢獻，本研究進行了系統(tǒng)的消融實驗。該方法遵循控制變量原則，通過逐步移除或調(diào)整模型中的特定設計，量化評估每個創(chuàng)新模塊的實際價值。主要實驗結果與發(fā)現(xiàn)如下：

傳導建模的有效性驗證：對比基礎掩碼自編碼器，CLEAR 預訓練通過傳導引導稀疏注意力，在心律分析任務中提升 17.4%，證明了傳導機制建模的重要性。

層級診斷結構的作用分析：移除 HUG 頭后，模型在細分類任務中性能明顯下降，驗證了層級分組策略對復雜疾病診斷的關鍵作用。

預訓練掩碼策略的優(yōu)化驗證：不同掩碼率實驗表明，80% 的掩碼率能平衡特征學習深度與訓練穩(wěn)定性，是最優(yōu)選擇。

這些實驗從多個維度證實，CLEAR 與 HUG 兩個核心模塊均不可或缺，其設計共同支撐了模型在各項任務中的性能提升。

總結與展望

CLEAR-HUG 的成功，并不依賴于復雜的模型架構，而是根植于對醫(yī)學本質(zhì)的深刻洞察與巧妙融合。

首先，模型從生理機制出發(fā)，緊扣心臟傳導這一心電信號的核心生成原理，使特征學習過程更貼合生理本質(zhì)。其次，通過將模型流程與醫(yī)生診斷邏輯深度對齊，在提升性能的同時也顯著增強了結果的可解釋性。此外，其輕量化設計與對缺失導聯(lián)的適應能力，兼顧了效率與臨床實用性，為實際部署掃除了障礙。

該研究不僅為心電分析提供了新的技術路徑，也印證了 AI 醫(yī)療發(fā)展的關鍵方向——唯有將領域知識與人工智能技術深度融合，才能開發(fā)出真正賦能臨床的實用工具。

展望未來，研究團隊計劃將本框架擴展至更多心血管疾病診斷場景，并探索與多模態(tài)醫(yī)療數(shù)據(jù)的融合應用，從而為智能醫(yī)療的落地持續(xù)注入新動力。

作者信息：

上智院實習生、復旦大學人工智能創(chuàng)新與產(chǎn)業(yè)研究院博士生潘覃和孫翊軒，為共同第一作者。

代碼地址：

https://aistudio.ai4s.com.cn/galaxy-model/partner/galaxy-model-frontend/model/CLEAR-HUG#heading-1

https://github.com/Ashespt/CLEAR-HUG

聲明：包含AI生成內(nèi)容

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.