![]()
作者團隊丨上海科學智能研究院、復旦大學團隊
編輯丨ScienceAI
在心血管疾病診斷中,心電圖(Electrocardiogram, ECG)是無可替代的基礎工具,其中 12 導聯(lián)心電圖是臨床使用的金標準。作為觀察心臟電活動的“視角”,導聯(lián)是由一正一負兩個電極構成的一個記錄電路,12 導聯(lián)心電圖即是通過體表 10 個電極組合構建出 12 個獨特的電信號“視角”,同步捕捉心臟的電活動,形成一套多維度的波形圖譜。
然而,面對海量的心電圖數(shù)據(jù),現(xiàn)有基于自監(jiān)督學習的分析方法盡管提供了無需大規(guī)模標注數(shù)據(jù)的解決方案,其局限仍非常明顯:它們往往未能充分建模心臟傳導過程中細微的個體心搏差異,也缺乏與臨床“從心搏到導聯(lián),再從導聯(lián)到整體”的遞進診斷邏輯相對齊的推理結構,導致在復雜病例診斷中表現(xiàn)受限。
為此,上海科學智能研究院(下稱上智院)與復旦大學聯(lián)合提出了 CLEAR-HUG 雙階段框架。該框架從心電圖信號的生理本質(zhì)出發(fā),在預訓練階段顯式建模心臟傳導特征,并在診斷階段緊密貼合臨床判讀的層級思維,實現(xiàn)了從信號表征到診斷推理的全流程優(yōu)化。實驗表明,該方法在六個權威公開數(shù)據(jù)集上平均性能提升達 6.84%,為開發(fā)高性能、可解釋的 AI 輔助心電圖診斷工具開辟了新路徑。
![]()
論文鏈接:https://arxiv.org/pdf/2512.24002
該研究成果已被 AAAI 2026 接收。研究項目由星河啟智科學智能開放平臺和復旦大學 CFFF 智算平臺提供技術和算力支持。
星河啟智平臺鏈接:https://aistudio.ai4s.com.cn
現(xiàn)有方法的兩大局限
既往的心電圖自監(jiān)督學習(electrocardiogram self-supervised learning, eSSL)方法雖取得一定進展,但存在兩個面向臨床的關鍵短板:
一是忽視個體差異。
現(xiàn)有方法學會了看“大概”和“通常”,卻難以識別那些“例外”與“異常”,而后者往往是臨床診斷中更需要關注的信號。具體來說,現(xiàn)有方法主要讓模型學習心電圖信號中重復出現(xiàn)和普遍存在的模式——比如不同導聯(lián)之間波形的同步性,或連續(xù)心搏間的形態(tài)相似性,卻忽略了一個生理事實:每個心搏的傳導路徑存在自然的細微差異,而不同導聯(lián)觀察的解剖角度也本就不同。這些細節(jié)往往承載著重要的生理與病理信息,例如,一個偶發(fā)的、形態(tài)異常的室性早搏,在標準心電圖中看起來就“很不合群”,但這恰恰是臨床診斷需要捕捉的關鍵線索。
二是脫離臨床邏輯。
為確保診斷的精確性和全面性,心電圖臨床診斷通常遵循“心搏→單導聯(lián)→多導聯(lián)組合”的層級流程:醫(yī)生首先觀察單個心搏的形態(tài)細節(jié),判斷其是否異常;然后在一個特定的導聯(lián)上,分析連續(xù)心搏的節(jié)律和模式,確認異常是否持續(xù)存在;最后,綜合所有 12 個導聯(lián)的信息,像拼圖一樣將不同導聯(lián)的發(fā)現(xiàn)進行組合與空間對應,從而精確定位心臟的病變部位并做出最終診斷。但是,現(xiàn)有模型在下游任務中常忽視這一遞進式診斷邏輯,導致特征提取與診斷需求脫節(jié)。
為解決這些問題,研究團隊從心臟傳導機制和臨床診斷規(guī)范雙重視角出發(fā),構建了 CLEAR-HUG 框架,實現(xiàn)從信號表征到診斷推理的全流程優(yōu)化。該框架與人類專家的知識體系對齊,使得醫(yī)生不僅能夠獲知“診斷結果是什么”,更能理解“模型為何做出該診斷”,從而推動心電圖AI分析更加可解釋。
![]()
圖示:心臟傳導機制。
CLEAR-HUG 的雙階段創(chuàng)新設計
CLEAR-HUG 框架包含預訓練和微調(diào)兩個階段,分別對應特征學習與診斷適配,形成完整的技術閉環(huán)。
第一階段,團隊設計了名為“傳導-導聯(lián)重構器”(Conduction-LEAdReconstructor, CLEAR)的自監(jiān)督模型,該模型能同時捕捉心跳的特異性變異與普遍共性。通過將每個心搏視為獨特實體,該模型采用簡潔高效的稀疏注意力機制,在排除其他心搏干擾的情況下重構信號。
第二階段,團隊構建了“分層導聯(lián)統(tǒng)一分組頭”(Hierarchical lead-UnifiedGroup head, HUG頭)診斷模塊,模擬臨床診斷流程。
![]()
圖示:雙階段訓練
1.CLEAR 預訓練,捕捉傳導級細微特征
預訓練階段的核心是 CLEAR 模型,通過傳導引導和視角引導的雙重信息學習,精準重建心電圖信號:
- 雙重視角建模:將心電圖信號分解為傳導引導信息(同一心搏在各導聯(lián)的時間同步特征)和視角引導信息(同一導聯(lián)的空間異質(zhì)性特征),全面捕捉信號本質(zhì)。
- 稀疏注意力機制:設計專屬注意力掩碼,確保心搏重建僅依賴對應的心搏傳導信息和導聯(lián)全局上下文,避免其他心搏干擾,高效提取特異性特征。
- 掩碼重建訓練:采用 80% 的高掩碼率,通過重建被掩蓋的心搏 token,迫使模型學習深層生理特征而非表面模式,提升表征魯棒性。
2.HUG 微調(diào) ,模擬臨床診斷流程
微調(diào)階段引入 HUG 頭,完全貼合臨床心電圖診斷的層級邏輯:
- 導聯(lián)分組:按臨床標準將 12 導聯(lián)分為 3 組(雙極肢體導聯(lián)、加壓單極肢體導聯(lián)、胸前導聯(lián)),每組通過獨立線性層學習特征并平均。
- 成對組合:將三組特征進行兩兩組合,進一步捕捉導聯(lián)間的互補信息。
- 全局聚合:整合所有組合特征,形成完整的多導聯(lián)全局表征,作為最終診斷依據(jù)。
這種層級設計不僅提升了模型的可解釋性,更讓特征提取過程與醫(yī)生診斷思維高度一致,實現(xiàn)從數(shù)據(jù)驅(qū)動到臨床驅(qū)動的轉(zhuǎn)變。
在六大數(shù)據(jù)集上超越現(xiàn)有最優(yōu)方法
本研究在 MIMIC-IV-ECG 數(shù)據(jù)集上完成預訓練后,于 PTB-XL、CPSC2018 及 CSN 三個公開數(shù)據(jù)集的六個下游任務上進行了系統(tǒng)評估,結果全面超越了現(xiàn)有最優(yōu)方法(SOTA)。
具體而言,模型在平均性能上較當前 SOTA 提升了 6.84%,其中 CLEAR 單模型在預訓練階段貢獻了 3.94% 的提升,而加入 HUG 診斷頭后性能得到進一步改善,充分驗證了雙階段設計的有效性。在低數(shù)據(jù)場景下,該方法展現(xiàn)出卓越的少樣本遷移能力,例如,在僅使用 1% 訓練數(shù)據(jù)的 PTBXL-Rhythm 任務中,CLEAR-HUG 較 SOTA 提升超 17%。
同時,在細粒度疾病分類任務上,層級分組策略的價值尤為凸顯——在 CSN 數(shù)據(jù)集的 38 類疾病分類中,使用 1%、10% 與 100% 訓練數(shù)據(jù)時,HUG 頭相較基礎模型分別帶來 9.21%、5.81% 與 3.18% 的性能增益。
此外,該方法在關鍵特性上也表現(xiàn)出顯著優(yōu)勢。其一,模型具有更強的穩(wěn)健性,即使在部分導聯(lián)缺失、僅保留兩個核心導聯(lián)的極端情況下,其性能仍優(yōu)于現(xiàn)有 SOTA,能夠很好地適應臨床中數(shù)據(jù)不完整的實際場景。其二,模型展現(xiàn)出高度的臨床適配性,通過激活可視化,HUG 頭對不同疾病所激活的導聯(lián)組合模式,與臨床診斷標準高度一致,顯著提升了模型的可解釋性。
核心模塊的必要性驗證
為驗證 CLEAR-HUG 框架中各核心組件的貢獻,本研究進行了系統(tǒng)的消融實驗。該方法遵循控制變量原則,通過逐步移除或調(diào)整模型中的特定設計,量化評估每個創(chuàng)新模塊的實際價值。主要實驗結果與發(fā)現(xiàn)如下:
- 傳導建模的有效性驗證:對比基礎掩碼自編碼器,CLEAR 預訓練通過傳導引導稀疏注意力,在心律分析任務中提升 17.4%,證明了傳導機制建模的重要性。
![]()
- 層級診斷結構的作用分析:移除 HUG 頭后,模型在細分類任務中性能明顯下降,驗證了層級分組策略對復雜疾病診斷的關鍵作用。
![]()
- 預訓練掩碼策略的優(yōu)化驗證:不同掩碼率實驗表明,80% 的掩碼率能平衡特征學習深度與訓練穩(wěn)定性,是最優(yōu)選擇。
這些實驗從多個維度證實,CLEAR 與 HUG 兩個核心模塊均不可或缺,其設計共同支撐了模型在各項任務中的性能提升。
總結與展望
CLEAR-HUG 的成功,并不依賴于復雜的模型架構,而是根植于對醫(yī)學本質(zhì)的深刻洞察與巧妙融合。
首先,模型從生理機制出發(fā),緊扣心臟傳導這一心電信號的核心生成原理,使特征學習過程更貼合生理本質(zhì)。其次,通過將模型流程與醫(yī)生診斷邏輯深度對齊,在提升性能的同時也顯著增強了結果的可解釋性。此外,其輕量化設計與對缺失導聯(lián)的適應能力,兼顧了效率與臨床實用性,為實際部署掃除了障礙。
該研究不僅為心電分析提供了新的技術路徑,也印證了 AI 醫(yī)療發(fā)展的關鍵方向——唯有將領域知識與人工智能技術深度融合,才能開發(fā)出真正賦能臨床的實用工具。
展望未來,研究團隊計劃將本框架擴展至更多心血管疾病診斷場景,并探索與多模態(tài)醫(yī)療數(shù)據(jù)的融合應用,從而為智能醫(yī)療的落地持續(xù)注入新動力。
作者信息:
上智院實習生、復旦大學人工智能創(chuàng)新與產(chǎn)業(yè)研究院博士生潘覃和孫翊軒,為共同第一作者。
代碼地址:
https://aistudio.ai4s.com.cn/galaxy-model/partner/galaxy-model-frontend/model/CLEAR-HUG#heading-1
https://github.com/Ashespt/CLEAR-HUG
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.