![]()
理解人體復(fù)雜系統(tǒng)宏觀生理表型與微觀遺傳分子信息之間的跨尺度關(guān)聯(lián),是當(dāng)前生物醫(yī)學(xué)領(lǐng)域面臨的關(guān)鍵科學(xué)問(wèn)題,也對(duì)目前人工智能、系統(tǒng)生物學(xué)等前沿學(xué)科的發(fā)展提出了重要方法學(xué)挑戰(zhàn)。心電圖(ECG)作為心血管疾病臨床診療的金標(biāo)準(zhǔn),是耦合宏觀生理表型與微觀遺傳分子的關(guān)鍵中間層次。然而,如何通過(guò)人工智能模型解析這種跨尺度關(guān)聯(lián)的底層規(guī)律,并構(gòu)建具有普適性的預(yù)測(cè)模型,對(duì)于深入理解心血管疾病的發(fā)生發(fā)展、推動(dòng)精準(zhǔn)預(yù)警與藥物干預(yù)具有重要科學(xué)價(jià)值和現(xiàn)實(shí)意義。
近期,孫逸仙紀(jì)念醫(yī)院基礎(chǔ)與轉(zhuǎn)化醫(yī)學(xué)研究中心趙慧英教授與中山大學(xué)計(jì)算機(jī)學(xué)院楊躍東教授團(tuán)隊(duì)在心血管智能診療與跨尺度遺傳發(fā)現(xiàn)領(lǐng)域取得進(jìn)展。針對(duì)大規(guī)模生物樣本庫(kù)中多模態(tài)數(shù)據(jù)缺失及臨床AI模型泛化性、可解釋性不足等難題,團(tuán)隊(duì)先后創(chuàng)建了基因型-心電圖跨尺度推斷模型CapECG以及千萬(wàn)級(jí)數(shù)據(jù)心電基礎(chǔ)大模型ECG-LFM。相關(guān)成果分別發(fā)表于npjDigital Medicine與Nature Communications。這些研究系統(tǒng)揭示了基于生理信息的心血管系統(tǒng)宏、微觀跨層次關(guān)聯(lián)規(guī)律,實(shí)現(xiàn)了多尺度心電信號(hào)與多組學(xué)信息的推斷與整合。
![]()
在發(fā)表于npjDigital Medicine的題為Empowering genetic discoveries andcardiovascular risk assessment by predicting electrocardiograms from genotype的論文中,研究團(tuán)隊(duì)首先在心血管復(fù)雜體系宏、微觀關(guān)聯(lián)的本質(zhì)規(guī)律發(fā)現(xiàn)上取得突破。針對(duì)大型人群隊(duì)列UK Biobank(UKB)中僅有約10%的樣本同時(shí)具備基因與心電數(shù)據(jù)的“小樣本”局限,該研究創(chuàng)建了基因-心電表型跨尺度推斷模型CapECG。該模型基于自注意力膠囊網(wǎng)絡(luò)架構(gòu),能夠自主挖掘基因變異與心電特征間的復(fù)雜非線(xiàn)性關(guān)聯(lián)。為了應(yīng)對(duì)高維基因數(shù)據(jù)的挑戰(zhàn),團(tuán)隊(duì)研發(fā)了LD-PCA方法進(jìn)行維度縮減:首先利用連鎖不平衡(LD)區(qū)塊對(duì)全基因組范圍內(nèi)的800多萬(wàn)個(gè)單核苷酸多態(tài)性(SNP)進(jìn)行分割,隨后通過(guò)主成分分析(PCA)在每個(gè)區(qū)塊內(nèi)提取前10個(gè)主成分,并嵌入LD注意力模塊以量化不同基因區(qū)塊對(duì)心電表型的貢獻(xiàn)。實(shí)驗(yàn)結(jié)果表明,CapECG在102種具有顯著遺傳力的心電特征預(yù)測(cè)中,實(shí)現(xiàn)了0.62的平均皮爾遜相關(guān)系數(shù)(PCC),其性能顯著優(yōu)于傳統(tǒng)線(xiàn)性回歸模型及Transformer、CNN等基準(zhǔn)模型。依托這一推斷框架,團(tuán)隊(duì)成功為UKB中38.8萬(wàn)名僅有基因數(shù)據(jù)而缺乏心電數(shù)據(jù)的個(gè)體重構(gòu)其心電特征。在臨床轉(zhuǎn)化潛力方面,融合了推斷表型的深度學(xué)習(xí)模型(DeepCVD)將6種心血管疾病的預(yù)測(cè)精度(AUC)從傳統(tǒng)多基因風(fēng)險(xiǎn)評(píng)分(PRS)的0.71提升至0.80。在遺傳發(fā)現(xiàn)方面,利用預(yù)測(cè)的空間QRS-T夾角(spQRSTa)開(kāi)展的大規(guī)模全基因組關(guān)聯(lián)分析(GWAS),識(shí)別出133個(gè)顯著遺傳位點(diǎn),極大拓展了有效樣本量并提升了統(tǒng)計(jì)效力。
![]()
圖1:CapECG方法流程
![]()
在發(fā)表于Nature Communications的題為A self-supervised electrocardiogram foundation model for empowering cardiovascular disease prediction and genetic factor discovery的論文中,團(tuán)隊(duì)構(gòu)建了具有深度可解釋性的心電圖預(yù)訓(xùn)練大模型 ECG-LFM。該模型采用來(lái)自Harvard-Emory 心電圖數(shù)據(jù)庫(kù)和 MIMIC-IV的超過(guò)一千萬(wàn)份12導(dǎo)聯(lián)心電圖進(jìn)行自監(jiān)督預(yù)訓(xùn)練,構(gòu)建了統(tǒng)一的多模態(tài)嵌入表征空間。ECG-LFM融合了上下文對(duì)比學(xué)習(xí)、掩碼語(yǔ)言建模(MLM)及多段對(duì)比學(xué)習(xí)任務(wù),使模型能夠深度提取心電信號(hào)的全局上下文語(yǔ)義與細(xì)粒度時(shí)空波動(dòng)模式。基準(zhǔn)測(cè)試顯示,ECG-LFM在PTB-XL、CODE-15、UKB等多個(gè)獨(dú)立臨床隊(duì)列的8種心血管疾病預(yù)測(cè)中,展現(xiàn)出卓越的泛化性能,平均AUROC達(dá)到0.930。模型尤為突出的優(yōu)勢(shì)在于其極低的數(shù)據(jù)依賴(lài)性:即便僅使用 1%的標(biāo)注樣本進(jìn)行微調(diào),該模型的平均 AUROC仍可達(dá)0.872,顯著優(yōu)于基準(zhǔn)預(yù)訓(xùn)練大模型HeartBEiT 12.1%以上。這為克服醫(yī)療領(lǐng)域常見(jiàn)的“小樣本”局限、構(gòu)建面向臨床的智能診斷模型提供了核心支撐。為了破解深度學(xué)習(xí)的“黑盒”難題,研究團(tuán)隊(duì)構(gòu)建了基于擾動(dòng)的特征解釋?zhuān)≒EI)方法,實(shí)現(xiàn)了心電深度表征與形態(tài)特征的精準(zhǔn)對(duì)齊。該方法通過(guò)在特征空間引入微小擾動(dòng)并觀察其對(duì)心電重構(gòu)波形的影響,首次將模型提取的高維隱式衍生特征(EDF)映射回臨床可識(shí)別的形態(tài)學(xué)區(qū)域。例如,研究證實(shí)衍生特征EDF 導(dǎo)聯(lián)的ST段形態(tài);而 EDF 則反映了心室肥厚導(dǎo)致的QRS波異常形態(tài) 。進(jìn)而,通過(guò)對(duì)這1024個(gè)具備明確生物學(xué)意義的衍生特征開(kāi)展GWAS元分析,研究團(tuán)隊(duì)在19個(gè)基因座上識(shí)別出24個(gè)顯著SNP,其中包括8個(gè)位于 CEP85L、PRDM16、TTN 等基因附近的全新遺傳位點(diǎn) 。隨后的孟德?tīng)栯S機(jī)化(MR)分析進(jìn)一步確證了特定心電特征與心肌肥厚、心房顫 動(dòng)等疾病間的雙向遺傳因果聯(lián)系,為“生物網(wǎng)絡(luò)”視角下的復(fù)雜疾病機(jī)理研究提供了新依據(jù)。
![]()
圖2:ECG-LFM方法流程
這一系列研究從心血管系統(tǒng)宏、微觀跨尺度重構(gòu)了心血管AI的研究邏輯。CapECG模型自下而上地利用基因組數(shù)據(jù)重構(gòu)生命早期的心電特征,解決了多組學(xué)配對(duì)數(shù)據(jù)稀缺的難題;而ECG-LFM預(yù)訓(xùn)練大模型則確立了高泛化、強(qiáng)解釋的心電基座模型,能夠深入解析宏觀波形背后隱藏的微觀分子圖譜。兩者的成功結(jié)合,不僅展示了人工智能在理解心血管系統(tǒng)宏、微觀跨尺度關(guān)聯(lián)規(guī)中的核心價(jià)值,也為進(jìn)一步推動(dòng)心血管精準(zhǔn)診療提供了關(guān)鍵的技術(shù)路徑。
中山大學(xué)計(jì)算機(jī)學(xué)院博士生林斯穎、中山大學(xué)孫逸仙紀(jì)念醫(yī)院李釗琪為以上文章的共同作者,趙慧英教授和楊躍東教授為通訊作者。
https://www.nature.com/articles/s41467-026-72436-2
https://www.nature.com/articles/s41746-026-02438-3
制版人:十一
BioArt
Med
Plants
人才招聘
學(xué)術(shù)合作組織
(*排名不分先后)
![]()
轉(zhuǎn)載須知
【非原創(chuàng)文章】本文著作權(quán)歸文章作者所有,歡迎個(gè)人轉(zhuǎn)發(fā)分享,未經(jīng)作者的允許禁止轉(zhuǎn)載,作者擁有所有法定權(quán)利,違者必究。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.