![]()
撰文 |章臺柳
短串聯(lián)重復(fù)序列( short tandem repeats , STRs )是一類重要的遺傳變異,可導(dǎo)致多種神經(jīng)退行性和神經(jīng)肌肉疾病,包括亨廷頓病(HD)、運(yùn)動(dòng)神經(jīng)元病(MND)、脊髓小腦性共濟(jì)失調(diào)(SCAs)、強(qiáng)直性肌營養(yǎng)不良 1 型(DM 1 )和 2 型(DM 2 )以及脊髓延髓性肌萎縮癥(SBMA)。重復(fù)序列在代際傳遞或體細(xì)胞過程中發(fā)生的擴(kuò)增增加,以及重復(fù)基序組成的變化,已被證明會影響疾病風(fēng)險(xiǎn)、外顯率、嚴(yán)重程度、進(jìn)展和發(fā)病年齡。自 1991 年首次發(fā)現(xiàn) FMR1 基因中的致病性重復(fù)序列與脆性 X 綜合征之間的關(guān)聯(lián)以來,目前已有超過 70 種神經(jīng)系統(tǒng)疾病與重復(fù)擴(kuò)增相關(guān)。重復(fù)序列相關(guān)疾病可通過多種機(jī)制表現(xiàn),包括 RNA 積累( DM1 )、蛋白質(zhì)錯(cuò)誤折疊( SCA2 )、翻譯后修飾( SCA1 )以及由于高甲基化導(dǎo)致的轉(zhuǎn)錄抑制(脆性 X 綜合征)。盡管這些疾病較為罕見,但治療、護(hù)理的高昂成本,為病人帶來沉重的經(jīng)濟(jì)和精神負(fù)擔(dān),更突顯了更好地理解這些疾病以促進(jìn)和支持藥物發(fā)現(xiàn)的必要性。
雖然某些重復(fù)擴(kuò)增疾病(例如 HD 和 SCAs )在特定國家和人群中的患病率估計(jì)值已有報(bào)道,但大多數(shù) STR 的頻率和外顯率估計(jì)值存在偏差,這些偏差源于疾病確定、罕見性、疾病認(rèn)知度、獲得可靠醫(yī)療保健的機(jī)會以及患者參與基因檢測的意愿。事實(shí)上,兩項(xiàng)使用 PCR 估算重復(fù)長度的大規(guī)模人群研究(一項(xiàng)針對 DMPK ,涵蓋超過 50,000 名個(gè)體【1】;另一項(xiàng)針對 HTT ,涵蓋超過 7,000 名個(gè)體【2】)估計(jì)的重復(fù)擴(kuò)增攜帶者頻率高于先前報(bào)道。這些觀察結(jié)果說明了采用基因型優(yōu)先方法進(jìn)行人群規(guī)模研究的必要性,以檢查擴(kuò)增重復(fù)序列的頻率、與重復(fù)長度增加相關(guān)的風(fēng)險(xiǎn)以及重復(fù)位點(diǎn)中基序的變異性。目前為止,專注于重復(fù)擴(kuò)增相關(guān)疾病的研究大多是疾病特異性或位點(diǎn)特異性的,樣本量受到疾病罕見性以及估算重復(fù)長度檢測方法高昂成本的限制。然而,由于生物庫規(guī)模的全外顯子組測序(WES)和全基因組測序(WGS)數(shù)據(jù)的廣泛可用性以及專用的計(jì)算方法,現(xiàn)在正在出現(xiàn)能夠同時(shí)調(diào)用多個(gè)位點(diǎn)的重復(fù)序列并提供對潛在致病性擴(kuò)增普遍性見解的人群規(guī)模分析。
2 026 年 4 月 8 日 ,來自 再生元遺傳學(xué)中心 (Regeneron Genetics Center) 的 Sahar Gelfman 團(tuán)隊(duì) 在 Nature 雜 志上發(fā)表文章 Population-scale repeat expansions elucidate disease risk and brain atrophy ,利用短讀長測序的全外顯子組和全基因組數(shù)據(jù),分析了1,020,833個(gè)多樣化樣本,對病理性重復(fù)擴(kuò)增進(jìn)行了人群規(guī)模的調(diào)查,估算了37個(gè)疾病相關(guān)STR位點(diǎn)的重復(fù)長度,計(jì)算了致病性重復(fù)序列的攜帶者頻率,并比較了不同祖先群體的差異。與先前研究結(jié)果一致,對于大多數(shù)位點(diǎn),致病性重復(fù)序列的頻率高于相應(yīng)疾病的患病率,在不同祖先群體之間有所不同,并且與流行病學(xué)研究中報(bào)道的亞群間疾病患病率差異相對應(yīng)。重復(fù)長度與 7,671 種二元性狀的關(guān)聯(lián)分析捕捉到了已知的位點(diǎn) - 性狀關(guān)聯(lián),包括 HTT 與亨廷頓病、 DMPK 與強(qiáng)直性肌病、 C9orf72 與運(yùn)動(dòng)神經(jīng)元病等。最后,即使在疾病診斷之前,幾個(gè)位點(diǎn)的重復(fù)擴(kuò)增也與神經(jīng)絲輕鏈蛋白水平升高( NfL )以及特定疾病相關(guān)腦區(qū)腦容量減少密切相關(guān)。例如, HTT 擴(kuò)增攜帶者表現(xiàn)出 22.1% 的殼核體積損失,而 CACNA1A 擴(kuò)增攜帶者則顯示出 24.6% 的小腦體積損失。這些觀察結(jié)果表明,腦容量減少和 NfL 水平升高均發(fā)生在疾病診斷之前。本研究展示了如何利用短讀長測序數(shù)據(jù)在多樣化人群規(guī)模隊(duì)列中表征重復(fù)擴(kuò)增,及其在流行病學(xué)和臨床生物標(biāo)志物開發(fā)中的應(yīng)用。
![]()
研究人員綜合全外顯子組和全基因組數(shù)據(jù),并設(shè)計(jì)了一個(gè)工作流程對來自7個(gè)隊(duì)列的1,020,833個(gè)全外顯子組測序樣本中3 7 個(gè)疾病相關(guān)STR位點(diǎn)進(jìn)行分析。在整個(gè)隊(duì)列水平,以及由遺傳祖先定義的五個(gè)亞組(歐洲祖先、非洲祖先、南亞祖先、混血西班牙裔或拉丁美洲祖先以及東亞祖先)中,計(jì)算了每個(gè)位點(diǎn)上攜帶重復(fù)序列長度超過已報(bào)道的前突變和致病閾值的個(gè)體頻率。接著,基于以下標(biāo)準(zhǔn)為每個(gè)位點(diǎn)獨(dú)立定義了重復(fù)擴(kuò)增閾值:(1) 前突變和 (2) 來自廣泛文獻(xiàn)檢索得到的致病截?cái)嘀担约?(3) 根據(jù)每個(gè)隊(duì)列中重復(fù)長度分布經(jīng)驗(yàn)得出的前1%、(4) 前0.1%和 (5) 前0.01%的閾值。然后,在這些重復(fù)長度基因型與7,671個(gè)基于ICD10的二元性狀之間進(jìn)行了全表型組關(guān)聯(lián)研究。最后,比較了致病性重復(fù)擴(kuò)增攜帶者與非攜帶者在1,201個(gè)腦影像衍生定量體積表型和2,939個(gè)蛋白質(zhì)表達(dá)水平上的差異。
研究人員生成了通過全外顯子組測序或全基因組測序數(shù)據(jù)(或兩者)可靠調(diào)用的37個(gè)位點(diǎn)中每個(gè)位點(diǎn)的重復(fù)長度分布,并計(jì)算了前突變和致病范圍內(nèi)重復(fù)攜帶者的頻率,并與疾病患病率進(jìn)行比較。結(jié)果顯示,致病性重復(fù)攜帶者的頻率高于其相關(guān)疾病的患病率,與之前的研究結(jié)果一致。使用一組單核苷酸多態(tài)性來推斷遺傳結(jié)構(gòu),將每個(gè)樣本分配到以下五個(gè)組之一:歐洲祖先(EUR)、非洲祖先(AFR)、南亞祖先(SAS)、混血西班牙裔或拉丁美洲祖先(AMR)以及東亞祖先(EAS)。計(jì)算每個(gè)組內(nèi)的攜帶者頻率,確定了幾個(gè)已知和未報(bào)道過的血統(tǒng)特異性富集。例如, AR ( 2.51% )和 CACNA1A ( 0.11% )的致病性擴(kuò)增在 EAS 中富集,特別是與 AFR 中的低頻率相比時(shí)( AR : 0.46% ,; CACNA1A : 0.01% )。這些富集與相應(yīng)祖先和地理區(qū)域中疾病患病率的已知差異一致,例如 AFR 中 SBMA ( AR )的較低患病率以及日本和韓國中 SCA6 ( CACNA1A )的較高患病率。與其他祖先相比,EUR中出現(xiàn)DMPK(WES)以及C9orf72、FXN和TCF4(WGS)的擴(kuò)增富集,與報(bào)道的EUR中ALS、Fuchs內(nèi)皮角膜營養(yǎng)不良和弗里德賴希共濟(jì)失調(diào)的較高患病率一致。除了復(fù)現(xiàn)已報(bào)道的疾病富集外,還發(fā)現(xiàn)與 EUR 相比, AFR 中 CNBP 和 JPH3 前突變擴(kuò)增存在新的富集( CNBP : WGS , 0.98% vs 0.12% ,; JPH3 : WGS , 0.98% vs 0% )。在特定祖先群體中觀察到的這些富集和缺失,有助于為特定亞群中的疾病風(fēng)險(xiǎn)建立基線預(yù)期。
那么,重復(fù)擴(kuò)增的長度與性狀之間是否關(guān)聯(lián)?研究確定了7個(gè)獨(dú)特位點(diǎn)的1 68 個(gè)顯著關(guān)聯(lián):AR、ATXN2、CACNA1A、C9orf72、DMPK、HTT和TCF4,其中75個(gè)是獨(dú)特的位點(diǎn)-性狀關(guān)聯(lián),每個(gè)位點(diǎn)有多個(gè)顯著的重復(fù)閾值。觀察到較為主要的關(guān)聯(lián)包括:DMPK的致病性(≥50個(gè)重復(fù)序列)擴(kuò)增與強(qiáng)直性肌病、HTT的致病性(≥40)擴(kuò)增與亨廷頓病、C9orf72的致病性(≥60)重復(fù)長度與MND、TCF4(≥50)與遺傳性角膜營養(yǎng)不良等。對于每個(gè)位點(diǎn),觀察到多個(gè)與相關(guān)性狀的顯著關(guān)聯(lián)。例如,白內(nèi)障、心臟起搏器和植入物與DMPK擴(kuò)增密切相關(guān),這與DM1廣泛且預(yù)期的臨床譜一致。值得注意的是,位點(diǎn) - 性狀風(fēng)險(xiǎn)通常隨著重復(fù)長度閾值的增加而增強(qiáng)。例如,在 HTT 重復(fù)長度閾值的前 0.01% ( WES 和 WGS 分別為 44 和 41 個(gè)重復(fù)序列)觀察到最強(qiáng)的 HD 風(fēng)險(xiǎn), OR 為 2,570 。然而,在 1% 重復(fù)閾值( 1:100 ,即 32 個(gè) CAG 重復(fù)序列, WES 和 WGS , OR = 62 )和 0.1% 閾值( 1:1,000 , WES 和 WGS 分別為 38 和 37 , OR = 410.2 )仍然觀察到高風(fēng)險(xiǎn),這表明較短重復(fù)序列的外顯率較低,并隨重復(fù)長度逐漸增加。同時(shí),外顯率隨著年齡的增長而逐漸增加,并且在較長致病性重復(fù)序列的攜帶者中更為明顯。
在神經(jīng)退行性疾病中,腦容量減少和NfL水平升高是預(yù)期會發(fā)生的變化,那么從未診斷為相應(yīng)疾病的重復(fù)擴(kuò)增攜帶者的腦影像和NfL讀數(shù)是否會發(fā)生變化?研究人員選擇了導(dǎo)致神經(jīng)退行性疾病的基因,這些基因在UKB中既有未確診的致病性重復(fù)擴(kuò)增攜帶者,也有相應(yīng)的MRI或NfL數(shù)據(jù)。結(jié)果顯示,HTT、CACNA1A、C9orf72和TCF4這四個(gè)位點(diǎn)與體積表型顯著相關(guān),且每個(gè)位點(diǎn)擴(kuò)增攜帶者受影響最大的區(qū)域與相應(yīng)疾病早期階段受影響的區(qū)域相同。測試HTT、CACNA1A和C9orf72重復(fù)序列對從血漿中2,939種蛋白質(zhì)表達(dá)的影響,發(fā)現(xiàn) HTT 重復(fù)序列與 NfL 水平升高之間存在強(qiáng)關(guān)聯(lián)。這種相關(guān)性意味著,與 HTT 正常重復(fù)序列攜帶者相比,致病性重復(fù)序列攜帶者的 NfL 水平增加了 1.9 倍。與正常重復(fù)序列攜帶者相比, C9orf72 致病性重復(fù)序列攜帶者的NfL水平確實(shí)顯示出顯著增加(1.14倍變化)。在CACNA1A擴(kuò)增攜帶者中未觀察到這種效應(yīng)。
總的來說,研究利用大規(guī)模人群數(shù)據(jù),系統(tǒng)性地描繪了致病性重復(fù)擴(kuò)增的攜帶者頻率,量化了其與疾病風(fēng)險(xiǎn)和腦結(jié)構(gòu)變化的關(guān)聯(lián),強(qiáng)調(diào)了重復(fù)長度在疾病發(fā)生發(fā)展中的核心作用。
https://www.nature.com/articles/s41586-026-10345-6
制版人:十一
參考文獻(xiàn)
1. Kay, C. et al. Huntington disease reduced penetrance alleles occur at high frequency in the general population.Neurology87 , 282–288 (2016).
2. Johnson, N. E. et al. Population-based prevalence of myotonic dystrophy type 1 using genetic analysis of statewide blood screening program.Neurology96 , e1045–e1053 (2021).
BioArt
Med
Plants
人才招聘
學(xué)術(shù)合作組織
(*排名不分先后)
![]()
轉(zhuǎn)載須知
【原創(chuàng)文章】BioArtMED原創(chuàng)文章,歡迎個(gè)人轉(zhuǎn)發(fā)分享,未經(jīng)允許禁止轉(zhuǎn)載,所刊登的所有作品的著作權(quán)均為BioArtMED所擁有。BioArtMED保留所有法定權(quán)利,違者必究。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.