![]()
你是否曾因無法訪問UK Biobank原始數(shù)據(jù)而無法針對特定性狀調(diào)整協(xié)變量?你是否被海量數(shù)據(jù)的計算瓶頸所困擾? UK BioCoin (UKC) 解決了這兩個難題。這項發(fā)表于Nature Communications的題為:UK BioCoin: swift trait-specific summary statistics regression for UK Biobank的最新研究,展示了一種僅需50GB即可分發(fā)、計算效率提升約80倍的分析工具。
![]()
什么是 UK BioCoin?
UK BioCoin (UKC) 并非一種加密貨幣,而是一個 計算框架 和 數(shù)據(jù)共享范式 。目前,GWAS匯總統(tǒng)計數(shù)據(jù)(Summary Statistics)雖然解決了隱私問題,但通常基于固定的協(xié)變量調(diào)整(如固定調(diào)整年齡、性別等)。這導(dǎo)致研究者無法探索特定性狀所需的特殊協(xié)變量調(diào)整,限制了下游分析的靈活性。UKC通過一種名為 NSS (Naive Summary Statistics) 的核心技術(shù),將原始數(shù)據(jù)轉(zhuǎn)化為可公開分發(fā)的匯總統(tǒng)計量。它允許其他研究人員在不接觸個體級數(shù)據(jù)的前提下,進行高效的、針對特定性狀的協(xié)變量調(diào)整。
核心性能對比:效率與精度
研究團隊利用UK Biobank的 505種性狀 和 1000萬個SNP 進行了全面演示。
![]()
注:測試環(huán)境為站立身高(Standing height)GWAS,調(diào)整5個協(xié)變量。
深度應(yīng)用:不僅僅是GWAS
UKC不僅能重跑GWAS,其生成的匯總統(tǒng)計數(shù)據(jù)在下游應(yīng)用中表現(xiàn)優(yōu)異,研究團隊展示了四個典型應(yīng)用場景:
1)靈活的全表型組關(guān)聯(lián)分析 (GWAS)
研究發(fā)現(xiàn),協(xié)變量的選擇對結(jié)果影響巨大。身高與體重的差異: 在“身高”分析中,調(diào)整BMI影響甚微;但在“體重”分析中,如果不調(diào)整BMI,會掩蓋與骨骼生長(如 LCORL 基因)相關(guān)的位點,而這些位點恰恰是剔除脂肪量影響后的純體重信號。UKC 讓研究者能像玩樂高一樣,針對每個性狀自由組合協(xié)變量(如年齡、性別、PCs、BMI等),挖掘更深層的生物學(xué)機制。
2)SNP遺傳力估計
利用LDSC方法對505個性狀進行遺傳力估計,UKC的結(jié)果與Neale Lab 公布的結(jié)果高度一致(相關(guān)系數(shù) 0.97)。這表明,即使經(jīng)過數(shù)據(jù)壓縮和重構(gòu),UKC依然能保持遺傳架構(gòu)的完整性。
3)多基因評分 (PGS)
在預(yù)測準(zhǔn)確性方面,UKC 表現(xiàn)穩(wěn)定。研究指出,如果不調(diào)整適當(dāng)?shù)膮f(xié)變量,PGS 的準(zhǔn)確性可能會被高估。UKC 提供了一個可靠的平臺來評估不同協(xié)變量組合對 PGS 的影響。
4)孟德爾隨機化 (MR)
這是一個極具警示意義的發(fā)現(xiàn)。在探究“腰圍 (WC) ”對“類風(fēng)濕性關(guān)節(jié)炎 (RA) ”的因果效應(yīng)時, 不同的協(xié)變量調(diào)整策略導(dǎo)致了完全相反的結(jié)論(正相關(guān) vs 負(fù)相關(guān)) 。
調(diào)整模型A(BMI+飲酒): 顯示 WC 增加 RA 風(fēng)險。
調(diào)整模型B(體重+體脂+吸煙+10PCs): 結(jié)果反轉(zhuǎn),顯示 WC 降低 RA 風(fēng)險。
這證明了協(xié)變量調(diào)整在因果推斷中的極端重要性,UKC 為這種敏感性分析提供了便捷工具。
質(zhì)控與可移植性
質(zhì)控指標(biāo) (VIF): 研究提出了使用方差膨脹因子(VIF)作為質(zhì)量控制指標(biāo)。當(dāng) VIF>50 時,可能存在嚴(yán)重偏差,建議剔除。這為用戶提供了判斷結(jié)果可靠性的標(biāo)準(zhǔn)。
中國精準(zhǔn)健康資源數(shù)據(jù)庫 (China Precision Biobank, CPBB ,https://cpbb.cn/): 該框架不僅限于UKB,研究團隊已成功將其應(yīng)用于其他生物銀行隊列,證明了該技術(shù)的通用性和可移植性。
總結(jié)與展望
UK BioCoin為大規(guī)模生物銀行研究提供了一個 隱私保護、高效且靈活 的新標(biāo)準(zhǔn)。它將原本需要高性能計算集群數(shù)天才能完成的任務(wù),壓縮到了可以在普通筆記本電腦(8核CPU/16GB RAM)上運行的Docker容器中。這不僅降低了科研門檻,更通過允許靈活調(diào)整協(xié)變量,幫助科學(xué)家避免了因模型設(shè)定錯誤而導(dǎo)致的假陽性或假陰性發(fā)現(xiàn)。
原文:https://doi.org/10.1038/s41467-026-71788-z
制版人:十一
BioArt
Med
Plants
人才招聘
學(xué)術(shù)合作組織
(*排名不分先后)
![]()
轉(zhuǎn)載須知
【非原創(chuàng)文章】本文著作權(quán)歸文章作者所有,歡迎個人轉(zhuǎn)發(fā)分享,未經(jīng)作者的允許禁止轉(zhuǎn)載,作者擁有所有法定權(quán)利,違者必究。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.