想象一下,在不久的將來,人工智能模型能像天氣預報一樣預測自己的健康狀況——比如幫你預警心臟病的發生或者提示癌癥風險,提醒你提早數年開始預防。這正是歐洲分子生物學實驗室的科學家在探索的一類全新“健康預報”系統,它的出現或能夠幫助個體提前干預疾病發生,降低社會的總體醫療負擔。
根據發表于《自然》雜志的全新論文,這種人工智能模型是使用類似于大型語言模型 (LLM) 中的算法概念定制構建的。它基于來自英國生物樣本庫的約40萬名患者的數據進行訓練。測試中,它可以預測1000多種疾病的風險和發病時間,并預估個體在未來20年的潛在疾病負擔。
![]()
當下,我們熟知的ChatGPT、DeepSeek等大型語言模型正在改變文本生成領域的格局。它們將語言視為一系列碎片,通過分析前文所有碎片之間的關系,逐字生成后續內容,最終產生符合語境、甚至與人類對話無異的文本。而大型健康模型要做的就是將海量的健康數據當作這些碎片,預測后續事件的展開。
在這項前沿研究中,研究者將該模型命名為Delphi-2M。它基于一種Transformer架構,并針對健康數據的特點進行了關鍵性改造。Delphi-2M會將個體的健康軌跡轉化為一個序列事件——包含醫療診斷,身體體重指數(BMI)以及吸煙、飲酒等生活習慣。
同時,研究者將每個事件都標注了發生時的年齡,使模型能夠理解時間流逝概念。因此,常規的標準語言模型只會預測“下一個詞是什么”,Delphi-2M則能預測“下一個事件何時發生”。
![]()
圖片來源:123RF
根據測試結果,Delphi-2M能同時評估超過1000種疾病及其發生時間,其預測能力顯著優于隨機猜測,預測準確性與單獨的常規心血管疾病或癡呆風險評分相當。它可以基于個體60歲之前的健康記錄,模擬出從60歲后可能發生的無數種未來健康軌跡。
分析顯示,這些模擬的軌跡在人群層面上高度還原了真實的疾病發生率。模型成功預測了不同吸煙、飲酒或BMI人群在70-75歲時的疾病負擔差異。舉例來說,根據男性的診斷記錄和生活習慣,遭受心臟病的風險可以在萬分之四到百分之一間浮動,后者是重點需要注意心臟病風險的群體;而一系列消化道疾病史會將個體患胰腺癌的風險提高19倍。
研究者也指出,Delphi-2M的預測與天氣預報類似,只是提供疾病發生的概率,并非確定性。它在未來經過更多的數據測試和訓練后,將有望幫助臨床醫生及早識別高危患者,盡早提供精準干預措施。
參考資料:
[1] Shmatko, A., Jung, A.W., Gaurav, K. et al. Learning the natural history of human disease with generative transformers. Nature (2025). https://doi.org/10.1038/s41586-025-09529-3
歡迎轉發到朋友圈,謝絕轉載到其他平臺。如有開設白名單需求,請在“學術經緯”公眾號主頁回復“轉載”獲取轉載須知。其他合作需求,請聯系wuxi_media@wuxiapptec.com。
免責聲明:本文僅作信息交流之目的,文中觀點不代表藥明康德立場,亦不代表藥明康德支持或反對文中觀點。本文也不是治療方案推薦。如需獲得治療方案指導,請前往正規醫院就診。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.