網易首頁 > 網易號 > 正文申請入駐

提前20年預測疾病風險！今日《自然》：能“預報”上千種疾病的AI來了

2025-09-18 19:05:50　來源: 學術經緯

上海舉報

分享至

想象一下，在不久的將來，人工智能模型能像天氣預報一樣預測自己的健康狀況——比如幫你預警心臟病的發生或者提示癌癥風險，提醒你提早數年開始預防。這正是歐洲分子生物學實驗室的科學家在探索的一類全新“健康預報”系統，它的出現或能夠幫助個體提前干預疾病發生，降低社會的總體醫療負擔。

根據發表于《自然》雜志的全新論文，這種人工智能模型是使用類似于大型語言模型 (LLM) 中的算法概念定制構建的。它基于來自英國生物樣本庫的約40萬名患者的數據進行訓練。測試中，它可以預測1000多種疾病的風險和發病時間，并預估個體在未來20年的潛在疾病負擔。

當下，我們熟知的ChatGPT、DeepSeek等大型語言模型正在改變文本生成領域的格局。它們將語言視為一系列碎片，通過分析前文所有碎片之間的關系，逐字生成后續內容，最終產生符合語境、甚至與人類對話無異的文本。而大型健康模型要做的就是將海量的健康數據當作這些碎片，預測后續事件的展開。

在這項前沿研究中，研究者將該模型命名為Delphi-2M。它基于一種Transformer架構，并針對健康數據的特點進行了關鍵性改造。Delphi-2M會將個體的健康軌跡轉化為一個序列事件——包含醫療診斷，身體體重指數（BMI）以及吸煙、飲酒等生活習慣。

同時，研究者將每個事件都標注了發生時的年齡，使模型能夠理解時間流逝概念。因此，常規的標準語言模型只會預測“下一個詞是什么”，Delphi-2M則能預測“下一個事件何時發生”。

圖片來源：123RF

根據測試結果，Delphi-2M能同時評估超過1000種疾病及其發生時間，其預測能力顯著優于隨機猜測，預測準確性與單獨的常規心血管疾病或癡呆風險評分相當。它可以基于個體60歲之前的健康記錄，模擬出從60歲后可能發生的無數種未來健康軌跡。

分析顯示，這些模擬的軌跡在人群層面上高度還原了真實的疾病發生率。模型成功預測了不同吸煙、飲酒或BMI人群在70-75歲時的疾病負擔差異。舉例來說，根據男性的診斷記錄和生活習慣，遭受心臟病的風險可以在萬分之四到百分之一間浮動，后者是重點需要注意心臟病風險的群體；而一系列消化道疾病史會將個體患胰腺癌的風險提高19倍。

研究者也指出，Delphi-2M的預測與天氣預報類似，只是提供疾病發生的概率，并非確定性。它在未來經過更多的數據測試和訓練后，將有望幫助臨床醫生及早識別高危患者，盡早提供精準干預措施。

參考資料：

[1] Shmatko, A., Jung, A.W., Gaurav, K. et al. Learning the natural history of human disease with generative transformers. Nature (2025). https://doi.org/10.1038/s41586-025-09529-3

歡迎轉發到朋友圈，謝絕轉載到其他平臺。如有開設白名單需求，請在“學術經緯”公眾號主頁回復“轉載”獲取轉載須知。其他合作需求，請聯系wuxi_media@wuxiapptec.com。

免責聲明：本文僅作信息交流之目的，文中觀點不代表藥明康德立場，亦不代表藥明康德支持或反對文中觀點。本文也不是治療方案推薦。如需獲得治療方案指導，請前往正規醫院就診。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.