![]()
在公共衛生監測的漫長時間軸上,我們追蹤著疾病的發生與發展。一個核心問題始終縈繞:疾病的流行趨勢是鐵板一塊,還是分階段、有節奏地演變?一項重大干預措施的實施,是否真的在數據上留下了“印記”?
傳統回歸模型如同一個“一根筋”的畫家,只能用一支畫筆(一條直線或曲線)描繪整個趨勢。
而Joinpoint回歸則是一位“識時務”的大師,它能發現數據中的轉折,用多支畫筆(多條線段)更真實、更精細地還原出疾病流行的動態史詩。本文將從零開始,為你深度解讀這位“大師”的工作原理。
J oinpoint回歸,又名分段線性回歸。其基本思想非常直觀:通過引入一個或多個“連接點”,將整個時間序列分割成若干區間,并對每個區間分別進行線性回歸擬合。
1998年Kim等首次提出Joinpoint回歸模型,該模型的核心思想是根據疾病分布的時間特征建立分段回歸,通過若干連接點將研究時間分割成不同區間,并對每個區間進行趨勢擬合和優化,進而更詳細地評價全局時間范圍內不同區間特異性的疾病變化特征。
Joinpoint回歸模型由美國國立癌癥研究所腫瘤控制與人口科學部開發,在腫瘤發病率和死亡率趨勢研究領域得到廣泛地應用
![]()
如上圖所示,相比于一條直線(全局模型),由Joinpoint生成的折線顯然能更貼切地反映數據在不同時期的變化特征。
每一個拐點,都可能對應著一個重要的公共衛生事件或社會變遷。
![]()
Joinpoint回歸最常用的模型是對數線性模型,因為它能直接輸出具有明確公共衛生意義的指標——年度變化百分比。
對于一個包含 k個連接點的模型,其回歸方程可表示為:
![]()
讓我們來拆解這個看似復雜的方程:
y:因變量,通常是發病率、死亡率等指標。
x:自變量,即時間變量(如年份)。
β?:截距項。
β?:第一個時間區間的斜率(基礎斜率)。
τ? … τ?:模型需要估計的連接點(即拐點發生的具體時間)。
δ? … δ?:斜率的變化量。在連接點 τ?之后,斜率將在 β?的基礎上增加 δ?。
(x - τ?)?:這是一個斷點函數。當x > τ?時,其值為(x - τ?);當x ≤ τ?時,其值為 0。這個函數是實現分段擬合的關鍵。
通俗地講,這個模型就是在說:在第一個連接點 τ?之前,趨勢由 β?決定;過了 τ?點,趨勢就變成了 (β? + δ?);過了 τ?點,趨勢進一步變為 (β? + δ? + δ?),以此類推。
![]()
確定連接點的過程和數量,是Joinpoint回歸的統計精髓,絕非主觀臆斷。
1. 網格搜索法:尋找最優拐點位置
對于可能成為連接點的每一個時間點,模型都會計算其擬合的誤差平方和。網格搜索法就像一張精密的網格,系統性地遍歷所有可能的分段方案,最終選擇那個擬合誤差最小的方案,從而確定連接點的最優位置。
2. 置換檢驗:確定“幾個拐點”最合適——防止過度擬合
是不是連接點越多越好?絕非如此!過多的連接點會使模型過于復雜,甚至去擬合數據中的隨機噪聲(過度擬合)。那么,多少個連接點才是“恰到好處”的呢?
Joinpoint軟件默認采用蒙特卡洛置換檢驗這一穩健的方法來解決這個問題。它的基本流程是:
原假設(H?):模型有 k個連接點就足夠了。
備擇假設(H?):模型需要 k+1個連接點。
檢驗過程:通過數千次(默認4500次)的數據隨機置換(模擬),計算出一個P值。如果P值小于顯著性水平(如0.05),則拒絕原假設,認為增加一個連接點能顯著改善模型擬合效果,然后繼續測試增加下一個連接點的必要性。
這個過程反復進行,直到找到那個“增加連接點也不再帶來顯著改善”的模型為止。這種方法有效避免了人為選擇的主觀性,保證了結果的客觀性。
![]()
模型最終的輸出結果中,最具解讀價值的是兩個指標:
1.第一是年度變化百分比(APC):用于描述每個獨立時間段內的趨勢快慢。其計算公式由對數線性模型的斜率 β?推導而來:
如何判斷趨勢是否顯著?看t檢驗及其P值或者看APC的95%置信區間。如果區間不包含0,則認為該時間段內的上升(APC>0)或下降(APC<0)趨勢具有統計學意義。
2.第二是平均年度變化百分比(AAPC):當整個研究期間存在多個趨勢段時,我們需要一個指標來概括全局的平均變化速度。
AAPC應運而生,它是以各時間段的長度(權重)對各個區間的APC進行加權平均計算得出的:
![]()
AAPC提供了一個簡潔的“整體故事”,便于對不同人群、不同地區或不同時期的長期趨勢進行比較。
![]()
1. 主要應用領域
腫瘤流行病學:評估癌癥發病/死亡率的長期變化,分析篩查項目、新療法引入的效果。
傳染病監測:追蹤疫苗普及后傳染病發病率的變化趨勢。
公共衛生政策評估:驗證控煙、限酒等政策是否在數據上產生“拐點”效應。
2. 重要注意事項
數據要求:時間序列不宜過短,通常需要10年以上的數據,且每個趨勢段內至少應有4-5個數據點,否則模型識別能力會減弱。
關聯≠因果:Joinpoint回歸能提示趨勢變化的可能時間點,并將其與歷史事件關聯,但不能證明因果關系。合理解釋必須結合流行病學背景知識。
模型假設:使用對數線性模型時,默認率的對數與時間呈線性關系,在實際分析中需留意這一假設是否合理。
3.總結
Joinpoint回歸通過其獨特的分段擬合思想和嚴謹的統計檢驗,將我們從對趨勢的籠統認知,帶入到對疾病動態演變的精細化解讀階段。它幫助我們回答的不再僅僅是“總體是升是降”,而是“在什么時候、以何種速度、發生了怎樣的轉變”。
掌握了這些原理,你就拿到了理解Joinpoint回歸的鑰匙。在下一篇文章中,我們將手把手帶你實操美國國家癌癥研究所(NCI)的Joinpoint軟件,從數據準備、參數設置到結果解讀,讓你真正將這一強大工具應用于實際工作之中!敬請期待。
![]()
![]()
編輯:普通疾控人 | 審核:詩酒趁年華
文章來源 | 原創
說明 | 轉載只為分享,如有侵權聯系刪除
?版權聲明 | 部分信息和圖片來自公開網絡
轉載請注明
再次轉載請注明出處
![]()
科普健康 | 宣傳疾控
本號為多位疾控機構從業者運營
重點關注國內外健康事件
致力于疾控科普
在做好科普服務大眾的同時
做好疾控機構的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說明
本文為原創內容,文章為個人理解所學,不涉及疫情信息及內部保密數據,發表的目的為自我總結及給有需求的人士學習使用。如有不妥之處,歡迎聯系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.