![]()
系列簡介
這是我們一系列原創(chuàng)技術(shù)貼,從易到難,每天學(xué)習(xí)一點。所有內(nèi)容均為疾控數(shù)據(jù)分析、科研論文相關(guān),或者說很多和現(xiàn)在的熱門監(jiān)測預(yù)警相關(guān),所以我們這個系列就叫“監(jiān)測預(yù)警基礎(chǔ)”。
今天是第5節(jié),今天的內(nèi)容比前面的來說稍微有點往前了,前面幾節(jié)可以說基本都是基本內(nèi)容的系統(tǒng)介紹,今天算是基線和預(yù)警線、行動線的繪制操作。
我們已經(jīng)學(xué)習(xí)了簡單控制圖法和考慮季節(jié)性的簡單移動平均控制圖法,但是這還不夠,我們在監(jiān)測預(yù)警基礎(chǔ)1中就說過,時間序列數(shù)據(jù)除了季節(jié)性,還有一個非常重要的就是趨勢,所以我們這一節(jié)要說的就是同時考慮季節(jié)和長期趨勢的移動平均控制圖,也被稱為回歸移動平均控制圖或季節(jié)調(diào)整控制圖。
![]()
簡單控制圖及其移動平均升級版,威力巨大,但它們有一個重要的前提假設(shè):數(shù)據(jù)是“平穩(wěn)”的——即圍繞一個相對固定的平均水平上下波動。
然而,傳染病的現(xiàn)實數(shù)據(jù)往往是“不聽話”的。
現(xiàn)實的數(shù)據(jù)包括長期趨勢、季節(jié)波動等,數(shù)據(jù)沒有那么簡單,當疾病數(shù)據(jù)不再“簡單”,我們?nèi)绾萎嫵龈珳实念A(yù)警“紅線”?一張圖,不僅要看當下波動,更要讀懂它背后的季節(jié)語言和時代軌跡。
“老師,我用之前的簡單移動平均控制圖做預(yù)警,夏天總是誤報,冬天又可能漏報,這是為什么?”
這個問題,是許多疾控同仁在深入學(xué)習(xí)預(yù)警方法后都會遇到的困惑。前四期,我們從時間序列數(shù)據(jù)講到移動平均,再到簡單控制圖及其升級版——簡單移動平均控制圖,逐步揭開了傳染病監(jiān)測預(yù)警的基礎(chǔ)面紗。
今天,我們將迎來一個重要的能力躍升:讓控制圖學(xué)會“察言觀色”——不僅能捕捉數(shù)據(jù)的瞬間異常,更能理解其背后深刻的季節(jié)節(jié)律和長期走向。
這就是同時考慮季節(jié)和長期趨勢的移動平均控制圖,有時在學(xué)術(shù)上也被稱為回歸移動平均控制圖或季節(jié)調(diào)整控制圖,它是從“簡單預(yù)警”邁向“精準預(yù)警”的關(guān)鍵一步。
![]()
這個方法可以概括為“分解-學(xué)習(xí)-重建”三步走策略,我們用一個最常見的案例來拆解:如何預(yù)測明年每周的發(fā)病數(shù),并畫出其預(yù)警線。
第一步,分解
首先,我們擁有過去5年每周的發(fā)病數(shù)據(jù),目標是先“看懂”這段歷史,用一條直線回歸方程去擬合這5年的數(shù)據(jù),這條傾斜的直線,就捕捉了疾病逐年緩慢增加或減少的長期力量,從數(shù)據(jù)中減去這條趨勢線,我們就得到了“去趨勢數(shù)據(jù)”,具體來說就是以下3個操作步驟:
第1步:以周次作為X軸,5年就是第1周到第260周,每周病例數(shù)作為Y周繪制散點圖,然后選擇畫出線性回歸的趨勢性并顯示回歸方程。
第2步:將周次帶入回歸方程中的X就可以算出Y,此時的Y就是每周的線性方程擬合值。
第3步:計算殘差:殘差=觀測值-擬合值,從數(shù)據(jù)中減去這條趨勢線,我們就得到了“去趨勢數(shù)據(jù)”。
![]()
第二步,對殘差進行分析并設(shè)置殘差閾值
剩下的“去趨勢數(shù)據(jù)”主要包含季節(jié)性波動和隨機噪音。我們計算每年同一周數(shù)據(jù)的平均值,或用前后擺動2周的移動平均進行平滑,就能得到一條光滑的、代表典型季節(jié)性高低的“季節(jié)曲線”,這條曲線,就是疾病在一年中的“節(jié)律指紋”,這就是所謂的提取數(shù)據(jù)的季節(jié)規(guī)律,具體來說就是以下3個操作步驟:
第1步:計算5年同時前后擺動2周的殘差移動平均值,如上圖,這是一條光滑的、代表典型季節(jié)性高低的“季節(jié)曲線”。這條曲線,就是疾病在一年中的“節(jié)律指紋”。
第2步:和殘差移動平均值同理,計算計算5年同時前后擺動2周的殘差標準差。
![]()
第3步:接下來,我們設(shè)置殘差的閾值,比如,可以用“殘差均值 ± 1.96倍殘差標準差”和“殘差均值±2.58倍殘差標準差”分別劃定出殘差的預(yù)警限和行動限。這相當于為“不可預(yù)測的波動”本身,建立了一套固定的、統(tǒng)計學(xué)的異常判定標準。
![]()
第三步,繪制未來的預(yù)警控制圖
現(xiàn)在,我們要預(yù)測和監(jiān)控新的一年(比如2015年)。
第1步:預(yù)測基準線:將第一步得到的趨勢線延長到2025年,周次相應(yīng)的從260周開始到312周作為X,通過直線回歸擬合方程得到Y(jié),就是2025年的回歸擬合值,或者可以說是2025年的每一周的“趨勢預(yù)測值”。
第2步:殘差=觀測值-擬合值,那么,就可以用擬合值+殘差,就可以得到2025年每一周的期望值,或者叫2025年的基線。好,我們再理解以下,通過回歸得到的2025年的擬合值只考慮了趨勢,沒有季節(jié)性,而疊加上從歷史中學(xué)習(xí)到的“季節(jié)曲線”,兩者相加,就生成了2015年每一周的“預(yù)期基線”。這條基線不是平的,而是自帶趨勢和季節(jié)起伏的“智能基線”。
![]()
第3步:繪制圖,基線就是我們上一步算出來的擬合值+殘差,然后再繪制閾值線,閾值線根據(jù)自己得實際情況繪制,比如我們在這舉例繪制2條,一條預(yù)警線,一條行動線。預(yù)警線就是擬合值+前面設(shè)置殘差預(yù)警線,殘差預(yù)警線怎么算我們前面說過就是“殘差均值 ± 1.96倍殘差標準差”。行動線就是擬合值+前面設(shè)置殘差行動線,殘差行動線怎么算我們前面也說過就是“殘差均值±2.58倍殘差標準差”。
![]()
這樣,我們就得到了兩條與基線“同起伏、共進退”的動態(tài)預(yù)警線和行動線。至此,一張同時考慮了長期趨勢和季節(jié)性的移動平均控制圖就誕生了。
![]()
![]()
編輯:普通疾控人 | 審核:詩酒趁年華
文章來源 | 原創(chuàng)
說明 | 轉(zhuǎn)載只為分享,如有侵權(quán)聯(lián)系刪除
?版權(quán)聲明 | 部分信息和圖片來自公開網(wǎng)絡(luò)
轉(zhuǎn)載請注明
再次轉(zhuǎn)載請注明出處
![]()
科普健康 | 宣傳疾控
本號為多位疾控機構(gòu)從業(yè)者運營
重點關(guān)注國內(nèi)外健康事件
致力于疾控科普
在做好科普服務(wù)大眾的同時
做好疾控機構(gòu)的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說明
本文為原創(chuàng)內(nèi)容,文章為個人理解所學(xué),不涉及疫情信息及內(nèi)部保密數(shù)據(jù),發(fā)表的目的為自我總結(jié)及給有需求的人士學(xué)習(xí)使用。如有不妥之處,歡迎聯(lián)系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.