![]()
系列簡(jiǎn)介
這是我們一系列原創(chuàng)技術(shù)貼,從易到難,每天學(xué)習(xí)一點(diǎn)。所有內(nèi)容均為疾控?cái)?shù)據(jù)分析、科研論文相關(guān),或者說(shuō)很多和現(xiàn)在的熱門(mén)監(jiān)測(cè)預(yù)警相關(guān),所以我們這個(gè)系列就叫“監(jiān)測(cè)預(yù)警基礎(chǔ)”。
今天是第16節(jié),內(nèi)容是另外一種季節(jié)指數(shù)的計(jì)算方式。
上一篇介紹的基礎(chǔ)季節(jié)指數(shù)法有個(gè)致命前提:數(shù)據(jù)沒(méi)有明顯的長(zhǎng)期趨勢(shì)。
![]()
現(xiàn)實(shí)場(chǎng)景當(dāng)當(dāng)數(shù)據(jù)存在長(zhǎng)期趨勢(shì)時(shí),用簡(jiǎn)單的“同月平均/總平均”來(lái)計(jì)算季節(jié)指數(shù)會(huì)失真。這是因?yàn)殚L(zhǎng)期趨勢(shì)會(huì)“污染”季節(jié)指數(shù)的計(jì)算。
具體來(lái)說(shuō),如果數(shù)據(jù)有上升趨勢(shì),那么后期月份的數(shù)值普遍較高,前期月份的數(shù)值普遍較低。
這樣,在計(jì)算同月平均時(shí),后期的高值會(huì)拉高該月份的平均值,而前期的低值會(huì)拉低該月份的平均值。但注意,由于趨勢(shì)的存在,同月平均實(shí)際上包含了趨勢(shì)的影響,而總平均也是包含趨勢(shì)的。
然而,季節(jié)指數(shù)應(yīng)該只反映季節(jié)性波動(dòng),不應(yīng)該包含趨勢(shì)成分。
所以,我們需要一種方法將趨勢(shì)從數(shù)據(jù)中剔除,然后再計(jì)算季節(jié)指數(shù)。![]()
移動(dòng)平均趨勢(shì)剔除法的本質(zhì)是:先通過(guò)移動(dòng)平均估計(jì)趨勢(shì)成分,然后從原始數(shù)據(jù)中剔除趨勢(shì),得到季節(jié)成分和隨機(jī)成分的混合,最后通過(guò)平均來(lái)消除隨機(jī)成分,得到純季節(jié)成分。具體步驟的數(shù)學(xué)含義如下:
第一,計(jì)算12個(gè)月移動(dòng)平均:因?yàn)榧竟?jié)周期是12個(gè)月,所以用12個(gè)月的平均可以消除季節(jié)性,得到趨勢(shì)成分(T)和部分隨機(jī)成分(I)。注意,移動(dòng)平均的期數(shù)必須等于季節(jié)周期長(zhǎng)度,這樣才能完全消除季節(jié)性。
第二,中心化移動(dòng)平均:由于12是偶數(shù),12個(gè)月移動(dòng)平均值對(duì)應(yīng)的時(shí)間點(diǎn)是中間兩個(gè)月的中間點(diǎn)(比如第6和第7個(gè)月之間,即6.5),而我們的數(shù)據(jù)是月度數(shù)據(jù),所以需要將兩個(gè)連續(xù)的移動(dòng)平均再平均,將其對(duì)齊到具體的月份(比如第7個(gè)月)。這樣得到的中心移動(dòng)平均(CMA)就是趨勢(shì)成分(T)的一個(gè)估計(jì)。
第三,計(jì)算比值(原始值/中心移動(dòng)平均):原始數(shù)據(jù)(Y)可以分解為趨勢(shì)(T)、季節(jié)(S)和隨機(jī)(I)成分。在乘法模型中,Y = T × S × I。我們用CMA估計(jì)了T,那么Y / CMA = (T × S × I) / T = S × I。這個(gè)比值就是季節(jié)成分和隨機(jī)成分的混合。
第四,計(jì)算同月平均比值:對(duì)每年的同一月份的比值求平均,可以消除隨機(jī)成分(因?yàn)殡S機(jī)成分的期望為0,或者假設(shè)隨機(jī)成分的均值為1),得到純季節(jié)成分(S)的估計(jì)。
第五,調(diào)整季節(jié)指數(shù):由于每個(gè)月的季節(jié)指數(shù)是相對(duì)于趨勢(shì)的比值,我們希望全年的季節(jié)指數(shù)平均值為1(或總和為12,對(duì)應(yīng)12個(gè)月)。所以通過(guò)調(diào)整系數(shù),使得12個(gè)月的季節(jié)指數(shù)總和為12,即平均值為1。
這樣,我們就得到了剔除趨勢(shì)后的季節(jié)指數(shù),它反映了在排除長(zhǎng)期趨勢(shì)后,各月份相對(duì)于趨勢(shì)的平均波動(dòng)幅度。
為什么這種方法能更準(zhǔn)確地反映季節(jié)性?因?yàn)樗谟?jì)算季節(jié)指數(shù)之前,先去除了長(zhǎng)期趨勢(shì)的影響。這樣,無(wú)論數(shù)據(jù)是上升還是下降趨勢(shì),計(jì)算出來(lái)的季節(jié)指數(shù)都只反映季節(jié)性的相對(duì)強(qiáng)度,而不受趨勢(shì)干擾。
![]()
基本步驟說(shuō)明如下:
第一,計(jì)算移動(dòng)平均值(如果是季度數(shù)據(jù),則采用4項(xiàng)移動(dòng)乎均,月份數(shù)據(jù)則采用12項(xiàng)移動(dòng)平均),并對(duì)其結(jié)果進(jìn)行中心化處理,也就是將移動(dòng)平均的結(jié)果再進(jìn)行一次二項(xiàng)移動(dòng)平均,即得出中心化移動(dòng)平均值(CMA).
第二,計(jì)算移動(dòng)平均的比值,也稱(chēng)為季節(jié)比率,即將序列的各觀察值除以相應(yīng)的中心化移動(dòng)平均值,然后計(jì)算出各比值的季度(或月份)平均值。
第三,季節(jié)指數(shù)調(diào)整。由于各季節(jié)指數(shù)的平均數(shù)應(yīng)等于1或100%,若根據(jù)第2步計(jì)算的季節(jié)比率的平均值不等于1,則需要進(jìn)行調(diào)整。具體方法是將第2步計(jì)算的每個(gè)季節(jié)比率的平均值除以它們的總平均值。
下面通過(guò)實(shí)際例子說(shuō)明季節(jié)指數(shù)的計(jì)算過(guò)程,有一份2020-2025年每月病例數(shù)的例子,操作步驟如截圖所示:
![]()
我們?cè)偻ㄟ^(guò)畫(huà)圖理解一下這幾個(gè)數(shù)據(jù)和操作,就很清楚了:
![]()
紅色線(病例數(shù)):原始序列 Y = T × S × I
綠色線(CMA):趨勢(shì)成分 T
紫色線(比值):季節(jié)+隨機(jī)成分 S × I
藍(lán)色線(季節(jié)指數(shù)):純凈季節(jié)成分 S
![]()
![]()
編輯:普通疾控人 | 審核:詩(shī)酒趁年華
文章來(lái)源 | 原創(chuàng)
說(shuō)明 | 轉(zhuǎn)載只為分享,如有侵權(quán)聯(lián)系刪除
?版權(quán)聲明 | 部分信息和圖片來(lái)自公開(kāi)網(wǎng)絡(luò)
轉(zhuǎn)載請(qǐng)注明
再次轉(zhuǎn)載請(qǐng)注明出處
![]()
科普健康 | 宣傳疾控
本號(hào)為多位疾控機(jī)構(gòu)從業(yè)者運(yùn)營(yíng)
重點(diǎn)關(guān)注國(guó)內(nèi)外健康事件
致力于疾控科普
在做好科普服務(wù)大眾的同時(shí)
做好疾控機(jī)構(gòu)的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說(shuō)明
本文為原創(chuàng)內(nèi)容,文章為個(gè)人理解所學(xué),不涉及疫情信息及內(nèi)部保密數(shù)據(jù),發(fā)表的目的為自我總結(jié)及給有需求的人士學(xué)習(xí)使用。如有不妥之處,歡迎聯(lián)系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號(hào)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.