![]()
從今天開始,我們專注發(fā)一系列的技術(shù)貼!
從易到難,每天學(xué)習(xí)一點(diǎn),所有內(nèi)容均為疾控?cái)?shù)據(jù)分析、科研論文相關(guān),或者說很多和現(xiàn)在的熱門監(jiān)測(cè)預(yù)警相關(guān),所以我們這個(gè)這個(gè)系列就叫“監(jiān)測(cè)預(yù)警基礎(chǔ)”。
作為疾控工作者或者公衛(wèi)人,我們經(jīng)常聽到時(shí)間序列數(shù)據(jù)分析。那么,究竟什么是時(shí)間序列數(shù)據(jù)?我們一般會(huì)如何分析它呢?
今天一探究竟
![]()
![]()
時(shí)間序列數(shù)據(jù)是按照時(shí)間順序收集、記錄的一系列觀測(cè)值,其中時(shí)間是一個(gè)關(guān)鍵維度,其核心價(jià)值在于利用歷史中的時(shí)間模式來理解現(xiàn)在、預(yù)測(cè)未來。
在疾控領(lǐng)域,時(shí)間序列數(shù)據(jù)就可以理解為時(shí)間序列數(shù)據(jù)是按照固定時(shí)間間隔收集的、反映疾病發(fā)生、發(fā)展及防控效果的一系列觀測(cè)值,時(shí)間順序具有明確的流行病學(xué)意義。比如大疫情的發(fā)病數(shù)據(jù)、比如ILI%這樣的監(jiān)測(cè)數(shù)據(jù)、比如防控措施數(shù)據(jù)以及每日溫濕度等其他相關(guān)因素?cái)?shù)據(jù)。
時(shí)間序列數(shù)據(jù)最本制度的特征是時(shí)間依賴性,也就是說相鄰觀測(cè)值之間存在相關(guān)性,現(xiàn)在的值受過去值的影響,這也是與橫截面數(shù)據(jù)最本質(zhì)的區(qū)別
![]()
![]()
時(shí)間序列通常由以下4個(gè)組成部分構(gòu)成。
第一、趨勢(shì):指時(shí)間序列在較長(zhǎng)一段時(shí)間內(nèi)呈現(xiàn)出來的持續(xù)向上或者持續(xù)向下的變動(dòng)
第二、季節(jié)性:在一年內(nèi)重復(fù)出現(xiàn)的周期性波動(dòng),如氣候條件、生產(chǎn)條件、節(jié)假日等
第三、周期性:一年以上的非固定周期的波動(dòng)。
第四、不規(guī)則波動(dòng):也就是殘差,指除去趨勢(shì)、季節(jié)性、周期性外的隨機(jī)波動(dòng)、隨機(jī)噪音,核心是 “無規(guī)律、突發(fā)且影響小”。不規(guī)則波動(dòng)通常總是夾雜在時(shí)間序列中,致使時(shí)間序列產(chǎn)生一種波浪形或震蕩式的變動(dòng)。只含有隨機(jī)波動(dòng)的序列也稱為平穩(wěn)序列。
一句話總結(jié):時(shí)序數(shù)據(jù) = 趨勢(shì)(長(zhǎng)期方向) + 季節(jié)(固定短周期波動(dòng)) + 周期(長(zhǎng)期循環(huán)波動(dòng),有大致范圍) + 殘差(隨機(jī)小波動(dòng))。也不定包括全部4部分,比如平穩(wěn)數(shù)據(jù)只有 “殘差波動(dòng)”,趨勢(shì)型數(shù)據(jù)是 “趨勢(shì) + 殘差波動(dòng)”。
![]()
![]()
時(shí)間序列數(shù)據(jù)可以用數(shù)學(xué)模型分解
第一種方式:加法模型。當(dāng)趨勢(shì)和季節(jié)性變化獨(dú)立作用時(shí),季節(jié)性波動(dòng)的幅度不隨時(shí)間變化時(shí),加法模型是合適的。
![]()
Y?:時(shí)間t的觀測(cè)值
T?:趨勢(shì)成分
S?:季節(jié)成分
C?:周期成分
I?:不規(guī)則成分
第二種方式:乘法模型。當(dāng)季節(jié)性效應(yīng)的大小取決于趨勢(shì)的大小、季節(jié)性波動(dòng)的幅度隨趨勢(shì)增長(zhǎng)而變化時(shí),采用乘法模型。
![]()
作為疾控人,其實(shí)我們接觸最多的時(shí)間序列數(shù)據(jù)就是發(fā)病數(shù)據(jù),其實(shí)相應(yīng)的,對(duì)于發(fā)病數(shù)據(jù)可以進(jìn)行更詳細(xì)的分解,如下所示:
![]()
至于以上數(shù)據(jù)模型分解有什么意義,在這先不做詳細(xì)解釋,后面在我們介紹時(shí)間序列數(shù)據(jù)的分析中自然會(huì)講到,在這只需要有個(gè)初步概念就行。
![]()
我們一般會(huì)使用時(shí)間序列數(shù)據(jù)做以下分析:
第一、描述分析:比如采用時(shí)序圖進(jìn)行可視化分析,識(shí)別趨勢(shì)、季節(jié)性,計(jì)算基本統(tǒng)計(jì)量 。
第二、分解分析:分離趨勢(shì)、季節(jié)、周期、隨機(jī)成分單獨(dú)分析,比如季節(jié)指數(shù)計(jì)算、或者趨勢(shì)的各種簡(jiǎn)單或者復(fù)雜的預(yù)警模型等。
第三、預(yù)測(cè)分析:基于歷史數(shù)據(jù)預(yù)測(cè)未來,比如采用傳統(tǒng)時(shí)間序列模型ARIMA模型、指數(shù)平滑等。
第四、因果關(guān)系分析:分析變量間的領(lǐng)先滯后關(guān)系、格蘭杰因果檢驗(yàn)等。
也是一樣,在實(shí)際例子中具體如何操作和使用,在后續(xù)的分析推文中我們會(huì)講解到。
![]()
![]()
編輯:普通疾控人 | 審核:詩(shī)酒趁年華
文章來源 | 原創(chuàng)
說明 | 轉(zhuǎn)載只為分享,如有侵權(quán)聯(lián)系刪除
?版權(quán)聲明 | 部分信息和圖片來自公開網(wǎng)絡(luò)
轉(zhuǎn)載請(qǐng)注明
再次轉(zhuǎn)載請(qǐng)注明出處
![]()
科普健康 | 宣傳疾控
本號(hào)為多位疾控機(jī)構(gòu)從業(yè)者運(yùn)營(yíng)
重點(diǎn)關(guān)注國(guó)內(nèi)外健康事件
致力于疾控科普
在做好科普服務(wù)大眾的同時(shí)
做好疾控機(jī)構(gòu)的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說明
本文為原創(chuàng)內(nèi)容,文章為個(gè)人理解所學(xué),不涉及疫情信息及內(nèi)部保密數(shù)據(jù),發(fā)表的目的為自我總結(jié)及給有需求的人士學(xué)習(xí)使用。如有不妥之處,歡迎聯(lián)系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號(hào)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.