資源描述:
《疾病發(fā)病情況的時(shí)間序列分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。
1、某市惡性疾病的時(shí)間序列分析摘要:本文對(duì)某市1990~2007年間某惡性疾病的發(fā)病情況進(jìn)行統(tǒng)計(jì),運(yùn)用時(shí)間序列分析,建立ARIMA模型對(duì)該病發(fā)病情況進(jìn)行研究,并對(duì)未來(lái)幾年的發(fā)病情況做出了預(yù)測(cè)。關(guān)鍵字:時(shí)間序列ARIMA,拖尾截尾時(shí)間序列分析的簡(jiǎn)介時(shí)間序列分析(Timeseriesanalysis)是一種動(dòng)態(tài)數(shù)據(jù)處理的統(tǒng)計(jì)方法。該方法基于隨機(jī)過(guò)程理論和數(shù)理統(tǒng)計(jì)學(xué)方法,研究隨機(jī)數(shù)據(jù)序列所遵從的統(tǒng)計(jì)規(guī)律,以用于解決實(shí)際問(wèn)題。時(shí)間序列是把反映現(xiàn)象發(fā)展水平的統(tǒng)計(jì)指標(biāo)數(shù)值,按照時(shí)間先后順序排列起來(lái)所形成的一組統(tǒng)計(jì)數(shù)字序列。時(shí)間序列又稱(chēng)動(dòng)態(tài)數(shù)列或時(shí)間數(shù)列。時(shí)間序列
2、分析就是利用這組數(shù)列,應(yīng)用數(shù)理統(tǒng)計(jì)方法加以處理,以預(yù)測(cè)未來(lái)事物的發(fā)展。時(shí)間序列分析是定量預(yù)測(cè)方法之一,它的基本原理:一是承認(rèn)事物發(fā)展的延續(xù)性。應(yīng)用過(guò)去數(shù)據(jù),就能推測(cè)事物的發(fā)展趨勢(shì)。二是考慮到事物發(fā)展的隨機(jī)性。任何事物發(fā)展都可能受偶然因素影響,為此要利用統(tǒng)計(jì)分析中加權(quán)平均法對(duì)歷史數(shù)據(jù)進(jìn)行處理。該方法簡(jiǎn)單易行,便于掌握,但準(zhǔn)確性差,一般只適用于短期預(yù)測(cè)。時(shí)間序列預(yù)測(cè)一般反映三種實(shí)際變化規(guī)律:趨勢(shì)變化、周期性變化、隨機(jī)性變化。時(shí)間序列分析是根據(jù)系統(tǒng)觀測(cè)得到的時(shí)間序列數(shù)據(jù),通過(guò)曲線擬合和參數(shù)估計(jì)來(lái)建立數(shù)學(xué)模型的理論和方法。時(shí)間序列分析常用在國(guó)民經(jīng)濟(jì)宏觀控
3、制、區(qū)域綜合發(fā)展規(guī)劃、企業(yè)經(jīng)營(yíng)管理、市場(chǎng)潛量預(yù)測(cè)、氣象預(yù)報(bào)、水文預(yù)報(bào)、地震前兆預(yù)報(bào)、農(nóng)作物病蟲(chóng)災(zāi)害預(yù)報(bào)、環(huán)境污染控制、生態(tài)平衡、天文學(xué)和海洋學(xué)等方面。時(shí)間序列分析主要用途:①系統(tǒng)描述。根據(jù)對(duì)系統(tǒng)進(jìn)行觀測(cè)得到的時(shí)間序列數(shù)據(jù),用曲線擬合方法對(duì)系統(tǒng)進(jìn)行客觀的描述。②系統(tǒng)分析。當(dāng)觀測(cè)值取自?xún)蓚€(gè)以上變量時(shí),可用一個(gè)時(shí)間序列中的變化去說(shuō)明另一個(gè)時(shí)間序列中的變化,從而深入了解給定時(shí)間序列產(chǎn)生的機(jī)理。③預(yù)測(cè)未來(lái)。一般用ARMA模型擬合時(shí)間序列,預(yù)測(cè)該時(shí)間序列未來(lái)值。④決策和控制。根據(jù)時(shí)間序列模型可調(diào)整輸入變量使系統(tǒng)發(fā)展過(guò)程保持在目標(biāo)值上,即預(yù)測(cè)到過(guò)程要偏離目標(biāo)時(shí)
4、便可進(jìn)行必要的控制?;静襟E:①用觀測(cè)、調(diào)查、統(tǒng)計(jì)、抽樣等方法取得被觀測(cè)系統(tǒng)時(shí)間序列動(dòng)態(tài)數(shù)據(jù)。②根據(jù)動(dòng)態(tài)數(shù)據(jù)作相關(guān)圖,進(jìn)行相關(guān)分析,求自相關(guān)函數(shù)。相關(guān)圖能顯示出變化的趨勢(shì)和周期,并能發(fā)現(xiàn)跳點(diǎn)和拐點(diǎn)。跳點(diǎn)是指與其他數(shù)據(jù)不一致的觀測(cè)值。如果跳點(diǎn)是正確的觀測(cè)值,在建模時(shí)應(yīng)考慮進(jìn)去,如果是反?,F(xiàn)象,則應(yīng)把跳點(diǎn)調(diào)整到期望值。拐點(diǎn)則是指時(shí)間序列從上升趨勢(shì)突然變?yōu)橄陆第厔?shì)的點(diǎn)。如果存在拐點(diǎn),則在建模時(shí)必須用不同的模型去分段擬合該時(shí)間序列,例如采用門(mén)限回歸模型。③辨識(shí)合適的隨機(jī)模型,進(jìn)行曲線擬合,即用通用隨機(jī)模型去擬合時(shí)間序列的觀測(cè)數(shù)據(jù)。對(duì)于短的或簡(jiǎn)單的時(shí)間序列
5、,可用趨勢(shì)模型和季節(jié)模型加上誤差來(lái)進(jìn)行擬合。對(duì)于平穩(wěn)時(shí)間序列,可用通用ARMA模型(自回歸滑動(dòng)平均模型)及其特殊情況的自回歸模型、滑動(dòng)平均模型或組合ARMA模型等來(lái)進(jìn)行擬合。當(dāng)觀測(cè)值多于50個(gè)時(shí)一般都采用ARMA模型。對(duì)于非平穩(wěn)時(shí)間序列則要先將觀測(cè)到的時(shí)間序列進(jìn)行差分運(yùn)算,化為平穩(wěn)時(shí)間序列,再用適當(dāng)模型去擬合這個(gè)差分序列。ARIMA的三種模型1)建立階自回歸模型:2)建立階移動(dòng)平均模型:3)模型:三個(gè)模型的拖尾、截尾性模型自相關(guān)系數(shù)偏自相關(guān)系數(shù)拖尾階截尾階截尾拖尾拖尾拖尾建模的步驟:平穩(wěn)非白噪聲序列?計(jì)算ACF,PACFARMA模型識(shí)別估計(jì)模型中
6、未知參數(shù)值模型優(yōu)化模型預(yù)測(cè)模型檢驗(yàn)即殘差白噪聲檢驗(yàn)NY圖6.0自回歸滑動(dòng)平均(ARMA)模型建模步驟Y平穩(wěn)化處理N數(shù)據(jù)搜集年度死亡率yearswl199045.12199151.56199259.21199356.68199442.71199561.15199659.71199755.5199859.11199964.93200058.63200165.41200265.5200358.69200464.79200569.11200661.37200772.82對(duì)數(shù)據(jù)進(jìn)行平穩(wěn)化和檢驗(yàn)處理在SAS中,使用Gplot過(guò)程作出swl的時(shí)序圖在sas編輯
7、框輸入procgplotdata=fb;plotswl*year=1;symbolc=redi=joinv=star;run;得到時(shí)序圖為很明顯看出其不是平穩(wěn)序列,故我們要對(duì)其平穩(wěn)化處理。我們?cè)僭趕as編輯框輸入procgplotdata=fb;plotcfswl*year=1;symbolc=redi=joinv=star;run;得出了死亡率一階差分的時(shí)序圖初步判斷基本上符合平穩(wěn)性,下面再對(duì)其進(jìn)行平穩(wěn)性檢驗(yàn)和白噪聲檢驗(yàn),輸入procarimadata=fb;identifyvar=cfswlstationarity=(adf=3)nlag=1
8、2;run;得到用QLB統(tǒng)計(jì)量作的c2檢驗(yàn)結(jié)果表明:差分后的swl序列的QLB統(tǒng)計(jì)量的P值為0.0127(<0.05),故序列為非白噪聲