資源描述:
《Poisson回歸模型及其應(yīng)用》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、Poisson回歸模型及其應(yīng)用寧波大學(xué)醫(yī)學(xué)院沈其君問題提出隊列研究開放隊列固定(封閉)隊列特點:隨防時間長隨訪中有進(jìn)有出(失訪)影響因素多低發(fā)病率M-H法和標(biāo)準(zhǔn)化法Logistic回歸模型Cox回歸模型Poisson回歸模型Poisson回歸模型的引入回歸分析研究因變量與自變量間關(guān)系分析目的預(yù)測與控制、因素分析與篩選、危險度估計(RR和PAR)Logistic回歸模型因變量為二項分布Poisson回歸模型因變量為Poisson分布,低發(fā)生率的(分組)計數(shù)(離散)資料(如低發(fā)病率或死亡率),自變量可以連續(xù)型或離散型率(發(fā)生數(shù))與因素間關(guān)系—一個實例例Scotto等人對美國北方城市M城和南方D城
2、15歲以上婦女患非黑色素皮癌狀況進(jìn)行調(diào)查,結(jié)果見表13-3,年齡每10歲一層。試用Poisson回歸模型分析年齡效應(yīng)和南北城市的差別。率(發(fā)生數(shù))與因素間關(guān)系—資料結(jié)構(gòu)對于隊列研究資料,設(shè)一個變量為混雜因素(如年齡)分為J層(可以是多個因素交叉形成的層),另一個變量為暴露因素,分為K個水平(可以是多個因素形成的水平)。假如在第j層、第k個暴露水平(j=1,2,…,J;k=1,2,…,K)觀察了njk例(人年),其中有djk例發(fā)?。ɑ蛩劳觯?。形成如表13-1的形式。并可計算觀察發(fā)?。ㄋ劳觯┞驶虬l(fā)病密度。率(發(fā)生數(shù))與因素間關(guān)系—資料結(jié)構(gòu)表中最后一列是第j層的發(fā)病率或發(fā)病密度(對暴露因素求合計)
3、。表中的jk為第j層第k個暴露水平下的發(fā)?。ㄋ劳觯┞驶虬l(fā)病密度的估計值,其真正的發(fā)?。ㄋ劳觯┞驶虬l(fā)病密度為hjk,是層別因素和暴露因素的作用結(jié)果。層別、因素組成設(shè)計陣對于隊列研究資料,將層別和因素交叉分組形成列聯(lián)表資料,這里的層別和因素實際上為有序分類變量資料(等級資料),分析中可以將層別、因素用多個0~1變量表示形成設(shè)計陣(designmatrix)。為敘述方便,假定J=8,K=2,記i為8×2列聯(lián)表格子的順序編號,則設(shè)計陣為表13-2的形式率與協(xié)變量間的回歸模型結(jié)構(gòu)在hjk與層別因素、暴露因素間可通過幾種不同模型結(jié)構(gòu)反映其間的關(guān)系,并通過模型中參數(shù)來反映層別因素、暴露因素的效應(yīng)大小。若用
4、?j表示層別因素第j層的效應(yīng),?k表示暴露因素第k個水平的效應(yīng),則常用的表示hjk與層別、暴露因素間關(guān)系的模型常見的有兩種。加法模型(additivemodel)hjk與層別?j、暴露因素?k間加法模型表示形式為:hjk=?j+?k當(dāng)設(shè)計陣表示資料結(jié)構(gòu)時,率的加法模型為:hi=,p=J+K-1參數(shù)?j和?k可以用觀察數(shù)據(jù)進(jìn)行估計。對于第一暴露水平的基準(zhǔn)組,由于?1=0,則有hj1=?j,或hi=?j。乘法模型(multiplicativemodel)當(dāng)加法模型不成立時,常將率作對數(shù)變換,其形式為:lnhjk=?j+?k或表示為:hjk=exp(?j+?k)=exp(?j)×exp(?k)當(dāng)資
5、料結(jié)構(gòu)以設(shè)計陣形式表示時,率的乘法模型形式為:乘法模型(multiplicativemodel)上述hjk、hi與?j、?k間的模型形式稱為乘法模型。當(dāng)層別與因素間無交互作用時,以k=1為基準(zhǔn)組(exp(?1)=1),而exp(?k)就是第k個暴露水平相對于基準(zhǔn)組的疾病相對危險度。當(dāng)層別與因素間存在交互作用時,只能分層計算第k個水平相對于k=1水平的相對危險度。冪轉(zhuǎn)換模型(powermodel)冪模型的形式為當(dāng)?=1時為加法模型,由于在?=>0時為log(h),即乘法模型,當(dāng)?在0~1時為一簇模型??筛鶕?jù)實際數(shù)據(jù)擬擬合模型的形式。但解釋上不如加法和乘法模型簡單。非線性模型(nonlinear
6、model)對于流行病學(xué)資料,在研究因素與疾病發(fā)生間的關(guān)系時需要鑒別其間的關(guān)系是加法模型還是乘法模型。然而,從經(jīng)驗和實踐的角度,腫瘤等慢性病流行病學(xué)的暴露效應(yīng)很多情況都符合乘法模型。除加法模型和乘法模型外,率與協(xié)變量間可以有非線性形式,需對研究問題深入了解的基礎(chǔ)上來構(gòu)建非線性模型。Poisson回歸模型及其參數(shù)估計Poisson分布條件下回歸模型的似然函數(shù)參數(shù)估計模型擬合度與參數(shù)檢驗Poisson分布下模型的似然函數(shù)對于低發(fā)生(?。┞实拈_放性隊列研究資料,由于di服從Poisson分布,其概率函數(shù)為:其中di是隨機(jī)變量,可取值為di=1,2,…,其期望發(fā)生數(shù)?i=nihi()?;貧w模型的似然
7、函數(shù)為Poisson分布條件下各個格子概率函數(shù)的總概率(積)。L(?)=參數(shù)估計兩側(cè)取對數(shù),回歸模型的對數(shù)似然函數(shù)為:lnL(?)=對數(shù)似然函數(shù)中的未知參數(shù)可以用迭代重復(fù)加權(quán)最小二乘法(簡稱IRLS法)估計,它與通常的極大似然估計結(jié)果一致。也可用極大似然估計法模型擬合度與參數(shù)檢驗—偏差統(tǒng)計量Poisson回歸模型擬合好壞用偏差統(tǒng)計量(deviance)表示,偏差統(tǒng)計量實際上是對數(shù)似然比統(tǒng)計量,它是飽和模型(s