資源描述:
《R軟件-醫(yī)學統(tǒng)計分析-有序logistic回歸.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、統(tǒng)計學進展/累積logisitic回歸模型/曾慶1累積logisitic回歸模型一、理論(一)模型定義假設(shè)結(jié)局變量Y有J個有序分類,其自然結(jié)局順序表示為Y=1,2,...,J,每個分類(結(jié)局)的對應(yīng)發(fā)生概率是π1,π2,...,πJ,則其有序分類小于等于j的累積發(fā)生概率表示為P(Y≤j)=π1+π2+...+πj,因此可以通過指定累積概率P(Y≤j)的閾值將整個結(jié)局變量Y的J個有序分類從該指定閾值點截斷,使之成為二項結(jié)局分類。另外有p個自變量記為X=(x1,x2,…,xp),表示相應(yīng)的影響因素(定性、定量均可)。由此定義累積log
2、it(Y≤j)函數(shù):P(y≤j
3、x)P(y≤j
4、x)π1+π2+...+πjlogit[P(y≤j)]=ln=ln=ln1?P(y≤j
5、x)P(y>j
6、x)π+π+...+πj+1j+2J該累積logit(Y≤j)函數(shù)是兩個累積概率比的對數(shù)值,它測定了結(jié)局變量Y小于等于分類j或者大于分類j的可能性大小。因為有J個有序分類結(jié)局,所以實際上可以寫出至多J-1個的累積logit函數(shù)。?P(y≤
7、1x)P(y≤
8、1x)π1logit[P(y≤1)]=ln=ln=ln?1?P(y≤
9、1x)P(y>
10、1x)π+...+π?j+2J?J?1個?
11、L?P(y≤J?
12、1x)P(y≤J?
13、1x)π+π+...+π?12J?1logit[P(y≤J?1)]=ln=ln=ln??1?P(y≤J?
14、1x)P(y>J?
15、1x)πJ將每個累積logit函數(shù)用線性函數(shù)的形式表示為?logit[P(y≤1)]=β10+β11X1+...+β1pXp?J?1個?L?logit[P(y≤J?1)]=β+βX+...+βX?j?0,1j?1,11j?,1pp該模型就是累積logistic回歸模型(cumulativelogitmodel)。對應(yīng)的概率模型形式是exp(β+βX+...+βX)j0j
16、11jppP(y≤j)=1?exp(β+βX+...+βX)j0j11jpp為簡化上述模型,進一步假定對于所有J-1個累積logit函數(shù),各個自變量Xi所對應(yīng)的回歸系數(shù)βi都是相等的。即對每一個累積logit函數(shù)各有一個不同的截距βj0,然而對所有的累積logit函數(shù),自變量Xi卻有一個相同的βi。在此假設(shè)條件下,不同累積logit的回歸線相互平行,只是截距βj0不同,這稱為成比例發(fā)生比假設(shè)或平行線假設(shè)。滿足平行線假設(shè)的模型簡化后的是plogit[P(y≤j)]=βj0+β1X1+...+βpXp=βj0+∑βiXii=1?log
17、it[P(y≤1)]=β10+β1X1+...+βpXp?寫成系列模型則是?L?logit[P(y≤J?1)]=β+βX+...+βX?J?0,111pp該簡化后的模型就稱為成比例比數(shù)比累積logit模型(proportional-oddscumulativelogit統(tǒng)計學進展/累積logisitic回歸模型/曾慶2model)。該模型有J?1截距,p個回歸系數(shù),共J+p?1個回歸系數(shù)。一般認為累積logistic回歸模型就是成比例比數(shù)比累積logit模型。對應(yīng)的概率模型形式是exp(βj0+β1X1+...+βpXp)1P(y
18、≤j)==1+exp(β+βX+...+βX)1+exp[?(β+βX+...+βX)]j011ppj011pp使用成比例比數(shù)比累積logit模型首先需要對平行線假設(shè)進行檢驗。如果平行假設(shè)被拒絕,便說明自變量Xi對不同的logit有不同的βi,因而說明成比例比數(shù)比累積logit模型不適合,需要采用其他模型來進行資料的分析。(二)似然函數(shù)和對數(shù)似然函數(shù)對于有n個獨立觀察對象的樣本,第i個觀察對象Xi出現(xiàn)獲得Y=j分類結(jié)局的概率記作Pj=P(Y=j
19、Xi),它是累積概率函數(shù)的差,即Pj=P(Y=j
20、Xi)=P(Y≤j
21、Xi)-P(Y≤
22、j-1
23、Xi)。由此構(gòu)造似然函數(shù)L為:nnJnJL=Pyi1Pyi2LPyiJ=Pyij=PY≤jXPY≤jXyij∏(i1i2iJ)∏∏(ij)∏∏[(
24、i-)(
25、1-i)]i=1i=1j=1i=1j=1式中yij表示第i個觀察對象自變量(探索變量)取值Xi時已觀察到結(jié)局變量Y=j等級J時所對應(yīng)的編碼,它滿足∑yij=1,即只有一個yij取值為1(屬于該類),其余均為0。j=1相應(yīng)的對數(shù)似然函數(shù)LL為nJnJLL=∑∑yijln(Pij)=∑∑yijln[logit(Pij)?logit(Pi,j?1)]i=1j=1i=1j=1
26、二、實例分析【實例1】現(xiàn)有資料如表1所示,試使用累積Logistic回歸模型考察工作滿意度與性別、收入水平之間的關(guān)系。表1不同性別及收入水平人群的滿意度情況性別收入水平滿意度(人)(y)(gender)(income)非常不滿稍微滿意比較滿意非常滿