資源描述:
《利用SPSS進行l(wèi)ogistic回歸分析(二元、多項)》由會員上傳分享,免費在線閱讀,更多相關內容在行業(yè)資料-天天文庫。
1、-線性回歸是很重要的一種回歸方法,但是線性回歸只適用于因變量為連續(xù)型變量的情況,那如果因變量為分類變量呢?比方說我們想預測某個病人會不會痊愈,顧客會不會購買產品,等等,這時候我們就要用到logistic回歸分析了。Logistic回歸主要分為三類,一種是因變量為二分類得logistic回歸,這種回歸叫做二項logistic回歸,一種是因變量為無序多分類得logistic回歸,比如傾向于選擇哪種產品,這種回歸叫做多項logistic回歸。還有一種是因變量為有序多分類的logistic回歸,比如病重的程度是高,中,低呀等等,這種回歸也叫累積logistic回歸,或者序次
2、logistic回歸。二值logistic回歸:選擇分析——回歸——二元logistic,打開主面板,因變量勾選你的二分類變量,這個沒有什么疑問,然后看下邊寫著一個協(xié)變量。有沒有很奇怪什么叫做協(xié)變量?在二元logistic回歸里邊可以認為協(xié)變量類似于自變量,或者就是自變量。把你的自變量選到協(xié)變量的框框里邊。細心的朋友會發(fā)現(xiàn),在指向協(xié)變量的那個箭頭下邊,還有一個小小的按鈕,標著a*b,這個按鈕的作用是用來選擇交互項的。我們知道,有時候兩個變量合在一起會產生新的效應,比如年齡和結婚次數綜合在一起,會對健康程度有一個新的影響,這時候,我們就認為兩者有交互效應。那么我們?yōu)榱?/p>
3、模型的準確,就把這個交互效應也選到模型里去。我們在右邊的那個框框里選擇變量a,按住ctrl,在選擇變量b,那么我們就同時選住這兩個變量了,然后點那個a*b的按鈕,這樣,一個新的名字很長的變量就出現(xiàn)在協(xié)變量的框框里了,就是我們的交互作用的變量。然后在下邊有一個方法的下拉菜單。默認的是進入,就是強迫所有選擇的變量都進入到模型里邊。除去進入法以外,還有三種向前法,三種向后法。一般默認進入就可以了,如果做出來的模型有變量的p值不合格,就用其他方法在做。再下邊的選擇變量則是用來選擇你的個案的。一般也不用管它。選好主面板以后,單擊分類(右上角),打開分類對話框。在這個對話框里邊
4、,左邊的協(xié)變量的框框里邊有你選好的自變量,右邊寫著分類協(xié)變量的框框則是空白的。你要把協(xié)變量里邊的字符型變量和分類變量選到分類協(xié)變量里邊去(系統(tǒng)會自動生成啞變量來方便分析,什么事啞變量具體參照前文)。這里的字符型變量指的是用值標簽標注過得變量,不然光文字,系統(tǒng)也沒法給你分析啊。選好以后,分類協(xié)變量下邊還有一個更改對比的框框,我們知道,對于分類變量,spss需要有一個參照,每個分類都通過和這個參照進行比較來得到結果,更改對比這個框框就是用來選擇參照的。默認的對比是指示符,也就是每個分類都和總體進行比較,除了指示符以外還有簡單,差值等。這個框框不是很重要,默認就可以了。點
5、擊繼續(xù)。然后打開保存對話框,勾選概率,組成員,包含協(xié)方差矩陣。點擊繼續(xù),打開選項對話框,勾選分類圖,估計值的相關性,迭代歷史,exp(B)的CI,在模型中包含常數,輸出——在每個步驟中。如--果你的協(xié)變量有連續(xù)型的,或者小樣本,那還要勾選Hosmer-Lemeshow擬合度,這個擬合度表現(xiàn)的會較好一些。繼續(xù),確定。然后,就會輸出結果了。主要會輸出六個表。--第一個表是模型系數綜合檢驗表,要看他模型的p值是不是小于0.05,判斷我們這個logistic回歸方程有沒--有意義。--第二個表示模型匯總表。這個表里有兩個R^2,叫做廣義決定系數,也叫偽R^2,作用
6、類似于線性回歸里的決定系數,也是表示這個方程能夠解釋模型的百分之多少。由于計算方法不同,這兩個廣義決定系數的值往往不一樣,但是出入并不會很大。--在下邊的分類表則表述了模型的穩(wěn)定性。這個表最后一行百分比校正下邊的三個數據列出來在實際值為或者1時,模型預測正確的百分比,以及模型總的預測正確率。一般認為預測正確概率達到百分之五十就是良好(標準真夠低的),當然正確率越高越好。0--在然后就是最重要的表了,方程中的變量表。第一行那個B下邊是每個變量的系數。第五行的p值會告訴--你每個變量是否適合留在方程里。如果有某個變量不適合,那就要從新去掉這個變量做回歸。根據這個表就可
7、以寫出logistic方程了:P=Exp(常量+a1*變量1+a2*變量2.。。。)/(1+Exp(常量+a1*變量1+a2*變量2.。。。))。如果大家學過一點統(tǒng)計,那就應該對這個形式的方程不陌生。提供變量,它最后算出來會是一個介于0和1的數,也就是你的模型里設定的值比較大的情況發(fā)生的概率,比如你想推算會不會治愈,你設0治愈,1--為沒有治愈。那你的模型算出來就是沒有治愈的概率。如果你想直接計算治愈的概率,那就需要更改一下設定,用1去代表治愈。此外倒數后兩列有一個EXP(B),也就是OR值,哦,這個可不是或者的意思,OR值是優(yōu)勢比。在線性回歸里邊我們用標準化系