資源描述:
《Logitboost法與累積比數(shù)Logit模型在判別分析中的應用分析.doc》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。
1、Logitboost法與累積比數(shù)Logit模型在判別分析中的應用分析【摘要】 目的:探討Logitboost和累積比數(shù)Logit模型這兩種方法應用于判別分析的優(yōu)缺點。方法:簡要介紹Logitboost和累積比數(shù)Logit模型的原理,并采用此兩種方法分別對同一個實例進行判別分析。結(jié)果:兩種方法的判別正確率均較高。Logitboost判別效果高于累積比數(shù)Logit模型判別。討論:在迭代輪數(shù)適當?shù)那闆r下,Logitboost判別正確率更高,受迭代次數(shù)影響較大;而累積比數(shù)Logit模型的穩(wěn)定性較強。在對事件進行判別時,可根據(jù)數(shù)據(jù)資料的具體特點選用判別方法,也可
2、將兩種方法結(jié)合應用,取其判別效果較好者。【關鍵詞】累積比數(shù)Logit模型判別分析Logitboost 睡眠質(zhì)量 LogitboostandCumulativeOddsLogitModelandTheirApplicationinDiscriminantAnalysis AbstractObjective:TocompareLogitboostwithCumulativeoddslogitmodel,anddiscusstheircharacteristicswhentheyareusedinDiscriminantanalysis.Methods
3、:TheultimateprincipleofLogitboostandCumulativeoddslogitmodelwillbeintroducedinthispaper,andwewillusethetwomethodstosolvethesameproblem.ResultsLogitboost’seffectisbetterthanCumulativeoddslogitmodel.Conclusion:TheeffectofLogitboostwouldbebetterifaappropriateiterationisgiven,inother
4、words,Logitboostisaffectedbyiterationinlargemeasure.ButCumulativeoddslogitmodelisstable.Weshouldchoosethebetteraccordingthedata.KeywordscumulativeoddsLogitmodel;discriminantanalysis;Logitboost;sleepquality 判別分析(discriminantanalysis)是判別樣品所屬類型的一類統(tǒng)計方法,其應用之廣可與回歸分析相媲美。進行判別時,通常是根據(jù)已經(jīng)掌握
5、的一批分類明確的樣品建立判別函數(shù)。從判別準則上分為Fisher判別和Bayes判別,但由于這兩種傳統(tǒng)的判別方法各有利弊,對資料有特定要求,如Fisher判別要求資料服從多元正態(tài)分布,Bayes判別要求已知先驗概率,當不滿足條件時,判別效果往往不理想,給人們的實際工作帶來許多困難。本研究以一個實例簡介Logitboost法和累積比數(shù)Logit模型在判別分析中的應用?! ?原理4 1.1累積比數(shù)Logit模型判別累積比數(shù)Logit模型是二分類Logit模型的擴展,主要用于處理反應變量為有序分類變量的資料。該模型對資料要求不嚴,解釋變量既可以是連續(xù)型變量,也
6、可以是無序分類變量或有序分類變量[1]。只要資料滿足比例優(yōu)勢假定條件(proportionaloddsassumption),即自變量的回歸系數(shù)與分割點無關,且各自變量與Logit P呈線性關系,即可應用此方法。設應變量Y為K個等級的有序變量,第k(k=1,2,…,K)個等級的概率分別為{π1,π2,…,πk},且∑ki=1πk=1。影響因素xT=(x1,x2,…,xP)為自變量,xi(i=1,2,…,p)可以是連續(xù)變量、無序或有序分類變量。則累積比數(shù)Logit模型可以表示為:logit(P(y>k
7、x))=ln(P(y>k
8、x)1-P(y&
9、gt;k
10、x))=-αk+∑pi=1βixi(k=1,2,…,K-1)等價于:P(y≤k
11、x)=11+e(-αk+∑pi=1βixi) 每類結(jié)果的概率:P(y=k
12、x)=P(y≤k
13、x)-P(y≤k-1
14、x)=11+e(-αk+∑pi=1βixi)-11+e(-αk-1+∑pi=1βixi)k=1,2,…K式中,αk和βi為待估參數(shù)。該模型實際上是將K個等級人為地分成{1,…,k}和{k+1,…,K}兩類,在這兩類基礎上定義的LogitP表示屬于前k個等級的累積概率與后K-k個等級的累積概率的比數(shù)之對數(shù)。故該模型稱為累積比數(shù)模型。對于K類反應變量,K-
15、1個累積Logit模型各有一個不同的αk估計,而對于xi,K-1個模型的系數(shù)βi