資源描述:
《廣義線性模型_三_.pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、廣義線性模型(三)51 文章編號(hào):1002—1566(2003)01—0051—07廣義線性模型(三)陳希孺(中國科學(xué)院研究生院,北京 100039)摘 要:本講座是廣義線性模型這個(gè)題目的一個(gè)比較系統(tǒng)的介紹。主要分3部分:建模、統(tǒng)計(jì)分析與模型選擇和診斷。寫作時(shí)依據(jù)的主要參考資料是L.Fahrmeir等人的《MultivariateStatisticalModelingBasedonGeneralizedLinearModels》。關(guān)鍵詞:廣義線性模型;建模;統(tǒng)計(jì)分析;模型選擇和診斷中圖分類號(hào):O212文獻(xiàn)標(biāo)識(shí)碼:AGeneralizedlinearmodelsCHENXi2ru(
2、GraduateSchoolofChineseAcademiaofScience,Beijing100039,China)Abstract:Thissetofarticlesgivesanintroductiontogeneralizedlinearmodels.Theycanbedividedintothreeparts:Modelbuilding,StatisticalinferenceandModeldiagnostics.ThepresentationismainlybasedonL.Fahrmeiretal.《MultivariateStatisticalModeling
3、BasedonGeneralizedLinearModels》.Keywords:generalizedlinearmodels;modelbuilding;statisticalinference;modeldiagnostics(四)狀態(tài)有序的情況在旅行交通工具的例中,火車、汽車、輪船、飛機(jī)等狀態(tài),可以認(rèn)為是“無序”的。一則因?yàn)閷?duì)其優(yōu)劣次序的看法因人而異,二則即使同一個(gè)人,在不同情況下的排序也不同。在有些問題中,目標(biāo)狀態(tài)有公認(rèn)的優(yōu)劣次序,如病情分1、2、3期,產(chǎn)品品質(zhì)分1、2、3和等外等等級(jí),都是公認(rèn)的由好到不好的次序。注意:即使在這種場(chǎng)合,其序號(hào)(1,2,?)也無數(shù)量意義。
4、 例1.7呼吸測(cè)驗(yàn):目標(biāo)Y分3狀態(tài):正常、邊緣、不正結(jié)果(人數(shù))年齡吸煙史常。自變量2個(gè):年齡,分〈40和40-59兩級(jí),吸煙史:分正常邊緣不正?!皬牟晃鼰煛?、“以前級(jí)”、“現(xiàn)在吸”3級(jí),數(shù)據(jù):從不吸577277〈40以前吸192203例1.8找工作前景的調(diào)查現(xiàn)在吸6824611調(diào)查某大學(xué)心理系即將畢業(yè)的學(xué)生對(duì)照工作前景的預(yù)從不吸16440期反應(yīng)分3種:1.不預(yù)期能找到合適工作。2.不清楚。3.40-59以前吸145157預(yù)期畢業(yè)后可立即找到工作。數(shù)據(jù):現(xiàn)在吸2454727大多數(shù)有序模型是按下述機(jī)制產(chǎn)生:有一個(gè)(或幾個(gè),此處只考慮一個(gè)的情形)明顯或潛在的變量U及門限-∞=θ0<θ1
5、<θk-1<θk=∞,而定Y=r,當(dāng)且僅當(dāng)θr-16、的目的與前面一樣,使為考察一些因素(自變量)對(duì)Y值的影216192響。例如學(xué)生考試的成績(jī)等級(jí),與其努力程度、學(xué)習(xí)方法、教師講課質(zhì)2216323273量與考題質(zhì)量等等因素的關(guān)系。24175設(shè)25003U=-x′β+e(1.71)26010x為自變量,即認(rèn)定樣品的“得分”U與其因素值x(x可能用其產(chǎn)27021生的z(x)代替,見前)的關(guān)系,有線性模型的形式。e為隨機(jī)誤差———29100例如,一貫努力且資質(zhì)不錯(cuò)的學(xué)生在一次考試中也可能得低分,e的分3000231010布函數(shù)記為F。F為積累分布而(1.71)為線性模型,故有時(shí)把(1.70)+34010(1.71)稱為“積累線性模型”。顯然
7、。P(YFr
8、x)=P(UFθr
9、x)=P(eFθr+x′β)=F(θr+x′β)(1.72) 對(duì)F不同的選擇,得出不同的模型:1.Logistic分布模型:ttexp(θr+x′β)F(t)=e/(1+e)]P(YFr
10、x)=(1.73)1+exp(θr+x′β) 有P(YFr
11、x)P(YFr
12、x)θr+x′βlog=θr+x′β,log=e(1.74)P(Y>r
13、x)P(Y>r
14、x) 由(1.74)推出:對(duì)兩組不同的x值x1和x2,有P(YFr
15、x1)P(Y