資源描述:
《講稿多元分析jg》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、底用3?素含祈簡介MULTIFACTORIALANALYSISINMEDICALRESEARCH目前,在醫(yī)學(xué)科研中大家最熟悉和最常用的一些統(tǒng)計(jì)方法,如:t檢驗(yàn)、u檢驗(yàn)、卡方檢驗(yàn).秩和檢驗(yàn)等,均屬于單因素分析方法。這些單因素的分析方法是單獨(dú)地研究每個因素對結(jié)果的影響,往往會把具有聯(lián)合作用的因素忽略掉,而有些因素雖然對結(jié)果有單獨(dú)的作用,但其作用可被其他多個因素的聯(lián)合作用所代替,而在聯(lián)合作用中它又是多余的。因此,單因素分析具有一定的局限性。如果某個結(jié)果因素受多個因素的影響,這多個因素對結(jié)果因素的作用表現(xiàn)為聯(lián)合作用中的貢獻(xiàn),因此,要想
2、分析多個因素對結(jié)果的單獨(dú)作用和對結(jié)果的聯(lián)合作用時,應(yīng)使用多因素分析方法。多因素分析與單因素分析相比較,是更為全面的統(tǒng)計(jì)分析方法。從臨床科研的角度來看,臨床科研的任何因果效應(yīng)往往受多種因素的綜合影響。因此,單因素分析常受因素間混雜干擾而難獲得真實(shí)的結(jié)果。多因素分析則可獲得更為全而真實(shí)的結(jié)論,本節(jié)將從臨床科研實(shí)用角度予以介紹。1.多因素分析的主要目的(1)研究因素間的依存關(guān)系:這種分析是多個因素與一個結(jié)果之間關(guān)系的研究,即研究多個自變量對應(yīng)變量的作用,或結(jié)果變量依賴于多個因素的變化而變化的規(guī)律。如:在高血壓的研究中,患者的血壓是結(jié)
3、果,而與之有關(guān)的指標(biāo),如年齡.性別.家族史等都是其影響因素,通過多因素分析得到患者血壓隨各個因素變化而升高或降低的依存關(guān)系。(2)研究因素間的相互關(guān)系:這種研究是對非因果關(guān)系的研究,即所研究的多個因素間并無明確的原因與結(jié)果間的聯(lián)系,各因素間是平等和彼此影響的關(guān)系。2.多因素分析在醫(yī)學(xué)科研中的主要用途(1)研究多個因素間依存關(guān)系的統(tǒng)計(jì)方法主要有:多元線性回歸、多元逐步回歸、Logistic回歸.Cox回歸、判別分析等。其分析結(jié)果可用于解釋各個因素對結(jié)果的作用大小和方向,還可以用各因素的值來估計(jì)或預(yù)測結(jié)果的值。在醫(yī)學(xué)科研中,這類方
4、法常用于疾病的計(jì)量診斷、疾病的預(yù)后估計(jì)、疾病的預(yù)報(bào)、疾病的病因?qū)W分析、疾病危險(xiǎn)因素的尋找.患者治療后的生存分析、多元正常值范圍等。(1)研究多個因素間相互關(guān)系的多因素統(tǒng)計(jì)方法主要有:聚類分析、主成分分析、因子分析和典型相關(guān)分析等。其分析結(jié)果主要用于描述多個指標(biāo)相互之間的數(shù)量關(guān)系。在醫(yī)學(xué)科研中,這類方法常用于多個醫(yī)學(xué)指標(biāo)的分類與篩選、兩群多個醫(yī)學(xué)指標(biāo)間的關(guān)系分析、尋找能反映多個醫(yī)學(xué)指標(biāo)的綜合指標(biāo)。1.多因素分析對資料的要求(1)對資料分布的要求:多因素分析一般都要求資料從總體上服從多元正態(tài)分布。但在實(shí)際工作中,這個要求很難滿足,
5、加之用統(tǒng)計(jì)方法來檢驗(yàn)其是否滿足該條件也很困難。因此,在實(shí)際工作中常采用的辦法是:首先判斷每個單獨(dú)的因素是否都滿足了單元正態(tài)分布,若都滿足了單元正態(tài)分布,那么可認(rèn)為多個這樣的因素所構(gòu)成的總體則服從多元正態(tài)分布;有時甚至將此要求放寬,在需要分析的多個因素中,若有個別因素不滿足正態(tài)分布,但當(dāng)其樣本含量較大時也可用多因素分析方法。(2)對樣本含量的要求:多因素分析的樣本含量估計(jì),目前尚無很好的辦法來解決。常用的原則是:所需研究因素的個數(shù)越多,所需的樣本含量就越大;通常認(rèn)為樣本含量是所要研究因素個數(shù)的5至10倍。一般來說,樣本含量少于研
6、究因素個數(shù)的5倍,或樣本含量少于50例,不宜作多因素分析。(3)對資料類型的要求:統(tǒng)計(jì)上將所分析的資料分為三類,即數(shù)值變量(計(jì)量資料)、無序分類變量(計(jì)數(shù)資料人有序分類變量(等級資料)。對多因素分析的方法而言,般都要求資料屬計(jì)量資料。如果所要研究的因素中,量資料的指標(biāo),又有計(jì)數(shù)資料和等級資料的指標(biāo)時,往往需要將計(jì)數(shù)資料和等級資料轉(zhuǎn)換成計(jì)量資料。若不滿足條件的資料不能做多因素分析,即使做多因素分析,其結(jié)果也是不可靠的甚至?xí)清e誤的。1.多元線性回歸(regression)的主要用途①建立一個可反映應(yīng)變量與自變量關(guān)系的多元回歸方程
7、。②利用多元回歸方程,用已知的自變量值去估計(jì)未知應(yīng)變量。③分析一個應(yīng)變量與多個自變量間的相互關(guān)系。2.應(yīng)用條件①所有的自變量和應(yīng)變量都應(yīng)是計(jì)量資料。②要求自變量和應(yīng)變量服從多元正態(tài)分布。③樣本含量需要研究因素個數(shù)的5至10倍。1.實(shí)例分析某單位欲分析兒童的血紅蛋白含量與體內(nèi)微量元素含量間的關(guān)系,測量了20名兒童(此處僅為舉例,其樣本含量未達(dá)到前述要求)血液中的鈣((xg/100mml)>鐵(yg/100mml)和銅(
8、ig/100mml)與血紅蛋白(g/100mml)的數(shù)據(jù)。鈣為XI、鐵為X2、銅為X3、血紅蛋白為Y。借助計(jì)算
9、機(jī)分析軟件,獲結(jié)果如下:ModelRRSquareAdjustedRSquareStd.ErroroftheEstimate復(fù)相關(guān)系數(shù)決定系數(shù)校正決定系數(shù)標(biāo)準(zhǔn)誤10.8760.7650.7210.8737表1ModelSummary(模型概述)aPredictors:(Con