資源描述:
《試論計數(shù)資料的統(tǒng)計學推斷.ppt》由會員上傳分享,免費在線閱讀,更多相關內容在工程資料-天天文庫。
1、第五章計數(shù)資料的統(tǒng)計學推斷第一節(jié)率的抽樣誤差與可信區(qū)間第二節(jié)率的統(tǒng)計學推斷一、樣本率與總體率比較的u檢驗二、兩個樣本率比較的u檢驗第三節(jié)卡方檢驗一、卡方檢驗的基本思想二、四格表專用公式三、連續(xù)性校正公式四、配對四格表資料的χ2檢驗五、行×列(R×C)表資料的χ2檢驗計數(shù)資料的統(tǒng)計學推斷第一節(jié)率的抽樣誤差與可信區(qū)間一、率的抽樣誤差與標準誤二、總體率的可信區(qū)間一、率的抽樣誤差與標準誤樣本率(p)和總體率(π)的差異稱為率的抽樣誤差(samplingerrorofrate),用率的標準誤(standarderrorofr
2、ate)度量。如果總體率π未知,用樣本率p估計標準誤的計算二、總體率的可信區(qū)間總體率的可信區(qū)間(confidenceintervalofrate):根據(jù)樣本率推算總體率可能所在的范圍第二節(jié)率的統(tǒng)計學推斷一、樣本率與總體率比較u檢驗二、兩個樣本率的比較u檢驗一、樣本率與總體率比較的u檢驗u檢驗的條件:np和n(1-p)均大于5時二、兩個獨立樣本率比較的u檢驗表5-1兩種療法的心血管病病死率比較療法死亡生存合計病死率(%)鹽酸苯乙雙胍26(X1)178204(n1)12.75(p1)安慰劑2(X2)6264(n2)3.
3、13(p2)合計2824026810.45(pc)u檢驗的條件:n1p1和n1(1-p1)與n2p2和n2(1-p2)均>5小結1.樣本率也有抽樣誤差,率的抽樣誤差的大小用σp或Sp來衡量。2.率的分布服從二項分布。當n足夠大,π和1-π均不太小,有nπ≥5和n(1-π)≥5時,近似正態(tài)分布。3.總體率的可信區(qū)間是用樣本率估計總體率的可能范圍。當p分布近似正態(tài)分布時,可用正態(tài)近似法估計率的可信區(qū)間。4.根據(jù)正態(tài)近似原理,可進行樣本率與總體率以及兩樣本率比較的u檢驗。率的u檢驗能解決以下問題嗎?率的反應為生與死、陽性
4、與陰性、發(fā)生與不發(fā)生等二分類變量,如果二分類變量為非正反關系(如治療A、治療B);反應為多分類,如何進行假設檢驗?率的u檢驗要求:n足夠大,且nπ≥5和n(1-π)≥5。如果條件不滿足,如何進行假設檢驗?第三節(jié)卡方檢驗χ2檢驗(Chi-squaretest)是現(xiàn)代統(tǒng)計學的創(chuàng)始人之一,英國人K.Pearson(1857-1936)于1900年提出的一種具有廣泛用途的統(tǒng)計方法,可用于兩個或多個率間的比較,計數(shù)資料的關聯(lián)度分析,擬合優(yōu)度檢驗等等。本章僅限于介紹兩個和多個率或構成比比較的χ2檢驗。一、卡方檢驗的基本思想(1
5、)療法死亡生存合計病死率(%)鹽酸苯乙雙胍26(a)178(b)204(a+b)12.75(p1)安慰劑2(c)62(d)64(c+d)3.13(p2)合計28(a+c.)240(b+d.)268(a+b+c+d=n)10.45(pc)表5-1兩種療法的心血管病病死率的比較2×2表或四格表(fourfoldtable)實際頻數(shù)A(actualfrequency)(a、b、c、d)的理論頻數(shù)T(theoreticalfrequency)(H0:π1=π2=π):a的理論頻數(shù)=(a+b)×pc=(a+b)×[(a+c.
6、)/n]=nRnC/n=21.3b的理論頻數(shù)=(a+b)×(1-pc)=(a+b)×[(b+d.)/n]=nRnC/n=182.7c的理論頻數(shù)=(c+d)×pc=(c+d)×[(a+c)/n]=nRnC/n=6.7d的理論頻數(shù)=(c+d)×(1-pc)=(c+d)×[(b+d.)/n]=nRnC/n=57.3一、卡方檢驗的基本思想(2)各種情形下,理論與實際偏離的總和即為卡方值(chi-squarevalue),它服從自由度為ν的卡方分布。3.847.8112.59P=0.05的臨界值χ2分布(chi-square
7、distribution)χ2檢驗的基本公式上述基本公式由Pearson提出,因此軟件上常稱這種檢驗為Peareson卡方檢驗,下面將要介紹的其他卡方檢驗公式都是在此基礎上發(fā)展起來的。它不僅適用于四格表資料,也適用于其它的“行×列表”。二、四格表專用公式(1)為了不計算理論頻數(shù)T,可由基本公式推導出,直接由各格子的實際頻數(shù)(a、b、c、d)計算卡方值的公式:二、四格表專用公式(2)?2(1)~u2=2.19492=4.82(n>40,所有T?5時)三、連續(xù)性校正公式(1)χ2分布是一連續(xù)型分布,而行×列表資料屬離散
8、型分布,對其進行校正稱為連續(xù)性校正(correctionforcontinuity),又稱Yates校正(Yates'correction)。⑴當n≥40,而1≤T<5時,用連續(xù)性校正公式⑵當n<40或T<1時,用Fisher精確檢驗(Fisherexacttest)校正公式:三、連續(xù)性校正公式(2)因為1<T<5,且n>40時,所以應用連續(xù)性校正χ2檢驗四