資源描述:
《卡方擬合優(yōu)度檢驗(yàn)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、第五章c2擬合優(yōu)度檢驗(yàn)及其應(yīng)用第一節(jié)c2擬合優(yōu)度檢驗(yàn)二項(xiàng)分布(0-1數(shù)據(jù))考慮比例問(wèn)題:P(X=1)=p,P(X=0)=1–p假設(shè)檢驗(yàn):H0:p=p0;H1:p?p0。樣本統(tǒng)計(jì):1的頻數(shù)為k,0的頻數(shù)為n–k。檢驗(yàn)統(tǒng)計(jì)量及其分布:等價(jià)的檢驗(yàn)統(tǒng)計(jì)量及其分布也可以寫(xiě)成:總體分類(lèi)A1(X=1)A2(X=0)合計(jì)理論頻數(shù)E1=np0E2=n(1–p0)n觀測(cè)頻數(shù)O1=kO2=n–kn理論H0的檢驗(yàn)統(tǒng)計(jì)量及其分布:例1:某機(jī)構(gòu)認(rèn)為公眾對(duì)某項(xiàng)事業(yè)的看法無(wú)所謂,并通過(guò)調(diào)查來(lái)進(jìn)行實(shí)證,卻得到相反的證據(jù),數(shù)據(jù)如下:總體分類(lèi)贊成反對(duì)合計(jì)理論頻數(shù)5050100觀測(cè)頻數(shù)4060100多項(xiàng)分布(屬性數(shù)據(jù))
2、考慮多項(xiàng)分布問(wèn)題:假設(shè)檢驗(yàn):數(shù)據(jù)結(jié)構(gòu):總體分類(lèi)A1(X=1)……As(X=s)合計(jì)理論頻數(shù)E1=np10……Es=nps0n觀測(cè)頻數(shù)O1……Osn理論H0的檢驗(yàn)統(tǒng)計(jì)量及其分布:在近似計(jì)算方面,盡可能要求所有觀測(cè)頻數(shù)Oi≥5,容許個(gè)別為3或4;否則,對(duì)某些類(lèi)進(jìn)行合并。例2:骰子的檢驗(yàn)?zāi)橙嗽谫€場(chǎng)對(duì)擲骰子觀測(cè)了120次,獲得數(shù)據(jù):朝上的面i123456合計(jì)理論值Ei202020202020120觀測(cè)值Oi132816103221120Ei–Oi7–8410–12–10(Ei–Oi)24964161001441(Ei–Oi)2/Ei2.453.200.805.007.200.0518.7
3、0P值=0.003因此,可以認(rèn)為骰子不均勻或賭場(chǎng)有作弊行為。例3:判定樣本的不隨機(jī)性有一項(xiàng)調(diào)查據(jù)稱是在某地區(qū)隨機(jī)進(jìn)行的。該地區(qū)各年齡段(或其它分組方式)的人口比例是已知的。樣本量為1000,具體數(shù)據(jù)如下:數(shù)據(jù)分組1234567合計(jì)各組比例0.150.20.20.150.150.10.051理論值Ei150200200150150100501000觀測(cè)值Oi13024017013018090601000Ei–Oi20–403020–3010–100(Ei–Oi)24001600900400900100100(Ei–Oi)2/Ei2.6784.52.6761226.83P值=0.00
4、02因此,可以認(rèn)為該調(diào)查的隨機(jī)性是有問(wèn)題的。一般分布的檢驗(yàn)(屬性數(shù)據(jù)或連續(xù)數(shù)據(jù))檢驗(yàn)方法:對(duì)總體進(jìn)行隨機(jī)抽樣,得樣本X1,…,Xn;按某種方式所得到的總體分類(lèi)A1,…,As對(duì)樣本進(jìn)行頻數(shù)統(tǒng)計(jì),得觀測(cè)頻數(shù)O1,…,Os;用極大似然法估計(jì)參數(shù)q1,…,qr;得估計(jì)值計(jì)算觀測(cè)頻數(shù)O1,…,Os的理論值E1,…,Es,即在H0下等于:理論H0的檢驗(yàn)統(tǒng)計(jì)量及其分布:例4:120名成年男子紅細(xì)胞數(shù)的正態(tài)性檢驗(yàn)組段理論頻數(shù)E觀察頻數(shù)OE-O(E-O)2(E-O)2/E3.20~1.872-0.130.0170.0093.50~4.495-0.510.260.0563.80~10.5100.50
5、.250.0244.10~18.519-0.50.250.0144.40~24.6231.62.560.1044.70~24.6240.60.360.0155.00~18.521-2.56.250.3385.30~10.511-0.50.250.0245.60~4.4940.490.240.0535.90~6.201.8710.870.760.405合計(jì)1201200.01.042P值為0.99,故不拒絕正態(tài)性假設(shè)。120名成年男子紅細(xì)胞數(shù)的直方圖例5:30年代盧瑟福觀測(cè)了在7.5秒時(shí)間內(nèi)X射線到達(dá)指定區(qū)域的質(zhì)點(diǎn)數(shù),共觀測(cè)2608次,獲得統(tǒng)計(jì)數(shù)據(jù):出現(xiàn)點(diǎn)數(shù)i0123456789≥
6、10合計(jì)理論值Ei572033835255324082731394527162608觀測(cè)值Oi542114075265083932541406829172608Ei–Oi3–8–24–1241519–1–23–3–10(Ei–Oi)2/Ei0.1240.2671.460.001.100.5341.450.0127.720.1660.0712.91這里,普阿松分布:l的估計(jì)值:理論值Ei:,P值為0.1667。第二節(jié)齊一性檢驗(yàn)兩個(gè)總體分布的齊一性檢驗(yàn)比較兩個(gè)總體的分布函數(shù)F1(X)和F2(X)是否一致?假設(shè)檢驗(yàn):H0:F1(X)=F2(X);H1:F1(X)≠F2(X)。對(duì)這兩個(gè)總
7、體進(jìn)行獨(dú)立抽樣,分別獲得F1(X)和F2(X)的獨(dú)立樣本這兩個(gè)總體變量的值域應(yīng)該一致。我們把該值域分成s段A1,…,As(分類(lèi)方法要求與樣本獨(dú)立),比較F1(X)和F2(X)在A1,…,As上的分布或比例是否一致。對(duì)這兩個(gè)獨(dú)立樣本出現(xiàn)的頻數(shù)分別進(jìn)行統(tǒng)計(jì),記作數(shù)據(jù)結(jié)構(gòu):總體分類(lèi)A1……As合計(jì)X頻數(shù)n11……n1sn1Y頻數(shù)n21……n2sn2合計(jì)n*1……n*sn這里當(dāng)s=2時(shí),上面的數(shù)據(jù)結(jié)構(gòu)就是四格表。故且H0:F1(X)=F2(X)成立時(shí),意味著是來(lái)自同一個(gè)總體,且所以N1j