資源描述:
《總體均數(shù)的估計(jì)與假設(shè)檢驗(yàn)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、第三章總體均數(shù)的估計(jì)與假設(shè)檢驗(yàn)第二軍醫(yī)大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)教研室張羅漫1均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤t分布總體均數(shù)的估計(jì)t檢驗(yàn)假設(shè)檢驗(yàn)的注意事項(xiàng)正態(tài)性檢驗(yàn)和兩樣本方差比較的F檢驗(yàn)講課內(nèi)容2第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤3了解總體特征的最好方法是對(duì)總體的每一個(gè)體進(jìn)行觀察、試驗(yàn),但這在醫(yī)學(xué)研究實(shí)際中往往不可行。對(duì)無(wú)限總體不可能對(duì)所有個(gè)體逐一觀察,對(duì)有限總體限于人力、財(cái)力、物力、時(shí)間或個(gè)體過(guò)多等原因,不可能也沒(méi)必要對(duì)所有個(gè)體逐一研究(如對(duì)一批罐頭質(zhì)量檢查)。借助抽樣研究。4欲了解某地18歲男生身高值的平均水平,隨機(jī)抽取該地10名男生身高值作為樣本。由于個(gè)體變異與抽樣的影響,抽得的樣本均數(shù)不太可能等于總體均
2、數(shù),造成樣本統(tǒng)計(jì)量與總體參數(shù)間的差異(表現(xiàn)為來(lái)自同一總體的若干樣本統(tǒng)計(jì)量間的差異),稱為抽樣誤差。抽樣誤差是不可避免的。抽樣誤差是有規(guī)律的。51999年某市18歲男生身高值Xi~N(μ,σ2)μ=167.7cmσ=5.3cm樣本號(hào)1167.412.742165.566.573168.205.36·········99169.405.57100165.695.09ni=106樣本均數(shù)抽樣分布具有如下特點(diǎn):各樣本均數(shù)未必等于總體均數(shù)各樣本均數(shù)間存在差異樣本均數(shù)圍繞=167.69cm呈正態(tài)分布樣本均數(shù)變異度()較原總體個(gè)體值變異度(σ=5.3cm)大大縮小78中心極限定理(centrallim
3、ittheorem)從均數(shù)為?、標(biāo)準(zhǔn)差為?的總體中獨(dú)立隨機(jī)抽樣,當(dāng)樣本含量n較大時(shí),樣本均數(shù)的分布將趨于正態(tài)分布此分布的均數(shù)為?標(biāo)準(zhǔn)差為9中心極限定理(centrallimittheorem)若Xi服從正態(tài)分布則服從正態(tài)分布若Xi不服從正態(tài)分布n大(n>60):則近似服從正態(tài)分布n小(n<60):則為非正態(tài)分布10樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差稱標(biāo)準(zhǔn)誤(standarderror,SE)樣本均數(shù)的標(biāo)準(zhǔn)差稱均數(shù)的標(biāo)準(zhǔn)誤(standarderrorofmean,SEM)11標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別12第二節(jié)t分布131908年,英國(guó)統(tǒng)計(jì)學(xué)家W.S.Gosset以筆名“Student”在《Biometrics
4、》雜志上發(fā)表論文,首次提出t分布概念,后人又稱Student’st-distribution,開(kāi)創(chuàng)了小樣本統(tǒng)計(jì)推斷的新紀(jì)元,被認(rèn)為是統(tǒng)計(jì)學(xué)發(fā)展史上的里程碑之一。14WilliamSeelyGosset(1876~1937,英)15t分布的概念16t分布的圖形與特征t分布為一簇單峰分布曲線,?不同,曲線形狀不同t分布以0為中心,左右對(duì)稱t分布與?有關(guān),?越小,t值越分散,t分布的峰部越低,而兩側(cè)尾部翹得越高當(dāng)?逼近?,逼近,t分布逼近u分布17f(t)?=∞(標(biāo)準(zhǔn)正態(tài)曲線)?=5?=10.10.2-4-3-2-1012340.3自由度分別為1、5、∞時(shí)的t分布t值18-tt019t分布曲線
5、下面積與橫軸t值間關(guān)系(附表2)t界值表中一側(cè)尾部面積稱單側(cè)概率(α)兩側(cè)尾部面積之和稱雙側(cè)概率(α/2)t0.05/2,9=2.262,t0.05,9=1.833在相同自由度時(shí),值增大,α減小在相同α?xí)r,單尾α對(duì)應(yīng)的t值比雙尾α的小20t0.05/2,9=2.262t0.05,9=1.83321-tt022第三節(jié)總體均數(shù)的估計(jì)23一、可信區(qū)間的概念參數(shù)估計(jì)是用樣本統(tǒng)計(jì)量推斷總體參數(shù)。有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種。點(diǎn)估計(jì)是用樣本統(tǒng)計(jì)量直接估計(jì)其總體參數(shù)值。如用估計(jì)?、S估計(jì)?等。方法雖簡(jiǎn)單,但未考慮抽樣誤差大小。區(qū)間估計(jì)是按預(yù)先給定的概率(1??),確定一個(gè)包含總體參數(shù)的范圍。該范圍稱為參數(shù)的
6、可信區(qū)間(confidenceinterval,CI)24預(yù)先給定的概率(1??)稱為可信度(confidencelevel),常取95%或99%。總體參數(shù)是未知的、一個(gè)固定的值。(所以要用包含來(lái)描述)。樣本統(tǒng)計(jì)量是隨機(jī)變量。可信區(qū)間通常由兩個(gè)數(shù)值構(gòu)成,稱可信限(confidencelimit,CL)。μ可信下限(L)可信上限(U)25二、總體均數(shù)可信區(qū)間的計(jì)算1.單一總體均數(shù)的可信區(qū)間(1)?未知按t分布原理(2)?已知或?未知但n足夠大(如n>60)按u分布原理2.兩總體均數(shù)之差的可信區(qū)間261.單一總體均數(shù)的1–α可信區(qū)間雙側(cè)(1)?未知單側(cè)27故該地18歲男生身高均數(shù)的95%可信
7、區(qū)間為(164.35,169.55)cm。μ=167.7cm雙尾例在例3-1中抽得第15號(hào)樣本的=166.95(cm),S=3.64(cm),求其總體均數(shù)的95%可信區(qū)間。166.95±2.262×1.1511=164.35~169.55(cm)281.單一總體均數(shù)的1–α可信區(qū)間雙側(cè)單側(cè)(2)?已知或?未知但n足夠大:29例某地抽取正常成年人200名,測(cè)得其血清膽固醇均數(shù)為3.64mmol/L,標(biāo)準(zhǔn)差為1.20mmol/L,估計(jì)該