資源描述:
《第3節(jié)均數(shù)的抽樣誤差和總體均數(shù)估計2013臨本ppt課件.ppt》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在教育資源-天天文庫。
1、第三節(jié)均數(shù)的抽樣誤差和總體均數(shù)估計參數(shù)估計包括:點估計與區(qū)間估計2.假設檢驗統(tǒng)計推斷的兩部分內(nèi)容:統(tǒng)計推斷:用樣本信息推論總體的特征??傮w樣本隨機抽取部分觀察單位μ?推斷inference參數(shù)估計一、均數(shù)的抽樣誤差與標準誤2009年某市18歲男生身高N(167.7,5.32)的抽樣示意圖將此100個樣本均數(shù)看成新變量值,則這100個樣本均數(shù)構成一新分布,繪制頻數(shù)圖從正態(tài)分布總體N(167.7,5.32)隨機抽樣所得樣本均數(shù)分布①,各樣本均數(shù)未必等于總體均數(shù);②各樣本均數(shù)間存在差異;③樣本均數(shù)的分布為中間多,兩邊少,左右基
2、本對稱。④樣本均數(shù)的變異范圍較之原變量的變異范圍大大縮小。可算得這100個樣本均數(shù)的均數(shù)為167.69cm、標準差為1.69cm。樣本均數(shù)分布具有如下特點:從正態(tài)分布總體中以固定n抽樣時,樣本均數(shù)的分布仍服從正態(tài)分布。當樣本含量n足夠大時,即使從偏態(tài)分布總體中以固定n抽樣,其樣本均數(shù)的分布也近似服從正態(tài)分布。理論上可以證明,8抽樣誤差:由個體變異產(chǎn)生的、抽樣造成的樣本統(tǒng)計量與總體參數(shù)的差別原因:1)抽樣2)個體差異由于變異的存在,抽樣研究所造成的樣本均數(shù)與總體均數(shù)的差異,以及各樣本均數(shù)間的差異稱為均數(shù)的抽樣誤差。抽樣誤差
3、在抽樣研究中是不可避免的,但只要嚴格遵循隨機化抽樣的原則,就能估計抽樣誤差的大小。1.均數(shù)的抽樣誤差的概念表示樣本統(tǒng)計量抽樣誤差大小的統(tǒng)計指標。標準誤:說明抽樣誤差的大小,總體計算公式2、標準誤(standarderror,SE)實質(zhì):樣本均數(shù)的標準差若用樣本標準差s來估計,(7-28)當樣本例數(shù)n一定時,標準誤與標準差呈正比當標準差一定時,標準誤與樣本含量n的平方根呈反比。通過增加樣本含量n來降低抽樣誤差。抽樣調(diào)查150名3歲女孩的身高均數(shù)為92.79cm,標準差為4.61cm,則其標準誤是多少?例子:1、反映樣本均數(shù)
4、的可靠性;2、估計總體均數(shù)的置信區(qū)間;3、用于均數(shù)的假設檢驗。標準誤的應用:指標意義應用標準差(s)衡量變量值變異程度,s越大表示變量值變異程度越大,s越小表示變量值變異程度越小描述正態(tài)分布(近似正態(tài)分布)資料的頻數(shù)分布;醫(yī)學參考值范圍的估計標準誤()樣本均數(shù)的變異程度,表示抽樣誤差的大小。標準誤越大表示抽樣誤差越大,樣本均數(shù)的可靠性越??;標準誤越小表示抽樣誤差越小,樣本均數(shù)的可靠性越大總體均數(shù)區(qū)間估計;兩個或多個總體均數(shù)間比較的假設檢驗標準差和標準誤的區(qū)別16二、t分布(一)t分布概念隨機變量XN(m,s2)標準正態(tài)分
5、布N(0,12)z變換式中為自由度(degreeoffreedom,df)3.實際工作中,由于未知,用代替,則不再服從標準正態(tài)分布,而服從t分布。均數(shù)標準正態(tài)分布N(0,12)Studentt分布自由度:n-10t分布一簇曲線0N(0,1)n足夠大時,(1)(2)(3)以固定n隨機抽樣英國統(tǒng)計學家Gosset22(二)t分布的圖形與特征分布只有一個參數(shù),即自由度圖不同自由度下的t分布圖t分布與標準正態(tài)分布25261.特征:2、t界值表:詳見P312,可反映t分布曲線下的面積。單側概率或單尾概率:用表示;雙側概率或雙尾概率
6、:用表示。-tt0由t界值表可知:★相同自由度時,︱t︱越大,概率P越小?!锵嗤瑃值時,雙側概率是單側概率的兩倍?!铴?∞時,t分布即為Z分布,故t界值表中最后一行是Z界值。t分布的分位數(shù)(雙側t界值)?/2?/21-?t?/2,?-t?/2,?31?1-?t?,?t分布的分位數(shù)(單側t界值)32舉例:三、總體均數(shù)的置信區(qū)間估計用樣本統(tǒng)計量推斷總體參數(shù)??傮w均數(shù)估計:用樣本均數(shù)推斷總體均數(shù)。點估計(pointestimation):用相應樣本統(tǒng)計量直接作為其總體參數(shù)的估計值。如用估計μ、s估計?等。其方法雖簡單,但未考慮
7、抽樣誤差的大小。按預先給定的概率(1??)所確定的包含未知總體參數(shù)的一個范圍??傮w均數(shù)的區(qū)間估計:按預先給定的概率(1??)所確定的包含未知總體均數(shù)的一個范圍。如給定?=0.05,該范圍稱為參數(shù)的95%可信區(qū)間或置信區(qū)間;如給定?=0.01,該范圍稱為參數(shù)的99%可信區(qū)間或置信區(qū)間。2.區(qū)間估計(intervalestimation):計算總體均數(shù)可信區(qū)間需考慮:(1)總體標準差?是否已知,(2)樣本含量n的大小通常有兩類方法:(1)t分布法(2)z分布法1.當?未知且n較小時,由于服從t分布,可按t分布原理估計總體均數(shù)
8、的可信區(qū)間。由于即故總體均數(shù)(1-?)?100%的可信區(qū)間為382、當?未知但n足夠大時(n>100),t分布近似u分布,可以u界值代替t界值,估計總體均數(shù)的可信區(qū)間。3、當?已知時,可按正態(tài)分布的原理,估計總體均數(shù)的可信區(qū)間。39例某地抽取正常成年人200名,測得其血清膽固醇的均數(shù)為3.64mmol/L,標準差為1