資源描述:
《第3節(jié)均數(shù)的抽樣誤差和總體均數(shù)估計(jì)2013臨本ppt課件.ppt》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、第三節(jié)均數(shù)的抽樣誤差和總體均數(shù)估計(jì)參數(shù)估計(jì)包括:點(diǎn)估計(jì)與區(qū)間估計(jì)2.假設(shè)檢驗(yàn)統(tǒng)計(jì)推斷的兩部分內(nèi)容:統(tǒng)計(jì)推斷:用樣本信息推論總體的特征。總體樣本隨機(jī)抽取部分觀察單位μ?推斷inference參數(shù)估計(jì)一、均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤2009年某市18歲男生身高N(167.7,5.32)的抽樣示意圖將此100個(gè)樣本均數(shù)看成新變量值,則這100個(gè)樣本均數(shù)構(gòu)成一新分布,繪制頻數(shù)圖從正態(tài)分布總體N(167.7,5.32)隨機(jī)抽樣所得樣本均數(shù)分布①,各樣本均數(shù)未必等于總體均數(shù);②各樣本均數(shù)間存在差異;③樣本均數(shù)的分布為中間多,兩邊少,左右基
2、本對(duì)稱(chēng)。④樣本均數(shù)的變異范圍較之原變量的變異范圍大大縮小。可算得這100個(gè)樣本均數(shù)的均數(shù)為167.69cm、標(biāo)準(zhǔn)差為1.69cm。樣本均數(shù)分布具有如下特點(diǎn):從正態(tài)分布總體中以固定n抽樣時(shí),樣本均數(shù)的分布仍服從正態(tài)分布。當(dāng)樣本含量n足夠大時(shí),即使從偏態(tài)分布總體中以固定n抽樣,其樣本均數(shù)的分布也近似服從正態(tài)分布。理論上可以證明,8抽樣誤差:由個(gè)體變異產(chǎn)生的、抽樣造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差別原因:1)抽樣2)個(gè)體差異由于變異的存在,抽樣研究所造成的樣本均數(shù)與總體均數(shù)的差異,以及各樣本均數(shù)間的差異稱(chēng)為均數(shù)的抽樣誤差。抽樣誤差
3、在抽樣研究中是不可避免的,但只要嚴(yán)格遵循隨機(jī)化抽樣的原則,就能估計(jì)抽樣誤差的大小。1.均數(shù)的抽樣誤差的概念表示樣本統(tǒng)計(jì)量抽樣誤差大小的統(tǒng)計(jì)指標(biāo)。標(biāo)準(zhǔn)誤:說(shuō)明抽樣誤差的大小,總體計(jì)算公式2、標(biāo)準(zhǔn)誤(standarderror,SE)實(shí)質(zhì):樣本均數(shù)的標(biāo)準(zhǔn)差若用樣本標(biāo)準(zhǔn)差s來(lái)估計(jì),(7-28)當(dāng)樣本例數(shù)n一定時(shí),標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差呈正比當(dāng)標(biāo)準(zhǔn)差一定時(shí),標(biāo)準(zhǔn)誤與樣本含量n的平方根呈反比。通過(guò)增加樣本含量n來(lái)降低抽樣誤差。抽樣調(diào)查150名3歲女孩的身高均數(shù)為92.79cm,標(biāo)準(zhǔn)差為4.61cm,則其標(biāo)準(zhǔn)誤是多少?例子:1、反映樣本均數(shù)
4、的可靠性;2、估計(jì)總體均數(shù)的置信區(qū)間;3、用于均數(shù)的假設(shè)檢驗(yàn)。標(biāo)準(zhǔn)誤的應(yīng)用:指標(biāo)意義應(yīng)用標(biāo)準(zhǔn)差(s)衡量變量值變異程度,s越大表示變量值變異程度越大,s越小表示變量值變異程度越小描述正態(tài)分布(近似正態(tài)分布)資料的頻數(shù)分布;醫(yī)學(xué)參考值范圍的估計(jì)標(biāo)準(zhǔn)誤()樣本均數(shù)的變異程度,表示抽樣誤差的大小。標(biāo)準(zhǔn)誤越大表示抽樣誤差越大,樣本均數(shù)的可靠性越??;標(biāo)準(zhǔn)誤越小表示抽樣誤差越小,樣本均數(shù)的可靠性越大總體均數(shù)區(qū)間估計(jì);兩個(gè)或多個(gè)總體均數(shù)間比較的假設(shè)檢驗(yàn)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的區(qū)別16二、t分布(一)t分布概念隨機(jī)變量XN(m,s2)標(biāo)準(zhǔn)正態(tài)分
5、布N(0,12)z變換式中為自由度(degreeoffreedom,df)3.實(shí)際工作中,由于未知,用代替,則不再服從標(biāo)準(zhǔn)正態(tài)分布,而服從t分布。均數(shù)標(biāo)準(zhǔn)正態(tài)分布N(0,12)Studentt分布自由度:n-10t分布一簇曲線(xiàn)0N(0,1)n足夠大時(shí),(1)(2)(3)以固定n隨機(jī)抽樣英國(guó)統(tǒng)計(jì)學(xué)家Gosset22(二)t分布的圖形與特征分布只有一個(gè)參數(shù),即自由度圖不同自由度下的t分布圖t分布與標(biāo)準(zhǔn)正態(tài)分布25261.特征:2、t界值表:詳見(jiàn)P312,可反映t分布曲線(xiàn)下的面積。單側(cè)概率或單尾概率:用表示;雙側(cè)概率或雙尾概率
6、:用表示。-tt0由t界值表可知:★相同自由度時(shí),︱t︱越大,概率P越小。★相同t值時(shí),雙側(cè)概率是單側(cè)概率的兩倍?!铴?∞時(shí),t分布即為Z分布,故t界值表中最后一行是Z界值。t分布的分位數(shù)(雙側(cè)t界值)?/2?/21-?t?/2,?-t?/2,?31?1-?t?,?t分布的分位數(shù)(單側(cè)t界值)32舉例:三、總體均數(shù)的置信區(qū)間估計(jì)用樣本統(tǒng)計(jì)量推斷總體參數(shù)??傮w均數(shù)估計(jì):用樣本均數(shù)推斷總體均數(shù)。點(diǎn)估計(jì)(pointestimation):用相應(yīng)樣本統(tǒng)計(jì)量直接作為其總體參數(shù)的估計(jì)值。如用估計(jì)μ、s估計(jì)?等。其方法雖簡(jiǎn)單,但未考慮
7、抽樣誤差的大小。按預(yù)先給定的概率(1??)所確定的包含未知總體參數(shù)的一個(gè)范圍??傮w均數(shù)的區(qū)間估計(jì):按預(yù)先給定的概率(1??)所確定的包含未知總體均數(shù)的一個(gè)范圍。如給定?=0.05,該范圍稱(chēng)為參數(shù)的95%可信區(qū)間或置信區(qū)間;如給定?=0.01,該范圍稱(chēng)為參數(shù)的99%可信區(qū)間或置信區(qū)間。2.區(qū)間估計(jì)(intervalestimation):計(jì)算總體均數(shù)可信區(qū)間需考慮:(1)總體標(biāo)準(zhǔn)差?是否已知,(2)樣本含量n的大小通常有兩類(lèi)方法:(1)t分布法(2)z分布法1.當(dāng)?未知且n較小時(shí),由于服從t分布,可按t分布原理估計(jì)總體均數(shù)
8、的可信區(qū)間。由于即故總體均數(shù)(1-?)?100%的可信區(qū)間為382、當(dāng)?未知但n足夠大時(shí)(n>100),t分布近似u分布,可以u(píng)界值代替t界值,估計(jì)總體均數(shù)的可信區(qū)間。3、當(dāng)?已知時(shí),可按正態(tài)分布的原理,估計(jì)總體均數(shù)的可信區(qū)間。39例某地抽取正常成年人200名,測(cè)得其血清膽固醇的均數(shù)為3.64mmol/L,標(biāo)準(zhǔn)差為1