資源描述:
《均數(shù)的抽樣誤差和總體均數(shù)估計(jì)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、均數(shù)的抽樣誤差和總體均數(shù)估計(jì)參數(shù)估計(jì)包括:點(diǎn)估計(jì)與區(qū)間估計(jì)2.假設(shè)檢驗(yàn)統(tǒng)計(jì)推斷的兩部分內(nèi)容:總體樣本隨機(jī)抽取部分觀察單位μ?推斷inference參數(shù)估計(jì)一、抽樣誤差與標(biāo)準(zhǔn)誤2009年某市18歲男生身高N(167.7,5.32)的抽樣示意圖將此100個(gè)樣本均數(shù)看成新變量值,則這100個(gè)樣本均數(shù)構(gòu)成一新分布,繪制頻數(shù)圖從正態(tài)分布總體N(167.7,5.32)隨機(jī)抽樣所得樣本均數(shù)分布①,各樣本均數(shù)未必等于總體均數(shù);②各樣本均數(shù)間存在差異;③樣本均數(shù)的分布為中間多,兩邊少,左右基本對(duì)稱。④樣本均數(shù)的變異范圍較之原變量的變異范圍大大縮小??伤愕眠@100個(gè)樣本均數(shù)的均數(shù)為16
2、7.69cm、標(biāo)準(zhǔn)差為1.69cm。樣本均數(shù)分布具有如下特點(diǎn):1、抽樣誤差:由個(gè)體變異產(chǎn)生的、抽樣造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差別原因:1)抽樣2)個(gè)體差異表示樣本統(tǒng)計(jì)量抽樣誤差大小的統(tǒng)計(jì)指標(biāo)。標(biāo)準(zhǔn)誤:說明抽樣誤差的大小,總體計(jì)算公式(7-27)2、標(biāo)準(zhǔn)誤(standarderror,SE)實(shí)質(zhì):樣本均數(shù)的標(biāo)準(zhǔn)差若用樣本標(biāo)準(zhǔn)差s來估計(jì),(7-28)當(dāng)樣本例數(shù)n一定時(shí),標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差呈正比當(dāng)標(biāo)準(zhǔn)差一定時(shí),標(biāo)準(zhǔn)誤與樣本含量n的平方根呈反比。通過增加樣本含量n來降低抽樣誤差。隨機(jī)抽樣調(diào)查7歲男孩120名,的身高均數(shù)為120.88,標(biāo)準(zhǔn)差為5.23,則其標(biāo)準(zhǔn)誤是多少?例子:
3、指標(biāo)意義應(yīng)用標(biāo)準(zhǔn)差(s)衡量變量值變異程度,s越大表示變量值變異程度越大,s越小表示變量值變異程度越小描述正態(tài)分布(近似正態(tài)分布)資料的頻數(shù)分布;醫(yī)學(xué)參考值范圍的估計(jì)標(biāo)準(zhǔn)誤()樣本均數(shù)的變異程度,表示抽樣誤差的大小。標(biāo)準(zhǔn)誤越大表示抽樣誤差越大,樣本均數(shù)的可靠性越小;標(biāo)準(zhǔn)誤越小表示抽樣誤差越小,樣本均數(shù)的可靠性越大總體均數(shù)區(qū)間估計(jì);兩個(gè)或多個(gè)總體均數(shù)間比較標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的區(qū)別二、t分布(一)t分布概念隨機(jī)變量XN(m,s2)標(biāo)準(zhǔn)正態(tài)分布N(0,12)z變換式中為自由度(degreeoffreedom,df)3.實(shí)際工作中,由于未知,用代替,則不再服從標(biāo)準(zhǔn)正態(tài)分布,而服
4、從t分布。均數(shù)標(biāo)準(zhǔn)正態(tài)分布N(0,12)Studentt分布自由度:n-1(二)t分布的圖形與特征分布只有一個(gè)參數(shù),即自由度圖不同自由度下的t分布圖1.特征:2、t界值表:詳見附表2,可反映t分布曲線下的面積。單側(cè)概率或單尾概率:用表示;雙側(cè)概率或雙尾概率:用表示。-tt0舉例:三、參數(shù)估計(jì)用樣本統(tǒng)計(jì)量推斷總體參數(shù)??傮w均數(shù)估計(jì):用樣本均數(shù)(和標(biāo)準(zhǔn)差)推斷總體均數(shù)。點(diǎn)估計(jì)(pointestimation):用相應(yīng)樣本統(tǒng)計(jì)量直接作為其總體參數(shù)的估計(jì)值。如用估計(jì)μ、s估計(jì)?等。其方法雖簡(jiǎn)單,但未考慮抽樣誤差的大小。按預(yù)先給定的概率(1??)所確定的包含未知總體參數(shù)的一個(gè)
5、范圍??傮w均數(shù)的區(qū)間估計(jì):按預(yù)先給定的概率(1??)所確定的包含未知總體均數(shù)的一個(gè)范圍。如給定?=0.05,該范圍稱為參數(shù)的95%可信區(qū)間或置信區(qū)間;如給定?=0.01,該范圍稱為參數(shù)的99%可信區(qū)間或置信區(qū)間。2.區(qū)間估計(jì)(intervalestimation):計(jì)算總體均數(shù)可信區(qū)間需考慮:(1)總體標(biāo)準(zhǔn)差?是否已知,(2)樣本含量n的大小通常有兩類方法:(1)t分布法(2)z分布法(1)?未知且n比較?。喊磘分布(2)按z分布某地抽取正常成年人200名,測(cè)得其血清膽固醇的均數(shù)為3.64mmol/L,標(biāo)準(zhǔn)差為1.20mmol/L,估計(jì)該地正常成年人血清膽固醇均數(shù)的
6、95%可信區(qū)間。舉例故該地正常成年人血清膽固醇均數(shù)的雙側(cè)95%可信區(qū)間為(3.47,3.81)mmol?L。四、假設(shè)檢驗(yàn)的基本概念和步驟例大規(guī)模調(diào)查表明,健康成年男子血紅蛋白的均數(shù)為136.0g/L,今隨機(jī)調(diào)查某單位食堂成年男性炊事員25名,測(cè)得其血紅蛋白均數(shù)121g/L,標(biāo)準(zhǔn)差48.8g/L。問題:根據(jù)資料推論食堂炊事員血紅蛋白均數(shù)是否與健康成年男子血紅蛋白均數(shù)有無差別(一)假設(shè)檢驗(yàn)的基本思想假設(shè)檢驗(yàn)?zāi)康摹袛嗖顒e是由哪種原因造成的。①抽樣誤差造成的;②本質(zhì)差異造成的。造成的可能原因有二:案例炊事員血紅蛋白總體均數(shù)136.0g/L121g/L炊事員血紅蛋白總體均
7、數(shù)138.0g/L一種假設(shè)H0另一種假設(shè)H1抽樣誤差總體不同假定假如炊事員均數(shù)為136.0g/L,即則,服從t分布,絕大多數(shù)t應(yīng)該分布在主要區(qū)域根據(jù)t分布能夠計(jì)算出有如此大差異的概率P,如果P值很小,即計(jì)算出的t值超出了給定的界限,則傾向于拒絕H0,認(rèn)為山區(qū)血紅蛋白均數(shù)不是136.0g/L假設(shè)檢驗(yàn)的基本思想—利用小概率反證法的思想利用小概率反證法思想,從問題的對(duì)立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然后在H0成立的條件下計(jì)算檢驗(yàn)統(tǒng)計(jì)量,最后獲得P值來判斷。當(dāng)P小于或等于預(yù)先規(guī)定的概率值α,就是小概率事件。根據(jù)小概率事件的原理:小概率事件在一次抽樣