資源描述:
《總體均數(shù)的估計(jì)與假設(shè)檢驗(yàn)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、1第三章總體均數(shù)的估計(jì)與假設(shè)檢驗(yàn)流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系2內(nèi)容1.均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤2.t分布(t-distribution)3.總體均數(shù)的估計(jì)4.t檢驗(yàn)5.假設(shè)檢驗(yàn)注意事項(xiàng)6.正態(tài)性檢驗(yàn)和兩樣本方差比較的F檢驗(yàn)3第一節(jié)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤統(tǒng)計(jì)推斷:由樣本信息推斷總體特征。4樣本統(tǒng)計(jì)指標(biāo)(統(tǒng)計(jì)量)總體統(tǒng)計(jì)指標(biāo)(參數(shù))正態(tài)(分布)總體:可利用樣本均數(shù)推斷總體均數(shù)5例3-1若某市1999年18歲男生身高服從均數(shù)μ=167.7cm、標(biāo)準(zhǔn)差?=5.3cm的正態(tài)分布。對(duì)該總體進(jìn)行隨機(jī)抽樣,每次抽10人,(=10),共抽得
2、100個(gè)樣本(=100),計(jì)算得每個(gè)樣本均數(shù)及標(biāo)準(zhǔn)差6將此100個(gè)樣本均數(shù)看成新變量值,則這100個(gè)樣本均數(shù)構(gòu)成一新分布,繪制直方圖9以n=60為界限10標(biāo)準(zhǔn)誤:表示樣本統(tǒng)計(jì)量抽樣誤差大小的統(tǒng)計(jì)指標(biāo)均數(shù)標(biāo)準(zhǔn)誤:說明均數(shù)抽樣誤差的大小,計(jì)算公式:(3-1)2、標(biāo)準(zhǔn)誤(standarderror,SE)實(shí)質(zhì):樣本均數(shù)的標(biāo)準(zhǔn)差11數(shù)理統(tǒng)計(jì)證明:12若用樣本標(biāo)準(zhǔn)差S來估計(jì),(3-2)降低抽樣誤差的途徑有:①通過增加樣本含量②通過設(shè)計(jì)減少S13第二節(jié)t分布(t-distribution)t分布概述抽樣誤差的分布規(guī)律↓樣本—
3、—→總體↑t分布理論↑手段(橋梁)目的1415一、t分布的概念1617式中為自由度(degreeoffreedom,df)3.實(shí)際工作中,由于未知,用代替,則,服從t分布18二、t分布的圖形與特征分布只有一個(gè)參數(shù),即自由度19圖3-3不同自由度下的t分布圖201.特征:212t界值表:詳見附表2,可反映t分布曲線下的面積。單側(cè)概率或單尾概率:用表示;雙側(cè)概率或雙尾概率:用表示。22-tt023舉例:24第三節(jié)總體均數(shù)的估計(jì)25一、參數(shù)估計(jì)用樣本統(tǒng)計(jì)量推斷總體參數(shù)總體均數(shù)估計(jì):用樣本均數(shù)(和標(biāo)準(zhǔn)差)推斷總體均數(shù)26
4、27總體均數(shù)的區(qū)間估計(jì):按預(yù)先給定的概率(1??)所確定的包含未知總體均數(shù)的一個(gè)范圍如給定?=0.05,該范圍稱為參數(shù)的95%可信區(qū)間或置信區(qū)間如給定?=0.01,該范圍稱為參數(shù)的99%可信區(qū)間或置信區(qū)間2.區(qū)間估計(jì)(intervalestimation):總體均數(shù)可信區(qū)間的計(jì)算需考慮:(1)總體標(biāo)準(zhǔn)差?是否已知(2)樣本含量n的大小通常有兩類方法:(1)t分布法(2)u分布法28二、總體均數(shù)可信區(qū)間的計(jì)算291.單一總體均數(shù)的可信區(qū)間單側(cè)1-a可信區(qū)間則為:(1)s未知:按t分布雙側(cè)1-a可信區(qū)間則為:30例3
5、-2在例3-1中抽得第15號(hào)樣本得均數(shù)(cm),標(biāo)準(zhǔn)差(cm),求其總體均數(shù)的95%可信區(qū)間31323334例3-3某地抽取正常成年人200名,測(cè)得其血清膽固醇的均數(shù)為3.64mmol/L,標(biāo)準(zhǔn)差為1.20mmol/L,估計(jì)該地正常成年人血清膽固醇均數(shù)的95%可信區(qū)間。35故該地正常成年人血清膽固醇均數(shù)的雙側(cè)95%可信區(qū)間為(3.47,3.81)mmol?L。362.兩總體均數(shù)之差的可信區(qū)間:從?相等,但m不等的兩個(gè)正態(tài)總體N(?1,?2)和N(?2,?2)進(jìn)行隨機(jī)抽樣。則兩總體均數(shù)之差(m1-m2)的雙側(cè)1-a
6、可信區(qū)間為3738同理,兩總體均數(shù)之差(m1-m2)的單側(cè)1-a可信區(qū)間為當(dāng)兩樣本的樣本含量均較大時(shí)(如n1和n2均大于60),可按正態(tài)分布處理39例3-4為了解氨甲喋呤(MTX)對(duì)外周血IL-2水平的影響,某醫(yī)生將61名哮喘患者隨機(jī)分為兩組。其中對(duì)照組29例(),采用安慰劑;實(shí)驗(yàn)組32例(),采用小劑量氨甲喋呤(MTX)進(jìn)行治療。測(cè)得對(duì)照組治療前IL-2的均數(shù)為20.10IU/ml(),標(biāo)準(zhǔn)差為7.02IU/ml();試驗(yàn)組治療前IL-2的均數(shù)為16.89IU/ml(),標(biāo)準(zhǔn)差為8.46IU/ml()。問兩組治
7、療前基線的IL-2總體均數(shù)相差有多大?40第一步:411.95%的可信區(qū)間的理解:(1)所要估計(jì)的總體參數(shù)有95%的可能性在我們所估計(jì)的可信區(qū)間內(nèi)(2)從正態(tài)總體中隨機(jī)抽取100個(gè)樣本,可算得100個(gè)樣本均數(shù)和標(biāo)準(zhǔn)差,也可算得100個(gè)均數(shù)的可信區(qū)間,平均約有95個(gè)可信區(qū)間包含了總體均數(shù)(3)但在實(shí)際工作中,只能根據(jù)一次試驗(yàn)結(jié)果估計(jì)可信區(qū)間,我們就認(rèn)為該區(qū)間包含了總體均數(shù)?42三、可信區(qū)間的確切涵義2.可信區(qū)間的兩個(gè)要素(1)準(zhǔn)確度:用可信度(1??)表示:即區(qū)間包含總體均數(shù)?的理論概率大小。當(dāng)然它愈接近1愈好,如
8、99%的可信區(qū)間比95%的可信區(qū)間要好。(2)精確度:即區(qū)間的寬度區(qū)間愈窄愈好,如95%的可信區(qū)間比99%的可信區(qū)間要好。43當(dāng)n確定時(shí),上述兩者互相矛盾提高準(zhǔn)確度(可信度),則精確度降低(可信區(qū)間會(huì)變寬),勢(shì)必降低可信區(qū)間的實(shí)際應(yīng)用價(jià)值,故不能籠統(tǒng)認(rèn)為99%可信區(qū)間比95%可信區(qū)間要好相反,在實(shí)際應(yīng)用中,95%可信區(qū)間更為常用44在可信度確定的情況下,增加樣本含量可減小