資源描述:
《數(shù)值變量資料的統(tǒng)計(jì)推斷(兩組資料).ppt》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、數(shù)值變量資料的統(tǒng)計(jì)推斷——兩組資料均數(shù)的比較計(jì)量資料本科班《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》Dr.朱彩華制作兩組資料均數(shù)的比較第一節(jié)均數(shù)的抽樣誤差第二節(jié)t分布與可信區(qū)間第三節(jié)t檢驗(yàn)第四節(jié)假設(shè)檢驗(yàn)的步驟及其有關(guān)概念預(yù)防醫(yī)學(xué)教研室朱彩華總體樣本抽取部分觀察單位統(tǒng)計(jì)量參數(shù)統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷statisticalinference如:樣本均數(shù)樣本標(biāo)準(zhǔn)差S樣本率p如:總體均數(shù)總體標(biāo)準(zhǔn)差總體率內(nèi)容:參數(shù)估計(jì)(estimationofparameters)包括:點(diǎn)估計(jì)與區(qū)間估計(jì)2.假設(shè)檢驗(yàn)(testofhypothesis)隨機(jī)預(yù)防醫(yī)學(xué)教研室朱彩華總體樣本抽取部分觀察單位統(tǒng)計(jì)量參數(shù)統(tǒng)計(jì)推斷第一節(jié)均數(shù)的抽樣誤差如:樣本均數(shù)樣本
2、標(biāo)準(zhǔn)差S樣本率P如:總體均數(shù)總體標(biāo)準(zhǔn)差總體率抽樣誤差(samplingerror):由于個(gè)體差異導(dǎo)致的樣本統(tǒng)計(jì)量與總體參數(shù)以及各樣本統(tǒng)計(jì)量間的差別。預(yù)防醫(yī)學(xué)教研室朱彩華一、抽樣試驗(yàn)從正態(tài)分布總體N(5.00,0.50)中,每次隨機(jī)抽取樣本含量n=5,并計(jì)算其均數(shù)與標(biāo)準(zhǔn)差;重復(fù)抽取1000次,獲得1000份樣本;計(jì)算1000份樣本的均數(shù)與標(biāo)準(zhǔn)差,并對(duì)1000份樣本的均數(shù)作直方圖。按上述方法再做樣本含量n=10、樣本含量n=30的抽樣實(shí)驗(yàn);比較計(jì)算結(jié)果。預(yù)防醫(yī)學(xué)教研室朱彩華抽樣試驗(yàn)(n=5)預(yù)防醫(yī)學(xué)教研室朱彩華抽樣試驗(yàn)(n=10)預(yù)防醫(yī)學(xué)教研室朱彩華抽樣試驗(yàn)(n=30)預(yù)防醫(yī)學(xué)教研室朱彩華10
3、00份樣本抽樣計(jì)算結(jié)果總體的均數(shù)總體標(biāo)準(zhǔn)差s均數(shù)的均數(shù)均數(shù)標(biāo)準(zhǔn)差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.0913X≈?標(biāo)準(zhǔn)誤(即抽樣誤差)的大?。号cS成正比與n成反比;S一定時(shí),增大n可減小抽樣誤差預(yù)防醫(yī)學(xué)教研室朱彩華3個(gè)抽樣實(shí)驗(yàn)結(jié)果圖示預(yù)防醫(yī)學(xué)教研室朱彩華抽樣實(shí)驗(yàn)小結(jié)均數(shù)的均數(shù)圍繞總體均數(shù)上下波動(dòng)。均數(shù)的標(biāo)準(zhǔn)差即標(biāo)準(zhǔn)誤與總體標(biāo)準(zhǔn)差相差一個(gè)常數(shù)的倍數(shù),即樣本均數(shù)的標(biāo)準(zhǔn)誤(StandardError)=樣本標(biāo)準(zhǔn)差/從正態(tài)總體N(m,s)中抽取樣本,獲得均數(shù)的分布仍近似呈正態(tài)分
4、布N(m,s/?n)。預(yù)防醫(yī)學(xué)教研室朱彩華二、中心極限定理centrallimittheorem①即使從非正態(tài)總體中抽取樣本含量足夠大時(shí)(如n>30),所得均數(shù)分布仍近似呈正態(tài)。②隨著樣本量的增大,樣本均數(shù)的變異范圍也逐漸變窄。預(yù)防醫(yī)學(xué)教研室朱彩華X1S1X2S2XISiXnSnxσμσ標(biāo)準(zhǔn)誤示意圖預(yù)防醫(yī)學(xué)教研室朱彩華標(biāo)準(zhǔn)誤的應(yīng)用(1)表示抽樣誤差的大??;(2)表示樣本均數(shù)(x)代表總體均數(shù)(?)的可靠程度:x?Sx;(3)估計(jì)總體均數(shù)的可信區(qū)間;(4)假設(shè)檢驗(yàn)。預(yù)防醫(yī)學(xué)教研室朱彩華第二節(jié)t分布與可信區(qū)間一、t分布(tdistribution)二、總體均數(shù)的估計(jì)1.總體均數(shù)的點(diǎn)估計(jì)(poi
5、ntestimation)與區(qū)間估計(jì)2.總體均數(shù)的可信區(qū)間(confidenceinterval,CI)3.總體均數(shù)差的可信區(qū)間4.大樣本總體均數(shù)的可信區(qū)間三、可信區(qū)間的解釋預(yù)防醫(yī)學(xué)教研室朱彩華一、t分布隨機(jī)變量?N(m,s)標(biāo)準(zhǔn)正態(tài)分布N(0,1)u變換均數(shù)N(?,)標(biāo)準(zhǔn)正態(tài)分布N(0,1)t分布自由度:n-1預(yù)防醫(yī)學(xué)教研室朱彩華t分布的概率密度函數(shù)式中為伽瑪函數(shù);圓周率(Excel函數(shù)為PI())為自由度(degreeoffreedom),是t分布的唯一參數(shù);t為隨機(jī)變量。以t為橫軸,f(t)為縱軸,可繪制t分布曲線。預(yù)防醫(yī)學(xué)教研室朱彩華t分布曲線t分布有如下性質(zhì):①單峰分布,曲線在t
6、=0處最高,并以t=0為中心左右對(duì)稱(chēng)②與正態(tài)分布相比,曲線最高處較矮,兩尾部翹得高(如V=5或1)③隨自由度增大,曲線逐漸接近正態(tài)分布;分布的極限為標(biāo)準(zhǔn)正態(tài)分布。?=∞(t?u)?=5?=1預(yù)防醫(yī)學(xué)教研室朱彩華t分布曲線下面積(附表9-1)雙側(cè)t0.05/2,9=2.262=單側(cè)t0.025,9單側(cè)t0.05,9=1.833雙側(cè)t0.01/2,9=3.250=單側(cè)t0.005,9單側(cè)t0.01,9=2.821雙側(cè)t0.05/2,∞=1.96=單側(cè)t0.025,∞單側(cè)t0.05,∞=1.64預(yù)防醫(yī)學(xué)教研室朱彩華根據(jù)t分布的變化特征,歸納以下兩點(diǎn):①在相同的P條件下,υ越小,t值越大、υ越大,
7、t值越小。②在相同的υ條件下,P越小,t值越大。即:t值越大、P越小t值越小、P越大③在相同的t值、υ條件下,雙側(cè)概率P為單側(cè)概率P的兩倍、或單側(cè)概率P為雙側(cè)概率P的一半。即t值表規(guī)律:自由度(υ)一定時(shí),P與t成反比;概率(P)一定時(shí),υ與t成反比;預(yù)防醫(yī)學(xué)教研室朱彩華二、總體均數(shù)的估計(jì)總體均數(shù)的點(diǎn)估計(jì)(pointestimation)與區(qū)間估計(jì):參數(shù)的估計(jì)點(diǎn)估計(jì):由樣本統(tǒng)計(jì)量直接估計(jì)總體參數(shù)區(qū)間估計(jì):考慮抽樣誤差的影