資源描述:
《兩組資料均數(shù)的比較》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、第三章兩組資料均數(shù)的比較兩組資料均數(shù)的比較第一節(jié)均數(shù)的抽樣誤差第二節(jié)t分布與可信區(qū)間第三節(jié)t檢驗(yàn)第四節(jié)假設(shè)檢驗(yàn)的步驟及其有關(guān)概念總體樣本抽取部分觀察單位統(tǒng)計(jì)量參數(shù)統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷statisticalinference如:樣本均數(shù)樣本標(biāo)準(zhǔn)差S樣本率P如:總體均數(shù)總體標(biāo)準(zhǔn)差總體率內(nèi)容:參數(shù)估計(jì)(estimationofparameters)包括:點(diǎn)估計(jì)與區(qū)間估計(jì)2.假設(shè)檢驗(yàn)(testofhypothesis)總體樣本抽取部分觀察單位統(tǒng)計(jì)量參數(shù)統(tǒng)計(jì)推斷第一節(jié)均數(shù)的抽樣誤差如:樣本均數(shù)樣本標(biāo)準(zhǔn)差S樣本率P如:總體均數(shù)總體標(biāo)準(zhǔn)差總體
2、率抽樣誤差(samplingerror):由于個(gè)體差異導(dǎo)致的樣本統(tǒng)計(jì)量與總體參數(shù)間的差別。一、抽樣試驗(yàn)從正態(tài)分布總體N(5.00,0.502)中,每次隨機(jī)抽取樣本含量n=5,并計(jì)算其均數(shù)與標(biāo)準(zhǔn)差;重復(fù)抽取1000次,獲得1000份樣本;計(jì)算1000份樣本的均數(shù)與標(biāo)準(zhǔn)差,并對(duì)1000份樣本的均數(shù)作直方圖。按上述方法再做樣本含量n=10、樣本含量n=30的抽樣實(shí)驗(yàn);比較計(jì)算結(jié)果。抽樣試驗(yàn)(n=5)抽樣試驗(yàn)(n=10)抽樣試驗(yàn)(n=30)1000份樣本抽樣計(jì)算結(jié)果總體的均數(shù)總體標(biāo)準(zhǔn)差s均數(shù)的均數(shù)均數(shù)標(biāo)準(zhǔn)差n=55.000.504.
3、990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.09133個(gè)抽樣實(shí)驗(yàn)結(jié)果圖示抽樣實(shí)驗(yàn)小結(jié)均數(shù)的均數(shù)圍繞總體均數(shù)上下波動(dòng)。均數(shù)的標(biāo)準(zhǔn)差即標(biāo)準(zhǔn)誤與總體標(biāo)準(zhǔn)差相差一個(gè)常數(shù)的倍數(shù),即樣本均數(shù)的標(biāo)準(zhǔn)誤(StandardError)=樣本標(biāo)準(zhǔn)差/從正態(tài)總體N(m,s2)中抽取樣本,獲得均數(shù)的分布仍近似呈正態(tài)分布N(m,s2/n)。二、中心極限定理centrallimittheorem①即使從非正態(tài)總體中抽取樣本,所得均數(shù)分布仍近似呈正態(tài)。②隨著樣本量的增
4、大,樣本均數(shù)的變異范圍也逐漸變窄。第二節(jié)t分布與可信區(qū)間一、t分布(tdistribution)二、總體均數(shù)的估計(jì)1.總體均數(shù)的點(diǎn)估計(jì)(pointestimation)與區(qū)間估計(jì)2.總體均數(shù)的可信區(qū)間(confidenceinterval,CI)3.總體均數(shù)差的可信區(qū)間4.大樣本總體均數(shù)的可信區(qū)間三、可信區(qū)間的解釋一、t分布隨機(jī)變量XN(m,s2)標(biāo)準(zhǔn)正態(tài)分布N(0,12)u變換均數(shù)標(biāo)準(zhǔn)正態(tài)分布N(0,12)Studentt分布自由度:n-1t分布的概率密度函數(shù)式中為伽瑪函數(shù);圓周率(Excel函數(shù)為PI())為自由度(de
5、greeoffreedom),是t分布的唯一參數(shù);t為隨機(jī)變量。以t為橫軸,f(t)為縱軸,可繪制t分布曲線(xiàn)。t分布曲線(xiàn)t分布有如下性質(zhì):①單峰分布,曲線(xiàn)在t=0處最高,并以t=0為中心左右對(duì)稱(chēng)②與正態(tài)分布相比,曲線(xiàn)最高處較矮,兩尾部翹得高(見(jiàn)綠線(xiàn))③隨自由度增大,曲線(xiàn)逐漸接近正態(tài)分布;分布的極限為標(biāo)準(zhǔn)正態(tài)分布。t分布曲線(xiàn)下面積(附表2)雙側(cè)t0.05/2,9=2.262=單側(cè)t0.025,9單側(cè)t0.05,9=1.833雙側(cè)t0.01/2,9=3.250=單側(cè)t0.005,9單側(cè)t0.01,9=2.821雙側(cè)t0.05/2
6、,∞=1.96=單側(cè)t0.025,∞單側(cè)t0.05,∞=1.64二、總體均數(shù)的估計(jì)1.總體均數(shù)的點(diǎn)估計(jì)(pointestimation)與區(qū)間估計(jì)參數(shù)的估計(jì)點(diǎn)估計(jì):由樣本統(tǒng)計(jì)量直接估計(jì)總體參數(shù)區(qū)間估計(jì):在一定可信度(Confidencelevel)下,同時(shí)考慮抽樣誤差可信度與可信區(qū)間區(qū)間的可信度(如95%或99%)是重復(fù)抽樣(如1000次)時(shí),樣本(如n=5)區(qū)間包含總體參數(shù)(m)的百分?jǐn)?shù)。常用100(1-α)%或(1-α)表示,α值一般取0.05或0.01。可信度實(shí)驗(yàn)2.總體均數(shù)的可信區(qū)間3.兩總體均數(shù)差的可信區(qū)間4.大樣
7、本總體均數(shù)的可信區(qū)間(1)4.大樣本總體均數(shù)的可信區(qū)間(2)三、可信區(qū)間的解釋95%可信區(qū)間:從總體中作隨機(jī)抽樣,作100次抽樣,每個(gè)樣本可算得一個(gè)可信區(qū)間,得100個(gè)可信區(qū)間,平均有95個(gè)可信區(qū)間包括μ(估計(jì)正確),只有5個(gè)可信區(qū)間不包括μ(估計(jì)錯(cuò)誤)。95%可信區(qū)間99%可信區(qū)間公式區(qū)間范圍窄寬估計(jì)錯(cuò)誤的概率大(0.05)?。?.01)