資源描述:
《總體均數(shù)的估計.ppt》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、第六章總體均數(shù)的估計均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤t分布總體均數(shù)的估計為什么進(jìn)行抽樣?總體樣本隨機(jī)抽樣推斷抽樣誤差概念:由個體變異引起的,抽樣造成的樣本統(tǒng)計量與總體參數(shù)之間的差異稱為抽樣誤差(samplingerror)。均數(shù)的抽樣誤差均數(shù)的抽樣誤差:抽樣引起的樣本均數(shù)與總體均數(shù)的差異稱為均數(shù)的抽樣誤差。模擬試驗1從均數(shù)為4.5,標(biāo)準(zhǔn)差為0.2的正態(tài)總體中作隨機(jī)抽樣。當(dāng)樣本量為20時,隨機(jī)抽取100個樣本,其樣本均數(shù)、標(biāo)準(zhǔn)差及其總體均數(shù)的95%置信區(qū)間見表6.1??梢姡焊鳂颖揪鶖?shù)未必等于總體均數(shù);樣本均數(shù)之間存在差異樣本均數(shù)的頻數(shù)分布見表6.2可見:樣本均數(shù)的分布很有規(guī)律,圍繞著總體均數(shù)4.5,
2、中間多、兩邊少,左右對稱。模擬試驗1從均數(shù)為4.5,標(biāo)準(zhǔn)差為0.2的正態(tài)總體中作隨機(jī)抽樣,規(guī)定樣本含量分別為5、10、20、50,每種樣本含量均重復(fù)抽取1000次,結(jié)果可得到4個不同樣本含量的樣本均數(shù)的抽樣分布圖如圖6.1??梢姡旱玫降臉颖揪鶖?shù)的分布仍然近似服從正態(tài)分布。數(shù)理統(tǒng)計的中心極限定理從正態(tài)分布N(?,?2)中,以固定n抽取樣本,樣本均數(shù)的分布仍服從正態(tài)分布。模擬試驗2從非正態(tài)總體中抽樣,觀察其樣本均數(shù)的抽樣分布。非正態(tài)總體的分布如圖6.2所示。規(guī)定樣本含量分別為5、10、20、50,每種樣本含量均重復(fù)抽取1000次,結(jié)果也可得到4個不同樣本含量的樣本均數(shù)的抽樣分布圖(圖6.3)
3、。數(shù)理統(tǒng)計的中心極限定理即使是從偏態(tài)分布總體抽樣,只要n足夠大,樣本均數(shù)的分布也近似正態(tài)分布。數(shù)理統(tǒng)計的中心極限定理樣本均數(shù)的總體均數(shù)仍為?,樣本均數(shù)的標(biāo)準(zhǔn)差為。標(biāo)準(zhǔn)誤(standarderror)樣本均數(shù)的標(biāo)準(zhǔn)差稱標(biāo)準(zhǔn)誤,是說明均數(shù)抽樣誤差大小的指標(biāo),大,抽樣誤差大;反之,小,抽樣誤差小。標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤的計算:標(biāo)準(zhǔn)誤的估計值影響標(biāo)準(zhǔn)誤大小的因素的大小與?成正比與樣本含量n的平方根成反比抽樣誤差越小,表明樣本均數(shù)與總體均數(shù)越接近,即用樣本均數(shù)估計總體均數(shù)的可靠性越大;反之,抽樣誤差越大,則用樣本均數(shù)估計總體均數(shù)的可靠性越小。P74例6.1,6.2t分布t分布的由來t分布的特征t分布曲線下的
4、面積t分布的由來變量變換總體樣本均數(shù)中心極限定理標(biāo)準(zhǔn)正態(tài)分布變量變換未知t分布英國W.S.Gosset于1908年以“student”筆名發(fā)表論文,證明它服從自由度為n-1的t分布如果抽取例數(shù)n=5的樣本1000個,每個樣本又都可以按下式計算出一個t值,可將1000個t值編制成頻數(shù)表,作出直方圖,則可得到一條光滑的曲線。(式6.3)同理,如果抽取例數(shù)n=15時,仍能得到一條t分布曲線,因此,當(dāng)n變化時,就可以得到不同的t分布曲線,如圖6.4:圖6.4自由度分別為1、5、∞的t分布t分布的特征t分布是一簇曲線。t分布以0為中心,左右對稱。其形態(tài)變化與自由度?的大小有關(guān)。自由度?越小,則t值
5、越分散,曲線越低平;自由度?逐漸增大時,t分布逐漸逼近u分布(標(biāo)準(zhǔn)正態(tài)分布);當(dāng)?=∞時,t分布即為u分布。t分布曲線下面積規(guī)律t分布曲線下總面積仍為1或100%t分布曲線下面積以0為中心左右對稱。t分布曲線下面積規(guī)律由于t分布是一簇曲線,故t分布曲線下面積固定面積(如95%或99%)的界值不是一個常量,而是隨自由度的大小而變化,如P439附表3。附表2,t分布表的特點附表2的橫標(biāo)目為自由度?,縱標(biāo)目為概率P。一側(cè)尾部面積稱為單尾概率,兩側(cè)尾部面積之和稱為雙尾概率表中數(shù)字表示?和確定時,對應(yīng)的t界值,記作t?,?。附表2,t分布表的特點單尾概率對應(yīng)的t界值用t?,?表示雙尾概率對應(yīng)的t界
6、值用t?/2,?表示當(dāng)?=30時,單側(cè)概率P=0.05時單側(cè)t?,?=1.697當(dāng)?=30時,雙側(cè)概率P=0.05時雙側(cè)t?/2,?=2.042exampleexample單側(cè):P(t≤-t0.05,30=-1.697)=0.05P(t≥t0.05,30=1.697)=0.05雙側(cè):P(t≤-t0.05/2,30)+P(t≥t0.05/2,30)=0.05其通式為單側(cè):P(t≤-t?,?)=?或P(t≥t?,?)=?雙側(cè):P(t≤-t?/2,?)+P(t≥t?/2,?)=?圖中非陰影部分面積的概率為,P(-t?/2,?7、計算的t值為負(fù)值時,可用其絕對值查表??傮w均數(shù)的估計總體樣本隨機(jī)抽樣推斷統(tǒng)計分析統(tǒng)計描述統(tǒng)計推斷參數(shù)估計假設(shè)檢驗參數(shù)估計用樣本指標(biāo)估計總體指標(biāo)稱為參數(shù)估計,是統(tǒng)計推斷的一個重要方面??傮w均數(shù)估計的兩種方法點估計區(qū)間估計點估計是直接用樣本統(tǒng)計量直接作為總體參數(shù)的估計值.點估計的缺點沒有考慮抽樣誤差,無法評價估計值與真實值之間的差距總體均數(shù)估計的兩種方法點估計區(qū)間估計區(qū)間估計概念:即按預(yù)先給定的概率估計參數(shù)所在的范圍。該范圍亦稱可信區(qū)間