資源描述:
《《總體均數(shù)估計(jì)》PPT課件》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第六章參數(shù)估計(jì)基礎(chǔ)總體樣本統(tǒng)計(jì)推斷:用樣本信息推斷總體特征,包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)。1圖示:總體與樣本Populationμsample2sample1sample3sample4sample52抽樣試驗(yàn)(n=5)3抽樣試驗(yàn)(n=10)4抽樣試驗(yàn)(n=30)51000份樣本抽樣計(jì)算結(jié)果總體的均數(shù)總體標(biāo)準(zhǔn)差s均數(shù)的均數(shù)均數(shù)標(biāo)準(zhǔn)差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.091363個(gè)抽樣實(shí)驗(yàn)結(jié)果圖示7①各樣本均數(shù)未必等于總體均數(shù);②各樣本均數(shù)間存在差異;③樣本均數(shù)的分布
2、為中間多,兩邊少,左右基本對(duì)稱。④樣本均數(shù)的變異范圍較之原變量的變異范圍大大縮小。樣本均數(shù)的抽樣分布具有如下特點(diǎn)89中心極限定理:(1)從正態(tài)總體中作隨機(jī)抽樣,則樣本均數(shù)服從正態(tài)分布;從偏態(tài)總體中作隨機(jī)抽樣,樣本含量n足夠大(n>30)則樣本均數(shù)近似服從正態(tài)分布。(2)從總體均數(shù)為μ,標(biāo)準(zhǔn)差為σ的正態(tài)總體中抽取例數(shù)為n的樣本,樣本均數(shù)的總體均數(shù)為μ,標(biāo)準(zhǔn)差為。1011樣本頻率的抽樣分與抽樣誤差黑球的比例為20%,重復(fù)摸球50次,計(jì)算摸到黑球的頻率?黑球比例(%)樣本頻數(shù)樣本頻率(%)黑球比例(%)樣本頻數(shù)樣本頻率(%)822.00221111.001044.00241111.001
3、288.002666.001477.002833.00161111.003044.00181313.003211.00201919.00合計(jì)100100.00表6-3π=20%的隨機(jī)抽樣結(jié)果(n=50)12一、抽樣誤差與標(biāo)準(zhǔn)誤1.抽樣誤差:由于抽樣造成的樣本統(tǒng)計(jì)量與總體參數(shù)以及樣本統(tǒng)計(jì)量與樣本統(tǒng)計(jì)量之間的差異。抽樣誤差是不可避免的,但可以估計(jì)。2.標(biāo)準(zhǔn)誤(Standarderror,SE):標(biāo)準(zhǔn)誤為樣本均數(shù)的標(biāo)準(zhǔn)差,用表示,是說明樣本均數(shù)抽樣誤差的大小的指標(biāo),描述樣本均數(shù)的離散程度,反映用樣本均數(shù)估計(jì)或推斷總體均數(shù)的可靠性。133.標(biāo)準(zhǔn)誤的計(jì)算均數(shù)的標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比,與樣本例數(shù)
4、的平方根成反比。若標(biāo)準(zhǔn)差固定不變時(shí),可增加n而縮小抽樣誤差。14對(duì)于二項(xiàng)分布,X~B(n,π),則樣本頻率其標(biāo)準(zhǔn)誤:實(shí)際中,π一般未知,常用樣本頻率p近似代替則其標(biāo)準(zhǔn)誤:154.標(biāo)準(zhǔn)誤的應(yīng)用(1)表示抽樣誤差大小,描述(n相同)樣本統(tǒng)計(jì)量的離散程度,反映用樣本統(tǒng)計(jì)量估計(jì)或推斷總體參數(shù)的可靠性;(2)用于估計(jì)總體參數(shù)的可信區(qū)間;(3)用于進(jìn)行樣本均數(shù)/頻率的假設(shè)檢驗(yàn)。1617二、t分布的概念1819式中為自由度(degreeoffreedom,df)3.實(shí)際工作中,由于未知,用代替,則不再服從標(biāo)準(zhǔn)正態(tài)分布,而服從t分布。20214.t分布曲線的特征:(1)t分布是一簇曲線。它受自由度
5、的影響,自由度不同曲線形狀不同。(2)ν是t分布曲線的參數(shù):n越小,ν越小,曲線越平緩n越大,ν越大,曲線越陡峭n→∞,曲線近似于標(biāo)準(zhǔn)正態(tài)分布曲線。(3)以0為中心,左右對(duì)稱呈鐘形。(4)標(biāo)準(zhǔn)正態(tài)分布是t分布的特例。2223t界值表:詳見附表2,可反映t分布曲線下的面積。單側(cè)概率或單尾概率:用表示;雙側(cè)概率或雙尾概率:用表示。24-tt025三、總體參數(shù)的估計(jì)1.參數(shù)估計(jì):用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)。包括點(diǎn)估計(jì)和區(qū)間估計(jì)。(1)點(diǎn)估計(jì)(PointEstimation):直接用樣本指標(biāo)作為總體參數(shù)的估計(jì);(2)區(qū)間估計(jì)(IntervalEstimation):用預(yù)先給定的概率(可信度、
6、把握度1-α)估計(jì)總體參數(shù)所在的范圍。此范圍稱為置信區(qū)間(可信區(qū)間):ConfidenceInterval,CI261.點(diǎn)估計(jì)(pointestimation)用相應(yīng)樣本統(tǒng)計(jì)量直接作為其總體參數(shù)的估計(jì)值。、S估計(jì)其方法雖簡單,但未考慮抽樣誤差的大小。27按預(yù)先給定的概率(1??)所確定的包含未知總體參數(shù)的一個(gè)范圍。總體均數(shù)的區(qū)間估計(jì):按預(yù)先給定的概率(1??)所確定的包含未知總體均數(shù)的一個(gè)范圍。如給定?=0.05,該范圍稱為參數(shù)的95%可信區(qū)間或置信區(qū)間;如給定?=0.01,該范圍稱為參數(shù)的99%可信區(qū)間或置信區(qū)間。2.區(qū)間估計(jì)(intervalestimation):28總體均數(shù)
7、置信區(qū)間的計(jì)算需考慮:(1)總體標(biāo)準(zhǔn)差?是否已知,(2)樣本含量n的大小通常有兩類方法:(1)t分布法(2)z分布法總體均數(shù)置信區(qū)間的計(jì)算29總體均數(shù)置信區(qū)間的計(jì)算1、t分布法當(dāng)總體標(biāo)準(zhǔn)差σ未知且n≤50時(shí)總體均數(shù)的雙側(cè)(1-α)置信區(qū)間總體均數(shù)的單側(cè)(1-α)置信區(qū)間3031322、正態(tài)分布近似法當(dāng)σ已知或σ未知,但n>50時(shí)總體均數(shù)的雙側(cè)(1-α)置信區(qū)間33總體均數(shù)的單側(cè)(1-α)置信區(qū)間34例3-3某地抽取正常成年人200名,測得其血清膽固醇的均數(shù)為3.64m