資源描述:
《武漢大學(xué) SAS教案 第五講 T檢驗(yàn)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、第5講HypothesisTest(T檢驗(yàn))假設(shè)檢驗(yàn)概述有一批罐頭,標(biāo)稱(chēng)重量500g,據(jù)以往經(jīng)驗(yàn),標(biāo)準(zhǔn)公差為20g;現(xiàn)抽100罐,X=505g,問(wèn)是否可以認(rèn)為合乎標(biāo)準(zhǔn)?今年小白菜與去年的1.98元/公斤是否有顯著變化?美國(guó)法律:無(wú)罪推定原假設(shè)H0:被告無(wú)罪備擇假設(shè)H1:被告有罪注:不能證明其有罪便認(rèn)為無(wú)罪特點(diǎn)有標(biāo)準(zhǔn)值、經(jīng)驗(yàn)值或者根據(jù)其他途徑所導(dǎo)引的假設(shè)及猜測(cè)值,并欲對(duì)此做進(jìn)一步的檢驗(yàn)“慎重”的態(tài)度,不輕易否定:參考西方法律,重證據(jù),不能證明其有罪,便判為無(wú)罪檢驗(yàn)的設(shè)計(jì)檢驗(yàn)一批罐頭,重要的指標(biāo)之一是其均值是否與標(biāo)
2、稱(chēng)值500g有明顯的差異?辦法一:普查,求出m,既可知標(biāo)稱(chēng)值的差異有多大(或可判定差異是否在給定的許可范圍之)?但費(fèi)時(shí)費(fèi)力,有時(shí)甚至不可行辦法二:因尚無(wú)證據(jù)表明存在明顯差異,所以取慎重態(tài)度,先作假設(shè)H0:m=m0=500注:此處的“=”是表意的,應(yīng)理解為“差不多”檢驗(yàn)的設(shè)計(jì)如H0成立,則應(yīng)該在500的周?chē)?;于是,在H0:m與m0差不多的假設(shè)下有圖檢驗(yàn)的設(shè)計(jì)當(dāng)距離m較遠(yuǎn)(一般可先給定兩角各a/2的面積)當(dāng)進(jìn)入該面積時(shí),則判定為“較遠(yuǎn)”。見(jiàn)圖a/2a/2臨界點(diǎn)臨界點(diǎn)一、假設(shè)檢驗(yàn)例:欲知道今年小白菜與去年的1.98元/
3、公斤是否有顯著變化?零假設(shè):今年的價(jià)格是1.98對(duì)立假設(shè):今年的價(jià)格不是1.981.假設(shè)檢驗(yàn)的過(guò)程對(duì)樣本作一個(gè)零假設(shè),然后通過(guò)計(jì)算樣本的統(tǒng)計(jì)量,并根據(jù)得到的P值檢驗(yàn)數(shù)據(jù)是否支持零假設(shè)。一、假設(shè)檢驗(yàn)2.假設(shè)檢驗(yàn)的P值表示在假設(shè)為真的條件下,能夠取到所計(jì)算的統(tǒng)計(jì)量的概率值。P值很?。壕芙^零假設(shè),統(tǒng)計(jì)量的值不可能合理地偶然取到。P值較大:不拒絕零假設(shè),統(tǒng)計(jì)量的值在零假設(shè)為真的條件下可能偶然地取到。一、假設(shè)檢驗(yàn)3.統(tǒng)計(jì)顯著性是選擇顯著性水平控制犯錯(cuò)誤風(fēng)險(xiǎn)的一種方式。一般取值如下:0.10中等顯著0.05顯著0.01非常顯
4、著假設(shè)檢驗(yàn)的過(guò)程選擇零假設(shè)和對(duì)立假設(shè)根據(jù)樣本數(shù)據(jù)計(jì)算統(tǒng)計(jì)量,計(jì)算P值把P值同顯著性水平比較并作出判斷二、均值比較引例:上海市男性律師比女性律師收入高嗎?對(duì)病人治療前后生理指標(biāo)的變化顯著嗎?……兩組數(shù)據(jù)均值比較需要解決的問(wèn)題:(1)判斷兩組獨(dú)立還是有成對(duì)關(guān)系(2)概括兩組數(shù)據(jù)(3)用SAS建立統(tǒng)計(jì)假設(shè)進(jìn)行檢驗(yàn)(4)解釋SAS的輸出二、均值比較獨(dú)立組:男女律師的收入(任一男性律師工資與任一女性律師工資毫不相干)成對(duì)組:治療前后生理指標(biāo)的變化。三、T檢驗(yàn)簡(jiǎn)介1.T檢驗(yàn)的意義兩樣本某變量均值不同,其差異是否具有統(tǒng)計(jì)意義?
5、三、T檢驗(yàn)1.樣本均數(shù)與總體均數(shù)差別的顯著性檢驗(yàn)例:已知某水樣中含CaCo3的真值為20.7mg/L,現(xiàn)用某方法重復(fù)測(cè)定該水樣11次,CaCo3的含量為:20.99,20.41,20.10,20.00,20.91,22.60,20.99,20.41,20,23,22。問(wèn)用該法測(cè)水中CaCo3的含量所得的均值與真值有無(wú)顯著差別?1.樣本均數(shù)與總體均數(shù)差別的顯著性檢驗(yàn)數(shù)據(jù)集的建立將數(shù)據(jù)復(fù)制到word中,用查找替換的功能將數(shù)據(jù)之間的分隔符逗號(hào)替換成回車(chē)符號(hào)在word中將數(shù)據(jù)轉(zhuǎn)換成表格,并復(fù)制在excel中用選擇性粘貼,
6、粘貼文本,并編輯數(shù)據(jù),求出差值,存為文本文件轉(zhuǎn)成SAS數(shù)據(jù)集1.樣本均數(shù)與總體均數(shù)差別的顯著性檢驗(yàn)用分析員應(yīng)用進(jìn)行T檢驗(yàn)solutions/Analysis/Analyst打開(kāi)數(shù)據(jù)集Statistics/HypothesisTests/One-Samplet-testforamean選擇變量?VariableOK1.樣本均數(shù)與總體均數(shù)差別的顯著性檢驗(yàn)程序?qū)崿F(xiàn)T檢驗(yàn)DATAT1;INPUTX@@;Y=X-20.7;CARDS;20.9920.4120.1020.0020.9122.6020.9920.4120232
7、2procmeansmeanstdstderrtprtdata=t1;vary;run;1.樣本均數(shù)與總體均數(shù)差別的顯著性檢驗(yàn)檢驗(yàn)結(jié)果的分析:0.3125,按α=0.05水平,不拒絕H0假設(shè)。因此,該方法所測(cè)出水中CaCo3含量的均值與真值無(wú)顯著差異。此法可信。應(yīng)用克矽平治療前后10名患者血紅蛋白的含量如下,問(wèn)該藥是否會(huì)引起血紅蛋白的變化?治療前:11.315.015.013.512.810.011.012.013.012.3治療后:14.013.814.013.513.512.014.711.413.812.0
8、2.同一批實(shí)驗(yàn)對(duì)象前后差異的顯著性檢驗(yàn)(配對(duì)T檢驗(yàn))參考程序:Datat2;Inputxy@@;d=x-y;Cards;11.314.015.013.815.014.013.513.512.813.510.012.011.014.712.011.413.013.812.312.0Procmeansmeanstdstderrtprt;Vard;Run;2.同一批實(shí)驗(yàn)對(duì)象前后