資源描述:
《Stata軟件基本操作:統(tǒng)計描述入門.docx》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、Stata軟件基本操作和數(shù)據(jù)分析入門第二講統(tǒng)計描述入門趙耐青一調(diào)查某市1998年110名19歲男性青年的身高(cm)資料如下,計算均數(shù)、標(biāo)準(zhǔn)差、中位數(shù)、百分位數(shù)和頻數(shù)表。173.1167.8173.9176.9173.8171.5175.1175.2176.7174.5169.2174.7185.4175.8173.5175.9175.9173.2174.8177.2171.9166.0177.3175.2179.8175.7180.8171.4178.9172.6166.9170.8168.7175.0183.7171.6172.9173.6177.7172.4181.2178.
2、1173.3177.5173.0174.3174.5172.5171.3174.0177.9170.7175.2178.5177.6183.3173.1170.9180.5176.8179.6180.6176.6174.3168.7175.2179.5172.5173.0174.2169.5177.0183.6170.3178.8181.1182.9177.8164.1169.1176.3169.4171.1172.9177.0179.8178.2174.4169.2176.4178.3165.0175.8181.0177.6177.4178.7175.1181.8171.3174
3、.8181.7177.3178.5179.3177.0175.8181.8177.5180.2Stata數(shù)據(jù)結(jié)構(gòu)(讀者可以把數(shù)據(jù)直接粘貼到Stata的Edit窗口)在介紹統(tǒng)計分析命令之前,先介紹打開一個保存統(tǒng)計分析結(jié)果的文件操作:計算樣本的均數(shù)、標(biāo)準(zhǔn)差、最大值和最小值命令1:su變量名(可以多個變量:即:su變量名1變量名2…變量名m)命令2:su變量名,d(可以多個變量:即:su變量名1變量名2…變量名m,d)本例命令sux本例命令.sux,d計算百分位數(shù)還可以用專用命令centile。centile變量名(可以多個變量),centile(要計算的百分位數(shù))例如計算P2.5,P9
4、7.5等centile變量名,centile(2.597.5)本例計算P2.5,P97.5,P50,P25,P75。本例命令.centilex,centile(2.525507597.5)制作頻數(shù)表,組距為2,從164開始,genf=int((x-164)/2)*2+164其中int()表示取整數(shù)tabf頻數(shù)匯總和頻率計算作頻數(shù)圖命令graph變量,bin(#)norm其中#表示頻數(shù)圖的組數(shù);norm表示畫一條相應(yīng)的正態(tài)曲線(可以不要)本例命令為graphx,bin(8)norm為了使坐標(biāo)更清楚地在圖上顯示,可以輸入下列命令graphx,bin(8)xlabelnormylabel
5、圖形可以從Stata中復(fù)制到word中來,操作如下:計算幾何均數(shù)可以用means變量名(可以多個變量:即:means變量1…變量m)meansx作Pie圖描述構(gòu)成比:每一類的頻數(shù)用一個變量表示,命令:graph各類頻數(shù)變量名,pie第1地區(qū)血型構(gòu)成比的Pie圖的命令和圖graphaboabifarea==1,pie注意邏輯表達(dá)式中ifarea==1是兩個等號。第2地區(qū)血型構(gòu)成比的Pie圖的命令和圖graphaboabifarea==2,pie正態(tài)性檢驗(yàn).swilk變量名1變量名2…變量名m在上例中的110名19歲男性青年的身高資料正態(tài)性檢驗(yàn)如下:.swilkx無效假設(shè)H0:資料服從
6、正態(tài)分布備選假設(shè)H1:資料不服從正態(tài)分布設(shè)α=0.05(樣本比較大時,α取0.05,樣本很小時,α取0.1)因此可以認(rèn)為資料近似服從正態(tài)分布。計量資料統(tǒng)計描述的主要策略。若資料近似正態(tài)分布,則用均數(shù)±標(biāo)準(zhǔn)差描述若資料偏態(tài)分布(頻數(shù)圖明顯不對稱),則用中位數(shù)(P25――P75)描述P25――P75稱為四分位數(shù)范圍(Inter-quartilerange,IQR)但在一些臨床試驗(yàn)資料統(tǒng)計分析時,往往給出樣本均數(shù)、標(biāo)準(zhǔn)差、中位數(shù)、四分位數(shù)范圍、最小值和最大值,但對結(jié)果的主要解釋按照上述策略進(jìn)行進(jìn)行。