資源描述:
《統(tǒng)計(jì)學(xué)計(jì)量資料的統(tǒng)計(jì)描述方法.docx》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、計(jì)量資料的統(tǒng)計(jì)描述方法怎樣表達(dá)一組數(shù)據(jù)?描述計(jì)量資料的常用指標(biāo)—A、描述平均水平(中心位置):均數(shù)、中位數(shù)和百分位數(shù)、幾何均數(shù)G、眾數(shù)(mode)B、描述數(shù)據(jù)的分散程度:標(biāo)準(zhǔn)差、四分位數(shù)間距、變異系數(shù)、方差、全距(一)均數(shù)mean和標(biāo)準(zhǔn)差standarddeviation1.(算術(shù))均數(shù)均數(shù)是描述一組計(jì)量資料平均水平或集中趨勢(shì)的指標(biāo)。*直接計(jì)算公式:應(yīng)用條件:適用于對(duì)稱分布,特別是正態(tài)分布資料。2.中位數(shù)(median)M和百分位數(shù)(percentile)A.中位數(shù)M是將一組觀察值從小到大排序后,居于中間位置的那個(gè)值或兩個(gè)中間值的平均值。應(yīng)用條件:用于任何分布類型,包括偏態(tài)資料、兩端數(shù)據(jù)無(wú)界限
2、的資料。計(jì)算:n為奇數(shù)時(shí)--n為偶數(shù)時(shí)--9人數(shù)據(jù):12,13,14,14,15,15,15,17,19天B.百分位數(shù)是將N個(gè)觀察值從小到大依次排列,再分成100等份,對(duì)應(yīng)于X%位的數(shù)值即為第X百分位數(shù)。中位數(shù)是第百分50位數(shù)。四分位數(shù)間距(quartilerange)=第25百分位數(shù)(P25)~第75百分位數(shù)(P75)。四分位數(shù)間距用于描述偏態(tài)資料的分散程度(代替標(biāo)準(zhǔn)差S),包含了全部觀察值的一半。百分位數(shù)計(jì)算(頻數(shù)表法)::第X百分位數(shù)所在組段下限:小于各組段的累計(jì)頻數(shù):第X百分位數(shù)所在組段組距:總例數(shù)fx:所在組段頻數(shù)注:有的教材X=r;=C例:求頻數(shù)表的第25、第75百分位數(shù)(四分位數(shù)
3、間距)組段頻數(shù)累積頻數(shù)∑f56~2259~5762~1219∑f25L2565~1534P25在此68~255971~2685∑f75L7574~19104P75在此77~1511980~1012983~851130合計(jì)130①確定Px所在組段:P25所在的組段:nX%=130×25%=32.5,65~組最終的累積頻數(shù)=34,32.5落在65~組段內(nèi);P75所在的組段:nX%=130×75%=97.5,此值落在74~組段②確定Px所在組段的、、fx、③P25=65+3x[(130x25%-19)/15]=65.90P75=74+3x[(130x75%-85)/19]=74.66四分位數(shù)間距=6
4、5.90~74.66(次/分)3.幾何均數(shù)G(geometricmean)應(yīng)用:適用于成等比數(shù)列的資料,特別是服從對(duì)數(shù)正態(tài)分布資料。原始數(shù)據(jù)分布不對(duì)稱,經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布的資料。可用于反映一組經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布或正態(tài)分布的變量值在數(shù)量上的平均水平。例如抗體滴度。計(jì)算:N個(gè)數(shù)值的乘積開(kāi)N次方,即為這N個(gè)數(shù)的幾何均數(shù)。有8份血清的抗體效價(jià)分別為1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗體效價(jià)。使用分母計(jì)算!平均抗體效價(jià)為:1:57加權(quán)法:眾數(shù)是一組觀察值中出現(xiàn)頻率最高的那個(gè)觀察值;若為分組資料,眾數(shù)則是出現(xiàn)頻率最高的那個(gè)組段的組中值。適用于
5、大樣本但較粗糙。例:有16例病人的發(fā)病年齡為42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62,試求眾數(shù)。正態(tài)分布時(shí):均數(shù)=中位數(shù)=眾數(shù)
正(右)偏態(tài)分布時(shí):均數(shù)>中位數(shù)>眾數(shù)
負(fù)(左)偏態(tài)分布時(shí):均數(shù)<中位數(shù)<眾數(shù)3.標(biāo)準(zhǔn)差SS描述數(shù)據(jù)的分散程度.描述一組數(shù)據(jù)在其平均數(shù)周圍的分布情況,若每個(gè)數(shù)據(jù)集中在其平均數(shù)周圍,此平均數(shù)對(duì)這組數(shù)據(jù)的代表照就大;反之,代表性較差。標(biāo)準(zhǔn)差S甲組7580859095100105n1=71=90s1=10.8乙組45607590105120135n2=72=90s2=32.4,分子越大。或者標(biāo)準(zhǔn)差的5應(yīng)用:描述變異程度、
6、計(jì)算標(biāo)準(zhǔn)誤、計(jì)算變異系數(shù)、描述正態(tài)分布、估計(jì)正常值范圍S用于正態(tài)分布資料怎樣使用均數(shù)和標(biāo)準(zhǔn)差?論文中常用±S描述對(duì)稱、正態(tài)或近似正態(tài)分布數(shù)據(jù)的特征。描述偏態(tài)資料的分散程度需用四分位數(shù)間距P25~P75(代替標(biāo)準(zhǔn)差S)。方差:方差=S2全距R:R=最大值–最小值。簡(jiǎn)單,但僅利用了兩端點(diǎn)值,穩(wěn)定性差。變異系數(shù)(coefficientofvariation,CV):計(jì)算:CV=(S/)?100%,無(wú)單位應(yīng)用:1.單位不同的多組數(shù)據(jù)比較;2.均數(shù)相差懸殊的多組資料什么是正態(tài)分布?(二)正態(tài)分布(Normaldistribution)正態(tài)分布是描述連續(xù)型變量值分布的曲線.當(dāng)例數(shù)比較多時(shí),醫(yī)學(xué)上許多資料近
7、似服從正態(tài)分布。正態(tài)分布在統(tǒng)計(jì)推斷上有重要的作用。正態(tài)分布曲線理論上的特征(1)以X=μ均數(shù)為中心,X值呈鐘型分布,中央高、兩端對(duì)稱性減少、與X軸永不相交。(2)在X=μ處,f(x)取最大值(例數(shù)最多)。(3)正態(tài)分布由均數(shù)μ、標(biāo)準(zhǔn)差σ決定曲線的左右位置和高低形狀:正態(tài)分布有兩個(gè)參數(shù),即位置參數(shù)--均數(shù)和形態(tài)參數(shù)--標(biāo)準(zhǔn)差。若固定標(biāo)準(zhǔn)差,改變均數(shù)值,曲線沿著X軸平行移動(dòng),其形狀不變。若固定,越小,