資源描述:
《醫(yī)學統(tǒng)計學第二章.ppt》由會員上傳分享,免費在線閱讀,更多相關內容在教育資源-天天文庫。
1、2統(tǒng)計資料的整理與描述原始資料雜亂無章【例2.1】2011年某市120名7歲男童身高(cm)資料如下,試編制頻數(shù)表。分類資料的整理列出類別,計算頻數(shù),列表2.1頻數(shù)表資料整理的必要性條理化,系統(tǒng)化,顯示數(shù)量特征、分布規(guī)律,便于進一步統(tǒng)計分析數(shù)值變量資料的整理2.1.1.頻數(shù)表的編制【例2.1】2011年某市120名7歲男童身高(cm)資料如下,試編制頻數(shù)表。頻數(shù)表的編制方法如下:(1)找出觀察值中的最大值和最小值,并求出極差(2)決定組段數(shù)、組段和組距確定組段數(shù)要以充分反映數(shù)據(jù)的分布特征為原則組距=26.6/10=2.66可以參考斯特奇斯(Sturges)提出的經(jīng)驗公式來確定分組數(shù)(3)列
2、表劃記:計算各組段包含的觀察單位個數(shù)2.1.2頻數(shù)分布的圖示圖2.12011年某地120名7歲男童身高的頻數(shù)分布2.1.3.頻數(shù)分布的分析對頻數(shù)表的分析,主要在于以下幾個方面:(1)有無可疑值通過對頻數(shù)分布的分析,發(fā)現(xiàn)某些特大或特小的離群值、可疑值(2)分布的類型頻數(shù)分布可分為對稱分布和偏態(tài)分布兩種類型.不同類型的分布,應采用不同的統(tǒng)計分析方法對稱分布,是指觀察值向中央部分集中,以中等數(shù)據(jù)居多,左右兩側分布大體對稱。如:正常人身高、體重,脈搏,血紅蛋白等的分布對稱分布所謂偏態(tài)分布,是指觀察值偏離中央尾部偏向數(shù)軸正側(或右側),稱正偏態(tài)(或右偏態(tài));如:食物中毒引起腹瀉的潛伏期尾部偏向數(shù)軸負
3、側(或左側),稱負偏態(tài)(或左偏態(tài))如:慢性病患者年齡的分布左偏態(tài)右偏態(tài)(3)分布特征分布的兩個重要特征:集中趨勢和離散趨勢總體中的個體總是具有同質性,這些同質性使得觀察值應趨向同一數(shù)值(即集中趨勢)。同一總體中的個體之間又普遍存在著各種差別,使得個體觀察值不會完全相同。2.2集中趨勢的描述平均數(shù)反映一組觀察值的集中趨勢、中心位置或平均水平它是該組數(shù)據(jù)的代表,能對一群同類事物或現(xiàn)象的數(shù)量特征作出概括的說明,是統(tǒng)計學中應用最廣泛、最重要的一個指標體系。常用的平均數(shù)有(算術)均數(shù),幾何均數(shù)和中位數(shù)2.2.1均數(shù)均數(shù)是算術均數(shù)的簡稱,習慣上用希臘字母表示總體均數(shù);用表示樣本均數(shù)。均數(shù)反映一組觀察值
4、在數(shù)量上的平均水平,最適合單峰對稱分布資料的平均水平的描述。1)未分組資料(原始資料)的均數(shù)的計算方法:將所有的觀察值直接相加,再除以總觀察數(shù)n【例2.3】求表2.1中資料的均數(shù)2.2.2幾何均數(shù)有些醫(yī)學資料,如抗體的滴度,細菌計數(shù)等,其頻數(shù)分布呈明顯偏態(tài),各觀察值之間呈倍數(shù)變化(等比關系),算術均數(shù)對這類資料集中趨勢的代表性就差,這時宜用幾何均數(shù)反映其平均增(減)倍數(shù)。幾何均數(shù)一般用G表示,適用于各變量值之間成倍數(shù)關系,但作對數(shù)變換后指標成單峰對稱分布的資料。【例2.4】5人的血清抗體滴度分別為1:10,1:20,1:40,1:40,1:160,求平均滴度?!纠?.5】某地107人接種疫
5、苗后抗體滴度見表2.2第(1)(2)欄,求平均滴度。表2.2107例試驗受試者免疫后麻疹HI抗體滴度及平均滴度計算計算幾何均數(shù)時注意變量值中不能有0,因為0與任何數(shù)的乘積均為0,且0不能取對數(shù)。同一組變量值不能同時存在正、負值。若變量值全為負值,可在計算時將負號除去,算出結果后再冠以負號2.2.3中位數(shù)與百分位數(shù)①資料是偏態(tài)分布的,資料中的少數(shù)數(shù)據(jù)過分偏大(或偏?。诜植疾灰?guī)則,③一端或兩端有不確定數(shù)據(jù)(開口資料)時,用中位數(shù)表示他們的集中趨勢比算術均數(shù)合理。中位數(shù)(median,簡記為M)是將一組觀察值從小到大按順序排列,位次居中的觀察值就是中位數(shù)百分位數(shù)(percentile)是一種
6、位置指標,以表示,一個百分位數(shù)將總體或樣本的全部觀察值分為兩個部分,理論上有X%的觀察值比小,有(100-X)%觀察值比大中位數(shù)和均值的關系左偏分布均值中位數(shù)對稱分布均值=中位數(shù)右偏分布中位數(shù)均值中位數(shù)與百分位數(shù)的計算(1)未分組資料的中位數(shù)計算法設n個觀察值X1,X2,…,Xn已按從小到大的順序排列,則:【例2.6】9名沙門菌食物中毒患者的潛伏期(小時)為:2,5,9,12,14,15,18,24,60。求其中位數(shù)。【例2.7】8名桿菌痢疾治愈者的住院天數(shù)如下,求其中位數(shù)。4,9,10,12,14,20,24,61(2)分組資料的中位數(shù)和百分位數(shù)計算法百分位數(shù)的計算公式:2.3離散程度的
7、描述【例2.9】三組同性別、同年齡兒童的體重(kg)如下,試分析其集中趨勢和離散程度。甲組2628303234乙組2427303336丙組2629303134三組的的均數(shù)相同,但顯然5個數(shù)據(jù)間參差不齊的程度是不一樣的。二者結合,才能全面認識事物。描述離散程度的指標有極差、四分位數(shù)間距、方差、標準差及變異系數(shù)2.3.1.極差極差(range,記為R)亦稱全距。即一組數(shù)據(jù)中最大值與最小值之差。反映個體的變化范圍。極差大,說明