資源描述:
《《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》教學(xué)課件-計(jì)量資料的統(tǒng)計(jì)描述 1.ppt》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第二章計(jì)量資料的統(tǒng)計(jì)描述陳學(xué)芬第一節(jié)頻數(shù)分布一、頻數(shù)分布表連續(xù)變量:將變量值劃分為若干個(gè)組段,清點(diǎn)并記錄各組段變量值的個(gè)數(shù),稱為頻數(shù)表。離散變量:各變量值的個(gè)數(shù)。目的:初步了解分布規(guī)律【例4-1】某地2009年隨機(jī)抽取102名成年男子測量其血紅蛋白含量(g/L)的資料如下,試編制其血紅蛋白的頻數(shù)表。編制頻數(shù)表的步驟1.求全距(Range):也稱極差用R表示。2.確定組段數(shù)和組距:較好地顯示數(shù)據(jù)分布規(guī)律。3.寫出組段:前閉后開,最后組段全。4.分組劃計(jì)統(tǒng)計(jì)頻數(shù)列出頻數(shù)表。頻數(shù)表的編制步驟1.求極差:極差(ran
2、ge)是全部數(shù)據(jù)中的最大值與最小值之差,它描述了數(shù)據(jù)的變異幅度。公式:R=XMax-XMin例2-1:R=173-103=70一、頻數(shù)分布表2.確定組段數(shù)n>100,10~15組;n<100,8~10組2.確定組距組距可以相等也可以不相等,一般采用等距分組,組距=極差/組數(shù)例2-170/10=7,故組距=2g/L一、頻數(shù)分布表3.寫出組段:前閉后開,最后組段全。起始組段和最后組段應(yīng)包含最小值和最大值各組段不能重疊,每一組段均為半開半閉區(qū)間,即包括下限,不包含上限。二、頻數(shù)分布圖繪制頻數(shù)分布直方圖坐標(biāo)軸橫坐標(biāo):
3、變量值即研究指標(biāo),無需從0開始,以單位尺度劃分。縱坐標(biāo):為頻數(shù)f,必須從0開始(f為每一組段內(nèi)的人數(shù))直條直條的寬度:組距直條的高度:每一組段的頻數(shù)累計(jì)二、頻數(shù)分布圖以直方頂點(diǎn)縱坐標(biāo)或直方面積大小表示頻數(shù)多少。三、頻數(shù)表和頻數(shù)分布圖用途1.描述頻數(shù)分布的類型:對(duì)稱分布、偏態(tài)分布2.描述頻數(shù)分布的特征:集中趨勢和離散趨勢3.便于發(fā)現(xiàn)一些特大或特小的可疑值4.便于進(jìn)一步做統(tǒng)計(jì)分析和處理1.描述頻數(shù)分布的類型(1)對(duì)稱分布:頻數(shù)集中位置在中間,左右兩側(cè)頻數(shù)大致對(duì)稱。許多醫(yī)學(xué)資料都屬于這種分布,例如人體正常的生理生化
4、指標(biāo)(2)偏態(tài)分布:1)正偏態(tài)分布(右偏態(tài)分布):高峰位于左側(cè),右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),頻數(shù)向右側(cè)拖尾。2)負(fù)偏態(tài)分布(左偏態(tài)分布):高峰位于右側(cè),左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。①集中趨勢(centraltendency):反映一組觀察值的中心位置或平均水平;②離散趨勢(tendencyofdispersion):反映觀察值之間參差不齊的程度。通常用統(tǒng)計(jì)指標(biāo)對(duì)這兩個(gè)特征進(jìn)行數(shù)量化描述。2.描述頻數(shù)分布的特征3.便于發(fā)現(xiàn)一些特大或特小的可疑值4.便于進(jìn)一步做統(tǒng)計(jì)分析和處理第二節(jié)計(jì)量資料的統(tǒng)
5、計(jì)指標(biāo)頻數(shù)分布表和頻數(shù)分布圖反映資料的大致分布情況欲掌握數(shù)據(jù)特征的準(zhǔn)確信息,需計(jì)算相應(yīng)的統(tǒng)計(jì)描述指標(biāo)包括集中趨勢(平均水平)與離散趨勢(變異程度)兩個(gè)方面的描述一、集中趨勢的描述統(tǒng)計(jì)學(xué)中用平均數(shù)(average)來描述計(jì)量資料的集中趨勢,常用的指標(biāo)有:算術(shù)均數(shù)(均數(shù))(mathematicmean)幾何均數(shù)(geometricmean)中位數(shù)(median)與百分位數(shù)(percentile)眾數(shù)(一)算術(shù)均數(shù)算術(shù)均數(shù):簡稱均數(shù)(mean)總體均數(shù)μ,樣本均數(shù)適用于對(duì)稱分布資料,特別是正態(tài)分布或近似正態(tài)分布資料
6、多數(shù)正常生理、生化指標(biāo)都適宜用均數(shù)表達(dá)集中趨勢。計(jì)算方法所有觀察值x1,x2,x3…,xn直接相加再除以觀察值的個(gè)數(shù),寫成公式為樣本均數(shù),n為變量值個(gè)數(shù),i為各變量值,Σ表示求和(一)算術(shù)均數(shù)(一)算術(shù)均數(shù)算術(shù)均數(shù)的特點(diǎn):①②(a是不等于0的任意值)③充分利用原始資料信息的優(yōu)點(diǎn),容易受到極大值或極小值影響的缺點(diǎn)。④一端或兩端無確切值的開口資料無法計(jì)算其均數(shù)。(二)幾何均數(shù)(geometricmean)用G表示適用于原始數(shù)據(jù)分布不對(duì)稱,但經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布的資料,觀察值之間呈倍數(shù)或近似倍數(shù)變化(等比關(guān)系)資
7、料如醫(yī)學(xué)上的抗體滴度資料、平均效價(jià)、某些疾病潛伏期等。計(jì)算方法:直接法:直接將n個(gè)觀察值(x1,x2,x3…,xn)的乘積開n次根公式寫成對(duì)數(shù)形式為幾何均數(shù):變量對(duì)數(shù)值的算術(shù)均數(shù)的反對(duì)數(shù)。(二)幾何均數(shù)(geometricmean)例有7份血清的抗體效價(jià)分別為1:2,1:4,1:8,1:16,1:32,1:64,1:128,求平均抗體效價(jià)。本例先求抗體效價(jià)的倒數(shù),再求幾何均數(shù)血清抗體的平均效價(jià)為1:16(二)幾何均數(shù)(geometricmean)(三)中位數(shù)與百分位數(shù)11個(gè)大鼠存活天數(shù):4,10,7,50,3
8、,15,2,9,13,>60,>60平均存活天數(shù)?1.中位數(shù)(median)是將一組變量值從小到大排列,位置居于中間的那個(gè)變量值(n為奇)或位置居中的兩個(gè)變量值的均數(shù)(n為偶),用M表示((median?percentile))中位數(shù)例:X:5,5,6,7,20,位次:12345中位數(shù)(M):66.5236中位數(shù)計(jì)算方法:直接由原始數(shù)據(jù)計(jì)算中位數(shù)先將觀察值按大小順序排列,再按下面公式計(jì)算:例有7名正