資源描述:
《統(tǒng)計(jì)學(xué)第二章計(jì)量資料的統(tǒng)計(jì)描述ppt課件.ppt》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第二章計(jì)量資料的統(tǒng)計(jì)描述DescriptionsofMeasurementDataContentFrequencedistributionDescriptionofcentraltendencyMeasuresofdispersionNormaldestributionRangeofreferencevalue第一節(jié)頻數(shù)分布一、頻數(shù)分布表(frequencytable):例2-1從某單位1999年的職工體檢資料中獲得101名正常成年女子的血清總膽固醇()的測(cè)量結(jié)果如下,試編制頻數(shù)分布表。編制步驟如下:1.求極差:極差(range)也稱全距,即最大值和最小值之差,記作R。本例:。2.確定組距
2、(i):組段數(shù)通常取組10-15組本例組距3.寫組段:組下限(L):每個(gè)組段的起點(diǎn)組上限(U):每個(gè)組段的終點(diǎn)組段2.30~2.60~2.90~3.20~…5.60~5.902.30~2.60~4.分組段劃記并統(tǒng)計(jì)頻數(shù)2.30~2.60~頻數(shù)表:由各組段及其頻數(shù)所構(gòu)成的統(tǒng)計(jì)表。二、頻數(shù)分布圖三、頻數(shù)表和頻數(shù)分布圖用途1.描述頻數(shù)分布的類型(1)對(duì)稱分布:若各組段的頻數(shù)以頻數(shù)最多組段為中心左右兩側(cè)大體對(duì)稱,就認(rèn)為該資料是對(duì)稱分布(2)偏態(tài)分布:1)右偏態(tài)分布(skewedtotherightdistribution)也稱正偏態(tài)分布(positiveskewnessdistribution):
3、右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),頻數(shù)向右側(cè)拖尾2)左偏態(tài)分布(skewedtotheleftdistribution)也稱負(fù)偏態(tài)分布(negativeskewnessdistribution):左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾2.描述頻數(shù)分布的特征①變異的范圍在2.30~5.90②有明顯的統(tǒng)計(jì)分布規(guī)律,數(shù)據(jù)主要集中在3.50~4.70之間,尤以組段的人數(shù)3.80~4.10最多,且上下組段數(shù)的頻數(shù)分布基本對(duì)稱。3.便于發(fā)現(xiàn)一些特大或特小的可疑值4.便于進(jìn)一步做統(tǒng)計(jì)分析和處理第二節(jié)集中趨勢(shì)的描述統(tǒng)計(jì)上使用平均數(shù)(average)這一指標(biāo)體系來描述一組變量值的集中位置或平均水平。常用的
4、平均數(shù)有:算術(shù)均數(shù)幾何均數(shù)中位數(shù)一、算術(shù)均數(shù)算術(shù)均數(shù):簡(jiǎn)稱均數(shù)(mean)可用于反映一組呈對(duì)稱分布的變量值在數(shù)量上的平均水平或者說是集中位置的特征值。1、計(jì)算方法(1)直接計(jì)算法公式:例2-2用直接法計(jì)算例2-1某單位101名正常成年女子的血清總膽固醇的均數(shù)。(2)加權(quán)法:公式:計(jì)算4,4,4,6,6,8,8,8,10的均數(shù)?例2-3利用表2-1計(jì)算101名正常成年女子的血總膽固醇的均數(shù)。式中k表示頻數(shù)表的組段數(shù),及分別表示各組段的頻數(shù)和組中值,如表2-1第1個(gè)組段的組中值為,余類推(見表2-1的第(3)欄)。在這里,頻數(shù)起到了“權(quán)”(weight)的作用,即某個(gè)組段頻數(shù)多,權(quán)數(shù)就大,其組
5、中值對(duì)均數(shù)的影響也大;反之,影響則小2、應(yīng)用適用于對(duì)稱分布,特別是正態(tài)分布資料。二、幾何均數(shù)幾何均數(shù)(geometricmean):可用于反映一組經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布的變量值在數(shù)量上的平均水平。1、計(jì)算方法(1)、直接計(jì)算法公式:或例2-4某地5例微絲蚴血癥患者治療七年后用間接熒光抗體試驗(yàn)測(cè)得其抗體滴度倒數(shù)分別為,10,20,40,40,160,求幾何均數(shù)。(2)加權(quán)法公式:例2-569例類風(fēng)濕關(guān)節(jié)炎(RA)患者血清EBV-VCA-lgG抗體滴度的分布見表2-4第(1)、(2)欄,求其平均抗體滴度。故例類風(fēng)濕關(guān)節(jié)炎患者血清EBV-VCA-lgG抗體的平均滴度為:1:150.6。2、應(yīng)用:
6、適用于成等比級(jí)數(shù)的資料,特別是對(duì)數(shù)正態(tài)分布資料。三、中位數(shù)與百分位數(shù)(一)中位數(shù)中位數(shù)(median):是將變量值從小到大排列,位置居于中間的那個(gè)變量值。例:1,3,7,5,>100中位數(shù)為多少?計(jì)算公式:n為奇數(shù)時(shí)n為偶數(shù)時(shí)例2-67名病人患某病的潛伏期分別為2,3,4,5,6,9,16天,求其中位數(shù)。本例n=7,為奇數(shù)例2-78名患者食物中毒的潛伏期分別為1,2,2,3,5,8,15,24小時(shí),求其中位數(shù)。本例n=8,為偶數(shù)應(yīng)用適用于:1、各種分布類型的資料2、特別是偏態(tài)分布資料和開囗資料(一端或兩端無確切數(shù)值的資料)。(二)百分位數(shù)百分位數(shù)(percentile)是一種位置指標(biāo),用來
7、表示。一個(gè)百分位數(shù)將全部變量值分為兩部分,在不包含的全部變量值中有的變量值比它小,變量值比它大。1.直接計(jì)算法設(shè)有x個(gè)原始數(shù)據(jù)從小到大排列,第x百分位數(shù)的計(jì)算公式為:當(dāng)為帶有小數(shù)位時(shí):當(dāng)為整數(shù)時(shí):例2-9對(duì)某醫(yī)院細(xì)菌性痢疾治愈者的住院天數(shù)統(tǒng)計(jì),名患者的住院天數(shù)從小到大的排列如下,試求第5百分位數(shù)和第99百分位數(shù)。患者:住院天數(shù):n=120,120X5%=6,為整數(shù):例2-9對(duì)某醫(yī)院細(xì)菌性痢疾治愈者的住院天數(shù)統(tǒng)計(jì),名患者的