資源描述:
《醫(yī)學統(tǒng)計學 第二章 正態(tài)分布及其應(yīng)用ppt課件.ppt》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、正態(tài)分布(normaldistribution)又稱Gauss分布(Gaussiandistribution)是一個重要的連續(xù)型概率分布。正態(tài)分布的重要性醫(yī)學研究中的某些觀察指標服從或近似服從正態(tài)分布;很多統(tǒng)計方法是建立在正態(tài)分布的基礎(chǔ)之上的;很多其他分布的極限為正態(tài)分布。因此,正態(tài)分布是統(tǒng)計分析方法的重要基礎(chǔ)。記作:X~N(μ,σ2)例如:X~N(120,8.22)X~N(5,32)正態(tài)分布的數(shù)學形式backX~N(0,1)標準正態(tài)分布的均數(shù)為0,標準差為1正態(tài)分布曲線的三個特點集中性對稱性均勻變動性集中性中等大小的數(shù)據(jù)居多,較大的和較小的數(shù)據(jù)少些,即例數(shù)集中在中等大小的數(shù)
2、據(jù)附近。?對稱性以均數(shù)為中心,大于它和小于它的數(shù)據(jù)的例數(shù)是對稱的。?均勻變動性例數(shù)由少增多或由多減少的過程是逐漸變化的,即均勻分布的。在分析數(shù)據(jù)時,均勻性是一個很重要的特點。?如果,隨著變量值的變異,例數(shù)突然地增多或突然地減少,或長距離地間斷,都表示資料的同質(zhì)性可能較差,應(yīng)進一步查明原因。正態(tài)分布的特征正態(tài)分布是單峰分布:X=?(峰)正態(tài)分布以均數(shù)為中心,左右完全對稱。正態(tài)分布有兩個參數(shù)(parameter)。某些指標經(jīng)變換后服從正態(tài)分布正態(tài)曲線下的面積分布有一定的規(guī)律。?-1.96?95%?+1.96??2.5%2.5%正態(tài)曲線下的面積分布示意標準正態(tài)分布曲線下的面積的計算
3、求u值,用u值查表,得到所求區(qū)間面積占總面積的比例。曲線下對稱于0的區(qū)間,面積相等。曲線下總面積為100%或1。例2.11在例2.1中已求得某市120名歲男童身高均數(shù)為142.67cm,標準差為6.00cm。設(shè)該資料服從正態(tài)分布,試求:該地12歲男童身高在132cm以下者占該地12歲男童總數(shù)的比例。分別求均數(shù)±1s、均數(shù)±1.96s和均數(shù)±2.58s范圍內(nèi)12歲男童占該組兒童總數(shù)的實際百分數(shù),并與理論百分數(shù)比較。查u值表3.75%;120名12歲男孩身高分布身高范圍實際分布(cm)(cm)人數(shù)百分數(shù)(%)136.67~148.678671.6768.27130.91~154.
4、4311495.0095.00127.19~158.1511898.3399.00理論分布(%)參考值范圍(referenceinterval)又稱正常值范圍(normalrange)正常人的形態(tài)、功能、生化等各種指標的波動范圍。簡稱正常值。為什么波動?“個體變異”同一指標的數(shù)據(jù)因人而異同一個體的數(shù)據(jù)隨環(huán)境、時間等改變而變?yōu)槭裁匆_定一個范圍?既然同屬正常人,就不能以甲的數(shù)據(jù)為標準,認為乙異常,亦不能以甲此時的數(shù)據(jù)為標準,認為彼時的異常。所以必須確定一個波動范圍。如WBC:4000~10000個/mm3“正?!笔且粋€相對的概念“正常人”是指排除了影響所研究指標的疾病和有關(guān)因素
5、的人。意義橫向分析劃界、分類臨床醫(yī)生判斷正常與異常的參考依據(jù)動態(tài)分析如某個地區(qū)不同時期發(fā)汞的正常值可反映環(huán)境污染的動態(tài)變化或環(huán)保效果參考值范圍確定的原則選定同質(zhì)的正常人作為研究對象控制檢測誤差判斷是否分組單、雙側(cè)問題選擇百分界值選定同質(zhì)的正常人作為研究對象同質(zhì)正常“足夠數(shù)量”例數(shù)過少,代表性差;例數(shù)過多增加成本,且易導致正常標準把握不嚴,影響數(shù)據(jù)的可靠性。一般認為每組100例以上;有人認為確定臨床生化指標的正常值應(yīng)取300~500例??刂茩z測誤差通過人員培訓、控制檢測條件、重復測定等措施,嚴格控制檢測誤差。判斷是否分組組間差別是否有統(tǒng)計學意義并有臨床意義?例:紅細胞、白細胞各
6、組的分布范圍、高峰位置等是否基本一致?例:表2.11發(fā)汞資料單、雙側(cè)問題過大或過小均屬異常:雙側(cè)界值例:白細胞計數(shù)僅過大或過小為異常:單側(cè)界值例:肺活量僅過低異常下限尿鉛僅過高為異常上限選擇百分界值參考值范圍的涵義:絕大多數(shù)的正常人在該范圍內(nèi)習慣上將“絕大多數(shù)”定義為正常人的80%、90%、95%或99%。應(yīng)根據(jù)研究目的、研究指標的性質(zhì)、數(shù)據(jù)分布特征等情況綜合考慮百分界值的選擇。確定可疑范圍若病人與正常人的數(shù)據(jù)重疊較多的情況下,為避免較大的假陽性和假陰性錯誤率,可設(shè)定可疑范圍。正常人病人假陽性假陰性圖2.9正常人與病人的數(shù)據(jù)分布重疊示意圖參考值范圍的估計方法正態(tài)分布法百分位數(shù)
7、法對數(shù)正態(tài)分布法正態(tài)分布法適于正態(tài)或近似正態(tài)分布的資料公式雙側(cè)單側(cè)(高側(cè))(低側(cè))例:某地調(diào)查了360名成年男子的平均血紅蛋白如何估計該地成年男子血紅蛋白95%的參考值范圍?95%的參考值范圍:該地成年男子血紅蛋白95%的參考值范圍:12.06~14.84(g/100ml)。百分比雙側(cè)單側(cè)95%P2.5~P97.590%P5~P95百分位數(shù)法不服從正態(tài)分布的資料發(fā)汞值(?g/g)男性女性合計頻數(shù)1~81220203~313566865~2832601467~2325481949~1171821211~1