資源描述:
《第九章統(tǒng)計(jì)分析(社會調(diào)查統(tǒng)計(jì))ppt課件.ppt》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第九章統(tǒng)計(jì)分析——單變量描述分析統(tǒng)計(jì)分析的內(nèi)容包括兩個(gè)方面:描述統(tǒng)計(jì)與推論統(tǒng)計(jì)。描述統(tǒng)計(jì)是對已經(jīng)初步整理的數(shù)據(jù)資料加工概括,并用統(tǒng)計(jì)量對資料進(jìn)行敘述的一種方法。他主要包括集中趨勢、離散程度的分析。推論統(tǒng)計(jì)是在隨機(jī)抽樣調(diào)查的基礎(chǔ)上,根據(jù)樣本資料推論總體的一種方法。他主要包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)。1.集中趨勢分析集中趨勢分析指的使用一個(gè)典型值來反映一組數(shù)據(jù)的一般水平,別的數(shù)值圍繞在它的周圍.最常見的集中量數(shù)有平均數(shù)(也稱為均值),眾數(shù)和中位數(shù)三種.(1)平均數(shù)(mean)平均數(shù)數(shù)是指總體各單位數(shù)值之和除以總體單位數(shù)目所得之商統(tǒng)計(jì)分析中習(xí)慣以X來表示.其計(jì)算公式如下∑X
2、n例:某班10名學(xué)生的年齡分別為20、21、19、19、19、20、20、21、22、18、20歲,求他們的平均年齡。(2)眾數(shù)(m0)總體中出現(xiàn)次數(shù)最多的標(biāo)志值是眾數(shù)。例:7名工人日產(chǎn)量(件)為4、5、6、6、6、7、8。眾數(shù)是6。(3)中位數(shù)(Md)把一組數(shù)據(jù)按值的大小順序排列起來,處于中央位置的那個(gè)數(shù)值就叫中位數(shù).它的含義是整個(gè)數(shù)據(jù)中有一半數(shù)值在她之上,另一半數(shù)值在它之下.公式為:Md=(n+1)÷21、標(biāo)志值的個(gè)數(shù)是奇數(shù)例:7名工人生產(chǎn)某種產(chǎn)品,日產(chǎn)量(件)分別為4、6、6、8、9、12、14。位于中間位置的第四名工人的日產(chǎn)量8件為中位數(shù)。2、標(biāo)志值的個(gè)數(shù)
3、是偶數(shù).上例增加為8名工人,日產(chǎn)量為4、6、6、8、9、12、13、14。中位數(shù)位置在第四和第五名中間,取這兩者的平均數(shù)為中位數(shù)。3、離散趨勢分析離散趨勢分析指用一個(gè)特別的數(shù)值來反映一組數(shù)據(jù)相互之間的差異程度。最常見的離散量數(shù)有全距(極差)、異眾比率、四分位差、標(biāo)準(zhǔn)差、離散系數(shù).(1)全距(極差)(Range)全距指一組數(shù)據(jù)的最大值與最小值之差.全距(極差)越大,在一定程度上說明這組數(shù)據(jù)的離散程度越大,集中量數(shù)的代表性越低。計(jì)算公式:例:5名學(xué)生的成績?yōu)?0、69、76、88、97則R=97-50=47(2)異眾比率VariationRatio異眾比率指一組數(shù)據(jù)中
4、非眾數(shù)的次數(shù)相對于總體全部單位的比率。異眾比率越小,說明眾數(shù)的代表性越好,反之,異眾比率越大,則說明眾數(shù)的代表性越差。公式如下:其中n是全部個(gè)案總數(shù),是眾數(shù)出現(xiàn)的頻數(shù),二者之差就是非眾數(shù)的頻數(shù)。這個(gè)公式所要求出的,是在全部的個(gè)案中有多少是偏離眾數(shù)。不屬于眾數(shù)的個(gè)案所占的比率愈大,就表示眾數(shù)的代表性愈小,以之作估計(jì)或預(yù)測時(shí)所犯的錯(cuò)誤也就愈大。例:假設(shè)甲校有學(xué)生550名,其中父親職業(yè)最多的是農(nóng)民,有288人;乙校有學(xué)生480名,其中父親職業(yè)最多的也是農(nóng)民,有295人。則:甲校VR=550-288/550=0.476乙校VR=480-295/480=0.385甲、乙兩校
5、學(xué)生的父親職業(yè),眾數(shù)都是農(nóng)民,但離異程度不同。甲校有47.6%的個(gè)案不是農(nóng)民,而乙校只有38.5%不是農(nóng)民。因此,根據(jù)異眾比率,甲校的離異幅度大于乙校。也就是說,在兩校作估計(jì)或預(yù)測時(shí),雖然應(yīng)用同一個(gè)眾數(shù),但在甲校所犯的錯(cuò)誤會大于乙校。(3)四分位差I(lǐng)nterquartileRange先將一組數(shù)據(jù)按大小排列順序,然后將其4等分,去掉序列中最高的1/4和最低的1/4,僅就中間的一半數(shù)值來測定序列的全距。Q1的位置(第一個(gè)四分位點(diǎn))=(n+1)/4Q3的位置(第三個(gè)四分位點(diǎn))=3(n+1)/4Q=Q3—Q1例:調(diào)查11位同學(xué)的年齡如下:17歲、18歲、18歲、19歲、1
6、9歲、20歲、20歲、21歲、21歲、22歲、。首先,求出Q1和Q3的位置:Q1的位置===3Q3的位置===9其次,從數(shù)序中找出Q1=18,Q3=21則四分位差Q=Q3—Q1=21—18=3(4)標(biāo)準(zhǔn)差StandardDeviation標(biāo)準(zhǔn)差是各數(shù)值與其均值之差的平方和除以總體數(shù)的平方根。它是一組數(shù)據(jù)平均值分散程度的一種度量。一個(gè)較大的標(biāo)準(zhǔn)差,代表大部分?jǐn)?shù)值和其平均值之間差異較大;一個(gè)較小的標(biāo)準(zhǔn)差,代表這些數(shù)值較接近平均值。例1:在調(diào)查甲地的十個(gè)鄉(xiāng)的衛(wèi)生情況時(shí),發(fā)現(xiàn)每個(gè)鄉(xiāng)的衛(wèi)生戶比率如下:818141481512171219則標(biāo)準(zhǔn)差是3.6。換言之,平均每鄉(xiāng)有1
7、3.7%是衛(wèi)生戶,而反映各鄉(xiāng)差異的標(biāo)準(zhǔn)差數(shù)值是3.6。在這里要解釋的是,標(biāo)準(zhǔn)差數(shù)值在相互比較中更能突出其意義。例如,在調(diào)查乙鄉(xiāng)的衛(wèi)生戶比率時(shí),假定均值是18.5,標(biāo)準(zhǔn)差是1.7,對比之下,乙地各鄉(xiāng)的差異程度小于甲地。例2:某校三個(gè)系各選5名同學(xué),參加智力競賽,他們的成績?nèi)缦拢褐形南担?879808182數(shù)學(xué)系:6572808895英語系:35788998100無論從團(tuán)體總分來看,還是從平均分來看,這三個(gè)系代表隊(duì)的成績都是相同的。那么,均值到底對哪一個(gè)代表隊(duì)的代表性高呢?用前面的公式可得:中文系=1.414數(shù)學(xué)系=10.8英語系=23.8由此證明,平均成績對中文系代
8、表隊(duì)的代表