資源描述:
《多元統(tǒng)計分析論文》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、多元統(tǒng)計分析實踐論文院系:理學(xué)院專業(yè):統(tǒng)計學(xué)年級:2010姓名:樊恩澤學(xué)號:20101004005我國城鎮(zhèn)居民人均消費支出的多元統(tǒng)計分析樊恩澤摘要:本文本文綜合了主成分因子分析與系統(tǒng)聚類分析,先進(jìn)行主成分因子分析,再用進(jìn)行聚類分析。采用2011年我國31個省、市、自治區(qū)城鎮(zhèn)居民人均消費支出數(shù)據(jù),首先利用主成分因子分析的方法,找出影響我國城鎮(zhèn)居民人均消費支出的主成分,計算各樣本的主成分得分;其次運用系統(tǒng)聚類分析法,對各地區(qū)人均消費水平進(jìn)行分類,結(jié)果表明,系統(tǒng)聚類分析法得到的結(jié)果也較好;最后對于擴(kuò)大國內(nèi)消費提出相關(guān)建議。關(guān)鍵詞:主成分分析聚類分析居民人均消費支出1、引言人均消費支出指居民用于滿足家
2、庭日常生活消費的全部支出,包括購買實物支出和服務(wù)性消費支出。消費支出按商品和服務(wù)的用途可分為食品、衣著、家庭設(shè)備用品及服務(wù)、醫(yī)療保健、交通和通訊、娛樂教育文化服務(wù)、居住、雜項商品和服務(wù)等八大類。人均消費支出是社會消費需求的主體,是拉動經(jīng)濟(jì)增長的直接因素,是體現(xiàn)居民生活水平和質(zhì)量的重要指標(biāo)。本文選取2011年我國城鎮(zhèn)居民人均消費支出數(shù)據(jù),主要利用三種統(tǒng)計方法進(jìn)行分析:主成分分析法、聚類分析法。將全國31個省、市、自治區(qū)進(jìn)行分類和排序,并與人們實際觀察到的情況進(jìn)行比較。1.1主成分分析主成分分析是將分量相關(guān)的原始變量,借助于一個正交變換轉(zhuǎn)化為不相關(guān)的新變量,并以方差作為信息量的測度,對新變量進(jìn)行降
3、維,取累計貢獻(xiàn)率大的若干成分作為主成分。這些主成分能夠反映原始變量的絕大部分信息,它們通常表示為原始變量的某種線性組合。1.2聚類分析聚類分析是直接比較各事物之間的性質(zhì),將性質(zhì)相近的歸為一類,將性質(zhì)差別較大的歸入不同的類的分析技術(shù)。在市場研究領(lǐng)域,聚類分析主要應(yīng)用方面是幫助我們尋找目標(biāo)消費群體,運用這項研究技術(shù),我們可以劃分出產(chǎn)品的細(xì)分市場,并且可以描述出各細(xì)分市場的人群特征,以便于客戶可以有針對性的對目標(biāo)消費群體施加影響,合理地開展工作2、數(shù)據(jù)來源及處理2.1統(tǒng)計思想主成分因子分析的基本思想是通過對變量相關(guān)系數(shù)矩陣內(nèi)部結(jié)構(gòu)的研究,找出能控制所以變量的少數(shù)幾個隨機(jī)變量去描述多個變量之間的相關(guān)關(guān)
4、系,并依據(jù)相關(guān)性的大小將變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,不同組的變量相關(guān)性較低。每組代表一個基本結(jié)構(gòu),這個基本結(jié)構(gòu)成為公共因子。對于所研究的問題試圖用最小個數(shù)的不可觀測的所謂公共因子的線性函數(shù)與特殊因子之和來描述原來可觀測的每一個變量。下表是要進(jìn)行處理的31個省市的城鎮(zhèn)居民人均消費支出的相關(guān)原始數(shù)據(jù),數(shù)據(jù)來源于《2011中國統(tǒng)計年鑒》。X1:食品x2:衣著x3:居住x4:家庭用品x5:交通通信x6:文教娛樂x7:醫(yī)療保健表12.2主成分分析表2:因子解釋原始變量方差的情況該表顯示了各主成分解釋原始變量總方差的情況,主成分幾乎包含了各個原始變量至少90.517%的信息,可見效果比較好。
5、表3:該表為7個成分的相關(guān)系數(shù)表4:因子載荷矩陣的成分圖該表給出了標(biāo)準(zhǔn)化原始變量用求得的主成分線性表示的近似表達(dá)式,用prin1,prin2來表示各個主成分,則有該表可以得:標(biāo)準(zhǔn)化的標(biāo)準(zhǔn)化的標(biāo)準(zhǔn)化的表5:主成分得分表6:因子得分系數(shù)矩陣該表由公式所得,顯示了各個主成分的因子得分和主成分得分。圖1主消費因子F1得分前五名地區(qū)依次是上海、廣東、浙江、北京、福建,遠(yuǎn)遠(yuǎn)高于其他地區(qū),說明上海、廣東主要城鎮(zhèn)居民人均消費支出遠(yuǎn)遠(yuǎn)高于其他地區(qū),與實際情況比較接近。主消費因子F1最后五名地區(qū)依次是新疆、河南、青海、甘肅、黑龍江,這些地區(qū)經(jīng)濟(jì)發(fā)展相對落后,人均消費支出低,其主要消費支出也低,但與實際情況還存在差
6、距,貴州城鎮(zhèn)居民消費應(yīng)比黑龍江消費要低,黑龍江不應(yīng)劃為最低人均消費地區(qū)。次消費因子F2得分前五名地區(qū)依次是北京、內(nèi)蒙古、吉林、天津、黑龍江;次消費因子F2最后五名地區(qū)依次是福建、貴州、廣西、西藏、海南,衣著人均消費,在實際消費過程中,人們不容易觀察到,這個結(jié)論還缺乏一定依據(jù);綜合得分F前五名地區(qū)依次是上海、北京、廣東、浙江、天津;這五個地區(qū)經(jīng)濟(jì)都發(fā)達(dá),人均收入和消費支出都高,將這些地區(qū)分為一類比較切合實際。綜合得分F最后五名地區(qū)依次是新疆、云南、甘肅、貴州、青海,這些地區(qū)人口稀少,經(jīng)濟(jì)發(fā)達(dá)相當(dāng)落后,人民收入和消費水平均處于全國最低水平,與人們觀察到的實際情況比較接近,將這些地區(qū)分為一類,其他地
7、區(qū)則分為另外一類,這樣一來就可以將31個省、市、自治區(qū)就分為三類,第一類為因子綜合得分前五名地區(qū),第三類為因子綜合得分最后五名地區(qū),其余地區(qū)則劃分為第二類。這種分類結(jié)果比較切合實際情況。2.3聚類分析表7表8圖2結(jié)果表明:我國各類地區(qū)城鎮(zhèn)居民人均消費支出分類效果較好,且不同地區(qū)的消費結(jié)構(gòu)有著各自的特點。綜合考慮將我國各地區(qū)城鎮(zhèn)居民人均消費分為四類,較好地反映了人們觀察到的實際情況,第一類為上海,2