資源描述:
《主成分分析在spss中的操作應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、主成分分析在SPSS中的操作應(yīng)用(1)2008-03-2415:15一、引言 主成分分析和因子分析在社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)綜合評(píng)價(jià)中是兩個(gè)常被使用的統(tǒng)計(jì)分析方法?,F(xiàn)在SPSS、SAS等統(tǒng)計(jì)軟件使用越來(lái)越普遍,但SPSS并未像SAS一樣,將主成分分析與因子分析作為兩個(gè)獨(dú)立的方法并列處理[注:主成分分析與因子分析二者是又有著區(qū)別與聯(lián)系,最主要的不同在于它們的數(shù)學(xué)模型的構(gòu)建上,具體區(qū)別請(qǐng)見(jiàn)參考文獻(xiàn)2],而是根據(jù)二者之間的關(guān)系有機(jī)地將主成分分析嵌入到因子分析之中,這樣雖然簡(jiǎn)化了分析程序,卻為主成分分析的計(jì)算帶來(lái)不便。且國(guó)內(nèi)許多SPSS教程并沒(méi)有詳細(xì)講解如果應(yīng)
2、用SPSS進(jìn)行主成分分析,如何使用SPSS對(duì)主成分分析進(jìn)行計(jì)算呢?為使讀者能夠正確使用SPSS軟件進(jìn)行主成分分析,本文將通過(guò)一個(gè)實(shí)例來(lái)詳細(xì)介紹如何用SPSS做主成分分析。接下來(lái)先簡(jiǎn)單介紹主成分分析原理與模型,以便讀者對(duì)主成分分析有個(gè)大致的了解。二、主成分分析原理和模型[1](一)主分成分析原理主成分分析是設(shè)法將原來(lái)眾多具有一定相關(guān)性(比如P個(gè)指標(biāo)),重新組合成一組新的互相無(wú)關(guān)的綜合指標(biāo)來(lái)代替原來(lái)的指標(biāo)。通常數(shù)學(xué)上的處理就是將原來(lái)P個(gè)指標(biāo)作線性組合,作為新的綜合指標(biāo)。最經(jīng)典的做法就是用F1(選取的第一個(gè)線性組合,即第一個(gè)綜合指標(biāo))的方差來(lái)表達(dá),
3、即Var(F1)越大,表示F1包含的信息越多。因此在所有的線性組合中選取的F1應(yīng)該是方差最大的,故稱(chēng)F1為第一主成分。如果第一主成分不足以代表原來(lái)P個(gè)指標(biāo)的信息,再考慮選取F2即選第二個(gè)線性組合,為了有效地反映原來(lái)信息,F(xiàn)1已有的信息就不需要再出現(xiàn)再F2中,用數(shù)學(xué)語(yǔ)言表達(dá)就是要求Cov(F1,F2)=0,則稱(chēng)F2為第二主成分,依此類(lèi)推可以構(gòu)造出第三、第四,……,第P個(gè)主成分。(二)主成分分析數(shù)學(xué)模型其中為X的協(xié)方差陣Σ的特征值多對(duì)應(yīng)的特征向量,是原始變量經(jīng)過(guò)標(biāo)準(zhǔn)化處理的值,因?yàn)樵趯?shí)際應(yīng)用中,往往存在指標(biāo)的量綱不同,所以在計(jì)算之前須先消除量綱的
4、影響,而將原始數(shù)據(jù)標(biāo)準(zhǔn)化,本文所采用的數(shù)據(jù)就存在量綱影響[注:本文指的數(shù)據(jù)標(biāo)準(zhǔn)化是指Z標(biāo)準(zhǔn)化]。R為相關(guān)系數(shù)矩陣,是相應(yīng)的特征值和單位特征向量,進(jìn)行主成分分析主要步驟如下:1.指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化(SPSS軟件自動(dòng)執(zhí)行);2.指標(biāo)之間的相關(guān)性判定;3.確定主成分個(gè)數(shù)m;4.主成分Fi表達(dá)式;5.主成分Fi命名;6.主成分與綜合主成分(評(píng)價(jià))值。主成分分析在SPSS中的操作應(yīng)用(2)2008-03-2420:42(二)主成分分析在SPSS中的具體操作步驟運(yùn)用SPSS統(tǒng)計(jì)分析軟件Factor過(guò)程[2]對(duì)沿海10個(gè)省市經(jīng)濟(jì)綜合指標(biāo)進(jìn)行主成分分析。具體操作
5、步驟如下:1.Analyze→DataReduction→FactorAnalysis,(即中文版:分析→降維→因子分析)彈出FactorAnalysis對(duì)話(huà)框2.把X1~X10選入Variables框3.Descriptives:CorrelationMatrix(相關(guān)矩陣)框組中選中Coefficients(系數(shù)),然后點(diǎn)擊Continue,返回FactorAnalysis對(duì)話(huà)框4.點(diǎn)擊“OK”圖表2FactorAnalyze對(duì)話(huà)框(因子分析對(duì)話(huà)框)Descriptives子對(duì)話(huà)框 SPSS在調(diào)用FactorAnalyze過(guò)程進(jìn)行分析時(shí)
6、,SPSS會(huì)自動(dòng)對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,所以在得到計(jì)算結(jié)果后指的變量都是指經(jīng)過(guò)標(biāo)準(zhǔn)化處理后的變量,但SPSS不會(huì)直接給出標(biāo)準(zhǔn)化后的數(shù)據(jù),如需要得到標(biāo)準(zhǔn)化數(shù)據(jù),則需調(diào)用Descriptives(分析→描述統(tǒng)計(jì)→描述)過(guò)程進(jìn)行計(jì)算。圖表3相關(guān)系數(shù)矩陣圖表4方差分解主成分提取分析表主成分分析在SPSS中的操作應(yīng)用(3)2008-03-2420:53圖表5初始因子載荷矩陣從圖表3可知GDP與工業(yè)增加值,第三產(chǎn)業(yè)增加值、固定資產(chǎn)投資、基本建設(shè)投資、社會(huì)消費(fèi)品零售總額、地方財(cái)政收入這幾個(gè)指標(biāo)存在著極其顯著的關(guān)系,與海關(guān)出口總額存在著顯著關(guān)系??梢?jiàn)許多變
7、量之間直接的相關(guān)性比較強(qiáng),證明他們存在信息上的重疊。主成分個(gè)數(shù)提取原則為主成分對(duì)應(yīng)的特征值大于1的前m個(gè)主成分。注:特征值在某種程度上可以被看成是表示主成分影響力度大小的指標(biāo),如果特征值小于1,說(shuō)明該主成分的解釋力度還不如直接引入一個(gè)原變量的平均解釋力度大,因此一般可以用特征值大于1作為納入標(biāo)準(zhǔn)。通過(guò)圖表4(方差分解主成分提取分析)可知,提取2個(gè)主成分,即m=2,從圖表5(初始因子載荷矩陣)可知GDP、工業(yè)增加值、第三產(chǎn)業(yè)增加值、固定資產(chǎn)投資、基本建設(shè)投資、社會(huì)消費(fèi)品零售總額、海關(guān)出口總額、地方財(cái)政收入在第一主成分上有較高載荷,說(shuō)明第一主成分
8、基本反映了這些指標(biāo)的信息;人均GDP和農(nóng)業(yè)增加值指標(biāo)在第二主成分上有較高載荷,說(shuō)明第二主成分基本反映了人均GDP和農(nóng)業(yè)增加值兩個(gè)指標(biāo)的信息。所以提取兩個(gè)主成分是可以