資源描述:
《在SPSS中應(yīng)用主成分分析.doc》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、主成分分析在SPSS中的操作應(yīng)用(1)一、引言 主成分分析和因子分析在社會經(jīng)濟統(tǒng)計綜合評價中是兩個常被使用的統(tǒng)計分析方法。現(xiàn)在SPSS、SAS等統(tǒng)計軟件使用越來越普遍,但SPSS并未像SAS一樣,將主成分分析與因子分析作為兩個獨立的方法并列處理[注:主成分分析與因子分析二者是又有著區(qū)別與聯(lián)系,最主要的不同在于它們的數(shù)學(xué)模型的構(gòu)建上,具體區(qū)別請見參考文獻2],而是根據(jù)二者之間的關(guān)系有機地將主成分分析嵌入到因子分析之中,這樣雖然簡化了分析程序,卻為主成分分析的計算帶來不便。且國內(nèi)許多SPSS教程并沒有詳細講解如果應(yīng)用SPSS進行主成
2、分分析,如何使用SPSS對主成分分析進行計算呢?為使讀者能夠正確使用SPSS軟件進行主成分分析,本文將通過一個實例來詳細介紹如何用SPSS做主成分分析。接下來先簡單介紹主成分分析原理與模型,以便讀者對主成分分析有個大致的了解。二、主成分分析原理和模型[1](一)主分成分析原理 主成分分析是設(shè)法將原來眾多具有一定相關(guān)性(比如P個指標),重新組合成一組新的互相無關(guān)的綜合指標來代替原來的指標。通常數(shù)學(xué)上的處理就是將原來P個指標作線性組合,作為新的綜合指標。最經(jīng)典的做法就是用F1(選取的第一個線性組合,即第一個綜合指標)的方差來表達,即
3、Var(F1)越大,表示F1包含的信息越多。因此在所有的線性組合中選取的F1應(yīng)該是方差最大的,故稱F1為第一主成分。如果第一主成分不足以代表原來P個指標的信息,再考慮選取F2即選第二個線性組合,為了有效地反映原來信息,F(xiàn)1已有的信息就不需要再出現(xiàn)再F2中,用數(shù)學(xué)語言表達就是要求Cov(F1,F2)=0,則稱F2為第二主成分,依此類推可以構(gòu)造出第三、第四,……,第P個主成分。(二)主成分分析數(shù)學(xué)模型F2=a12ZX1+a22ZX2……+ap2ZXp?????…… Fp=a1mZX1+a2mZX2+……+apmZXp 其中a1i,
4、a2i,……,api(i=1,……,m)為X的協(xié)方差陣Σ的特征值多對應(yīng)的特征向量,ZX1,ZX2,……,ZXp是原始變量經(jīng)過標準化處理的值,因為在實際應(yīng)用中,往往存在指標的量綱不同,所以在計算之前須先消除量綱的影響,而將原始數(shù)據(jù)標準化,本文所采用的數(shù)據(jù)就存在量綱影響[注:本文指的數(shù)據(jù)標準化是指Z標準化]。A=(aij)p×m=(a1,a2,…am,),Rai=λiai,R為相關(guān)系數(shù)矩陣,λi、ai是相應(yīng)的特征值和單位特征向量,λ1≥λ2≥…≥λp≥0。進行主成分分析主要步驟如下:1.?????指標數(shù)據(jù)標準化(SPSS軟件自動執(zhí)行)
5、;2.?????指標之間的相關(guān)性判定;3.?????確定主成分個數(shù)m;4.?????主成分Fi表達式;5.?????主成分Fi命名;主成分與綜合主成分(評價)值。主成分分析在SPSS中的操作應(yīng)用(2)(二)主成分分析在SPSS中的具體操作步驟 運用SPSS統(tǒng)計分析軟件Factor過程[2]對沿海10個省市經(jīng)濟綜合指標進行主成分分析。具體操作步驟如下:1.???AnalyzeàDataReductionàFactorAnalysis,彈出FactorAnalysis對話框2.???把X1~X10選入Variables框3.???D
6、escriptives:CorrelationMatrix框組中選中Coefficients,然后點擊Continue,返回FactorAnalysis對話框4.???點擊“OK”圖表2FactorAnalyze對話框與Descriptives子對話框 SPSS在調(diào)用FactorAnalyze過程進行分析時,SPSS會自動對原始數(shù)據(jù)進行標準化處理,所以在得到計算結(jié)果后指的變量都是指經(jīng)過標準化處理后的變量,但SPSS不會直接給出標準化后的數(shù)據(jù),如需要得到標準化數(shù)據(jù),則需調(diào)用Descriptives過程進行計算。圖表3相關(guān)系數(shù)矩陣圖
7、表4方差分解主成分提取分析表主成分分析在SPSS中的操作應(yīng)用(3)圖表5初始因子載荷矩陣 從圖表3可知GDP與工業(yè)增加值,第三產(chǎn)業(yè)增加值、固定資產(chǎn)投資、基本建設(shè)投資、社會消費品零售總額、地方財政收入這幾個指標存在著極其顯著的關(guān)系,與海關(guān)出口總額存在著顯著關(guān)系。可見許多變量之間直接的相關(guān)性比較強,證明他們存在信息上的重疊?! ≈鞒煞謧€數(shù)提取原則為主成分對應(yīng)的特征值大于1的前m個主成分。注:特征值在某種程度上可以被看成是表示主成分影響力度大小的指標,如果特征值小于1,說明該主成分的解釋力度還不如直接引入一個原變量的平均解釋力度大,因
8、此一般可以用特征值大于1作為納入標準。通過圖表4(方差分解主成分提取分析)可知,提取2個主成分,即m=2,從圖表5(初始因子載荷矩陣)可知GDP、工業(yè)增加值、第三產(chǎn)業(yè)增加值、固定資產(chǎn)投資、基本建設(shè)投資、社會消費品零售總額、海關(guān)出口總額、地方財政收入