spss在主成分分析中的應(yīng)用

spss在主成分分析中的應(yīng)用

ID:17914997

大?。?95.50 KB

頁數(shù):17頁

時間:2018-09-09

spss在主成分分析中的應(yīng)用_第1頁
spss在主成分分析中的應(yīng)用_第2頁
spss在主成分分析中的應(yīng)用_第3頁
spss在主成分分析中的應(yīng)用_第4頁
spss在主成分分析中的應(yīng)用_第5頁
資源描述:

《spss在主成分分析中的應(yīng)用》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫

1、SPSS在主成分分析中的應(yīng)用摘要主成成分分析是一種對數(shù)據(jù)進(jìn)行分析的技術(shù),最重要的應(yīng)用是對原有數(shù)據(jù)進(jìn)行簡化。本文首先對主成成分分析方法的原理進(jìn)行了簡單的闡述。介紹了進(jìn)行主成成分分析的工具SPSS,并以分析全國31個省市的8項(xiàng)經(jīng)濟(jì)目標(biāo)為例,給出了詳盡的分析。實(shí)驗(yàn)結(jié)果表明,主成成分分析能有效的將原有的復(fù)雜數(shù)據(jù)降維,同時包含原數(shù)據(jù)的大部分信息。關(guān)鍵詞SPSS主成分分析經(jīng)濟(jì)發(fā)展指標(biāo)一.主成分分析的原理。主成分分析是設(shè)法將原來眾多具有一定相關(guān)性(比如P個指標(biāo)),重新組合成一組新的互相無關(guān)的綜合指標(biāo)來代替原來的指標(biāo)。通常數(shù)學(xué)上的處理就是將原來P個指標(biāo)作線性組合,作為新的綜合指標(biāo)。最經(jīng)典的做法就是用

2、F1(選取的第一個線性組合,即第一個綜合指標(biāo))的方差來表達(dá),即Var(F1)越大,表示F1包含的信息越多。因此在所有的線性組合中選取的F1應(yīng)該是方差最大的,故稱F1為第一主成分。如果第一主成分不足以代表原來P個指標(biāo)的信息,再考慮選取F2即選第二個線性組合,為了有效地反映原來信息,F(xiàn)1已有的信息就不需要再出現(xiàn)再F2中,用數(shù)學(xué)語言表達(dá)就是要求Cov(F1,F2)=0,則稱F2為第二主成分,依此類推可以構(gòu)造出第三、第四,……,第P個主成分。主成分模型:滿足以下條件:1.每個主成分系數(shù)平方和為1即:2.主成分之前互不相關(guān)即:3.主成分方差依次遞減,即二.利用SPSS進(jìn)行主成成分分析實(shí)例以全國

3、31個省市的8項(xiàng)經(jīng)濟(jì)指標(biāo)為例,進(jìn)行主成分分析。第一步:錄入或調(diào)入數(shù)據(jù)(圖1)。17圖1原始數(shù)據(jù)(未經(jīng)標(biāo)準(zhǔn)化)第二步:打開“因子分析”對話框。沿著主菜單的“Analyze→DataReduction→Factor”的路徑(圖2)打開因子分析選項(xiàng)框(圖3)。圖2打開因子分析對話框的路徑17圖3因子分析選項(xiàng)框第三步:選項(xiàng)設(shè)置。首先,在源變量框中選中需要進(jìn)行分析的變量,點(diǎn)擊右邊的箭頭符號,將需要的變量調(diào)入變量(Variables)欄中(圖3)。在本例中,全部8個變量都要用上,故全部調(diào)入(圖4)。因無特殊需要,故不必理會“Value”欄。下面逐項(xiàng)設(shè)置。圖4將變量移到變量欄以后⒈設(shè)置Descri

4、ptives選項(xiàng)。17單擊Descriptives按鈕(圖4),彈出Descriptives對話框(圖5)。圖5描述選項(xiàng)框在Statistics欄中選中Univariatedescriptives復(fù)選項(xiàng),則輸出結(jié)果中將會給出原始數(shù)據(jù)的抽樣均值、方差和樣本數(shù)目(這一欄結(jié)果可供檢驗(yàn)參考);選中Initialsolution復(fù)選項(xiàng),則會給出主成分載荷的公因子方差(這一欄數(shù)據(jù)分析時有用)。在CorrelationMatrix欄中,選中Coefficients復(fù)選項(xiàng),則會給出原始變量的相關(guān)系數(shù)矩陣(分析時可參考);選中Determinant復(fù)選項(xiàng),則會給出相關(guān)系數(shù)矩陣的行列式,如果希望在Exc

5、el中對某些計算過程進(jìn)行了解,可選此項(xiàng),否則用途不大。其它復(fù)選項(xiàng)一般不用,但在特殊情況下可以用到(本例不選)。設(shè)置完成以后,單擊Continue按鈕完成設(shè)置(圖5)。⒉設(shè)置Extraction選項(xiàng)。打開Extraction對話框(圖6)。因子提取方法主要有7種,在Method欄中可以看到,系統(tǒng)默認(rèn)的提取方法是主成分.因此對此欄不作變動,就是認(rèn)可了主成分分析方法。在Analyze欄中,選中Correlationmatirx復(fù)選項(xiàng),則因子分析基于數(shù)據(jù)的相關(guān)系數(shù)矩陣進(jìn)行分析;如果選中Covariancematrix復(fù)選項(xiàng),則因子分析基于數(shù)據(jù)的協(xié)方差矩陣進(jìn)行分析。對于主成分分析而言,由于數(shù)據(jù)

6、標(biāo)準(zhǔn)化了,這兩個結(jié)果沒有分別,因此任選其一即可。在Display欄中,選中Unrotatedfactorsolution(非旋轉(zhuǎn)因子解)復(fù)選項(xiàng),則在分析結(jié)果中給出未經(jīng)旋轉(zhuǎn)的因子提取結(jié)果。對于主成分分析而言,這一項(xiàng)選擇與否都一樣;對于旋轉(zhuǎn)因子分析,選擇此項(xiàng),可將旋轉(zhuǎn)前后的結(jié)果同時給出,以便對比。17選中ScreePlot(“山麓”圖),則在分析結(jié)果中給出特征根按大小分布的折線圖(形如山麓截面,故得名),以便我們直觀地判定因子的提取數(shù)量是否準(zhǔn)確。在Extract欄中,有兩種方法可以決定提取主成分(因子)的數(shù)目。一是根據(jù)特征根(Eigenvalues)的數(shù)值,系統(tǒng)默認(rèn)的是。我們知道,在主成

7、分分析中,主成分得分的方差就是對應(yīng)的特征根數(shù)值。如果默認(rèn),則所有方差大于等于1的主成分將被保留,其余舍棄。如果覺得最后選取的主成分?jǐn)?shù)量不足,可以將值降低,例如取;如果認(rèn)為最后的提取的主成分?jǐn)?shù)量偏多,則可以提高值,例如取。主成分?jǐn)?shù)目是否合適,要在進(jìn)行一輪分析以后才能肯定。因此,特征根數(shù)值的設(shè)定,要在反復(fù)試驗(yàn)以后才能決定。一般而言,在初次分析時,最好降低特征根的臨界值(如?。@樣提取的主成分將會偏多,根據(jù)初次分析的結(jié)果,在第二輪分析過程中可以調(diào)整特征根的大小

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。