資源描述:
《spss在主成分分析中的應(yīng)用》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、SPSS在主成分分析中的應(yīng)用一.主成分分析的原理。主成分分析是設(shè)法將原來眾多具有一定相關(guān)性(比如P個(gè)指標(biāo)),重新組合成一組新的互相無關(guān)的綜合指標(biāo)來代替原來的指標(biāo)。通常數(shù)學(xué)上的處理就是將原來P個(gè)指標(biāo)作線性組合,作為新的綜合指標(biāo)。最經(jīng)典的做法就是用F1(選取的第一個(gè)線性組合,即第一個(gè)綜合指標(biāo))的方差來表達(dá),即Var(F1)越大,表示F1包含的信息越多。因此在所有的線性組合中選取的F1應(yīng)該是方差最大的,故稱F1為第一主成分。如果第一主成分不足以代表原來P個(gè)指標(biāo)的信息,再考慮選取F2即選第二個(gè)線性組合,為了有效地反映原來信息,F(xiàn)1已有的信息就不需要再出現(xiàn)再F2中,用數(shù)學(xué)語言
2、表達(dá)就是要求Cov(F1,F2)=0,則稱F2為第二主成分,依此類推可以構(gòu)造出第三、第四,……,第P個(gè)主成分。主成分模型:滿足以下條件:1.每個(gè)主成分系數(shù)平方和為1即:2.主成分之間互不相關(guān)即:3.主成分方差依次遞減,即22二.利用SPSS進(jìn)行主成成分分析實(shí)例以全國31個(gè)省市的8項(xiàng)經(jīng)濟(jì)指標(biāo)為例,進(jìn)行主成分分析。第一步:錄入或調(diào)入數(shù)據(jù)(圖1)。圖1原始數(shù)據(jù)(未經(jīng)標(biāo)準(zhǔn)化)第二步:打開“因子分析”對話框。沿著主菜單的“Analyze(分析)→DataReduction(降維)→Factor(因子分析)”的路徑(圖2)打開因子分析選項(xiàng)框(圖3)。圖2打開因子分析對話框的路徑
3、22圖3因子分析選項(xiàng)框第三步:選項(xiàng)設(shè)置。首先,在源變量框中選中需要進(jìn)行分析的變量,點(diǎn)擊右邊的箭頭符號,將需要的變量調(diào)入變量(Variables)欄中(圖3)。在本例中,全部8個(gè)變量都要用上,故全部調(diào)入(圖4)。因無特殊需要,故不必理會“Value”欄。下面逐項(xiàng)設(shè)置。圖4將變量移到變量欄以后⒈設(shè)置Descriptives(描述)選項(xiàng)。單擊Descriptives按鈕(圖4),彈出Descriptives(描述統(tǒng)計(jì))對話框(圖5)。22圖5描述選項(xiàng)框在Statistics欄中選中Univariatedescriptives(單變量描述性)復(fù)選項(xiàng),則輸出結(jié)果中將會給出原始
4、數(shù)據(jù)的抽樣均值、方差和樣本數(shù)目(這一欄結(jié)果可供檢驗(yàn)參考);選中Initialsolution(原始分析結(jié)果)復(fù)選項(xiàng),則會給出主成分載荷的公因子方差(這一欄數(shù)據(jù)分析時(shí)有用)。在CorrelationMatrix(相關(guān)矩陣)欄中,選中Coefficients(系數(shù))復(fù)選項(xiàng),則會給出原始變量的相關(guān)系數(shù)矩陣(分析時(shí)可參考);選中Determinant(行列式)復(fù)選項(xiàng),則會給出相關(guān)系數(shù)矩陣的行列式,如果希望在Excel中對某些計(jì)算過程進(jìn)行了解,可選此項(xiàng),否則用途不大。其它復(fù)選項(xiàng)一般不用,但在特殊情況下可以用到(本例不選)。設(shè)置完成以后,單擊Continue按鈕完成設(shè)置(圖5)
5、。⒉設(shè)置Extraction(抽?。┻x項(xiàng)。打開Extraction對話框(圖6)。因子提取方法主要有7種,在Method欄中可以看到,系統(tǒng)默認(rèn)的提取方法是主成分.因此對此欄不作變動,就是認(rèn)可了主成分分析方法。在Analyze欄中,選中Correlationmatirx(相關(guān)性矩陣)復(fù)選項(xiàng),則因子分析基于數(shù)據(jù)的相關(guān)系數(shù)矩陣進(jìn)行分析;如果選中Covariancematrix復(fù)選項(xiàng),則因子分析基于數(shù)據(jù)的協(xié)方差矩陣進(jìn)行分析。對于主成分分析而言,由于數(shù)據(jù)標(biāo)準(zhǔn)化了,這兩個(gè)結(jié)果沒有分別,因此任選其一即可。在Display(輸出)欄中,選中Unrotatedfactorsoluti
6、on(非旋轉(zhuǎn)因子解)復(fù)選項(xiàng),則在分析結(jié)果中給出未經(jīng)旋轉(zhuǎn)的因子提取結(jié)果。對于主成分分析而言,這一項(xiàng)選擇與否都一樣;對于旋轉(zhuǎn)因子分析,選擇此項(xiàng),可將旋轉(zhuǎn)前后的結(jié)果同時(shí)給出,以便對比。選中ScreePlot(碎石圖),則在分析結(jié)果中給出特征根按大小分布的折線圖,以便我們直觀地判定因子的提取數(shù)量是否準(zhǔn)確。在Extract(抽取)欄中,有兩種方法可以決定提取主成分(因子)的數(shù)目。一是根據(jù)特征根(Eigenvalues)的數(shù)值,系統(tǒng)默認(rèn)的是。我們知道,在主成分分析中,主成分得分的方差就是對應(yīng)的特征根數(shù)值。如果默認(rèn),則所有方差大于等于1的主成分將被保留,其余舍棄。如果覺得最后選取
7、的主成分?jǐn)?shù)量不足,可以將值降低,例如??;如果認(rèn)為最后的提取的主成分?jǐn)?shù)量偏多,則可以提高值,例如取22。主成分?jǐn)?shù)目是否合適,要在進(jìn)行一輪分析以后才能肯定。因此,特征根數(shù)值的設(shè)定,要在反復(fù)試驗(yàn)以后才能決定。一般而言,在初次分析時(shí),最好降低特征根的臨界值(如取),這樣提取的主成分將會偏多,根據(jù)初次分析的結(jié)果,在第二輪分析過程中可以調(diào)整特征根的大小。第二種方法是直接指定主成分的數(shù)目即因子數(shù)目,這要選中Numberoffactors復(fù)選項(xiàng)。主成分的數(shù)目選多少合適?開始我們并不十分清楚。因此,首次不妨將數(shù)值設(shè)大一些,但不能超過變量數(shù)目。本例有8個(gè)變量,因此,最大的主成分提取