資源描述:
《主成分和聚類分析》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、4實證過程與結(jié)果4.1主成分與聚類分析首先通過SPSS軟件對環(huán)境污染的相應(yīng)指標進行主成分分析,得到:提取Y1、Y2、Y3和Y4四個主成分,其累積貢獻率已經(jīng)達到,超過80%,代表所有環(huán)境污染指標的絕大部分信息。Y1偏向于解釋工業(yè)氫氧化物排放量,Y2偏向于解釋生活煙塵排放量,Y3偏向于解釋生活廢水排放量,Y4偏向于解釋工業(yè)二氧化硫排放量。然后,根據(jù)主成分分析結(jié)果,用Z=0.43226*Y1+0.21911*Y2+0.10380*Y3+0.06519*Y4計算綜合得分,見下表1。表1環(huán)境污染地區(qū)的主成分綜合得分表序號地區(qū)Z排名序號地區(qū)Z排名1北京0
2、.863517武漢-0.116132天津1.088418長沙-0.841283石家莊0.455619廣州-0.373194太原0.209820南寧-0.519245呼和浩特-0.0521221???1.29316沈陽-0.2731722重慶2.76717長春-0.2571623成都-0.451208哈爾濱2.489224貴陽-0.331189上海1.979325昆明-0.5522610南京-0.2321526拉薩-1.2753011杭州0.175927西安0.357712合肥-0.52128蘭州-0.5142313福州-0.5252529西寧
3、0.0041114南昌-0.9492930銀川-0.7022715濟南0.0221031烏魯木齊-0.5022216鄭州-0.15214最后將環(huán)境污染的綜合得分作為個案進行層次聚類分析,將31個地區(qū)分為5類,如表2。表2各地區(qū)污染分類分類污染情況地區(qū)1輕度污染??凇⒗_2比較輕度污染合肥、烏魯木齊、福州、南寧、蘭州、,昆明、成都、銀川、南昌、長沙、沈陽、長春、南京、廣州、貴陽、鄭州、武漢、濟南、西寧、呼和浩特3污染情況一般太原、杭州、石家莊、西安4污染比較嚴重北京、天津5污染十分嚴重上海、哈爾濱、重慶4.2主成分分析和聚類分析在SPSS中的操
4、作過程打開SPSS,“文件-打開-數(shù)據(jù)”,選中excel,如下圖結(jié)果。首先將變量標準化,“分析-描述統(tǒng)計-描述”,將變量全部選入對話框,點上“將標準化得分另存為變量(Z)”,結(jié)果如下。在做主成分分析,“分析-降維-因子分析”,將為標準化的變量選入對話框。選擇右側(cè)“描述”,在彈出來對話框中點上“系數(shù)、顯著性水平、KMO和Bartlett的球形度檢驗”,點“繼續(xù)”。選擇右側(cè)“抽取”,在彈出來對話框中將方法改成“主成分”,“基于特征值”改成“0.6”,點“繼續(xù)”。選擇右側(cè)“旋轉(zhuǎn)”,在彈出來對話框中,將方法改成“最大方差法”,點“繼續(xù)”。首先輸出的各
5、自變量的相關(guān)矩陣,由下圖可見,各自變量間存在顯著性相關(guān)。說明有必要進行因子分析。接著輸出的是KMO和Bartlett的檢驗,結(jié)果如下圖,由表可見,KMO是Kaiser-Meyer-Olkin的取樣適當(dāng)性度量,當(dāng)KM0越大時,表示變量間的共同因素越多,越適合進行因子分析,此處KMO大于0.6,表示可進行因子分析。此外,Bartlett球形檢驗的近似卡方分布為183.816(自由度為45)達到顯著,代表有共同因素存在,適合進行因素分析。同時,Bartlett球度檢驗給出的相伴概率為0.000,小于顯著性水平0.05,故適合進行因子分析。隨后輸出的
6、解釋的總方差,由下圖可見,主成分個數(shù)為4時,累積貢獻率已經(jīng)達到82.037%,超過80%。故本次因子分析中提取4個因子,我們分別稱之為F1,F(xiàn)2,F(xiàn)3,F(xiàn)4。在下面的成分矩陣圖中可以看出,F(xiàn)1主要是和工業(yè)氫氧化物排放量有關(guān),F(xiàn)2主要和生活煙塵排放量有關(guān),F(xiàn)3主要和生活廢水排放量有關(guān),F(xiàn)4主要和工業(yè)二氧化硫排放量有關(guān)。隨后將成分矩陣表中的系數(shù)復(fù)制到數(shù)據(jù)窗口,并將變量名命名為a1,a2,a3,a4。再在數(shù)據(jù)窗口點擊“轉(zhuǎn)換-計算變量”,將目標變量t1=a1/SQRT(4.323)。(括號內(nèi)為對應(yīng)主成分的初始特征值),依次算出t2,t3,t4。則可知
7、道Y1=0.382*Z工業(yè)廢水排放量+0.365*Z工業(yè)化學(xué)需氧量排放量+0.262*Z工業(yè)二氧化硫排放量+0.397*Z工業(yè)煙塵排放量+0.404*工業(yè)氫氧化物排放量+0.120*Z生活廢水排放量+0.357*Z生活化學(xué)需氧量排放量+0.320*Z生活二氧化硫排放量+0.136*Z生活煙塵排放量+0.261*Z生活氫氧化物排放量,依次依據(jù)t2,t3,t4得到Y(jié)2,Y3,Y4。再依據(jù)Z=0.43226*Y1+0.21911*Y2+0.10380*Y3+0.06519*Y4得到綜合得分,見表1。、然后做層次聚類分析,“分析-分類-系統(tǒng)-系統(tǒng)聚類
8、”,在彈出來對話框把綜合得分選入變量欄,在右側(cè)“繪制”中點上“樹狀圖”,點確定。如下圖。依據(jù)下面的樹狀圖,可將序號12,31,13,20,28,25,23,30,1