資源描述:
《主成分分析法實例.docx》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、【轉(zhuǎn)】主成分分析法概述、案例實例分析主成分分析法主成分分析也稱主分量分析,旨在利用降維的思想,把多指標轉(zhuǎn)化為少數(shù)幾個綜合指標。在實證問題研究中,為了全面、系統(tǒng)地分析問題,我們必須考慮眾多影響因素。這些涉及的因素一般稱為指標,在多元統(tǒng)計分析中也稱為變量。因為每個變量都在不同程度上反映了所研究問題的某些信息,并且指標之間彼此有一定的相關(guān)性,因而所得的統(tǒng)計數(shù)據(jù)反映的信息在一定程度上有重疊。在用統(tǒng)計方法研究多變量問題時,變量太多會增加計算量和增加分析問題的復(fù)雜性,人們希望在進行定量分析的過程中,涉及的變量較少,得到的信息量較多。主成分分析正是適應(yīng)這一要
2、求產(chǎn)生的,是解決這類題的理想工具。主成分分析法是一種數(shù)學(xué)變換的方法,它把給定的一組相關(guān)變量通過線性變換轉(zhuǎn)成另一組不相關(guān)的變量,這些新的變量按照方差依次遞減的順序排列。在數(shù)學(xué)變換中保持變量的總方差不變,使第一變量具有最大的方差,稱為第一主成分,第二變量的方差次大,并且和第一變量不相關(guān),稱為第二主成分。依次類推,I個變量就有I個主成分。這種方法避免了在綜合評分等方法中權(quán)重確定的主觀性和隨意性,評價結(jié)果比較符合實際情況;同時,主成份分量表現(xiàn)為原變量的線性組合,如果最后綜合指標包括所有分量,則可以得到精確的結(jié)果,百分之百地保留原變量提供的變差信息,即使
3、舍棄若干分量,也可以保證將85%以上的變差信息體現(xiàn)在綜合評分中,使評價結(jié)果真實可靠。是在實際中應(yīng)用得比較廣的一種方法。由于其第一主成份(因子)在所有的主成分中包含信息量最大,很多學(xué)者在研究綜合評價問題時常采用第一主成分來比較不同實體間的差別。綜上所述,該方法的優(yōu)點主要體現(xiàn)在兩個方面:1.權(quán)重確定的客觀性;2.評價結(jié)果真實可靠。1.主成分分析的基本原理主成分分析:把原來多個變量劃為少數(shù)幾個綜合指標的一種統(tǒng)計分析方法,是一種降維處理技術(shù)。)記原來的變量指標為x1,x2,…,xP,它們的綜合指標——新變量指標為z1,z2,…,zm(m≤p),則z1,
4、z2,…,zm分別稱為原變量指標x1,x2,…,xP的第一,第二,…,第m主成分,在實際問題的分析中,常挑選前幾個最大的主成分。①zi與zj(i≠j;i,j=1,2,…,m)相互無關(guān);②z1是x1,x2,…,xP的一切線性組合中方差最大者,z2是與z1不相關(guān)的x1,x2,…,xP的所有線性組合中方差最大者;……;zm是與z1,z2,……,zm-1都不相關(guān)的x1,x2,…,xP的所有線性組合中方差最大者。2.主成分分析的計算步驟①計算相關(guān)系數(shù)矩陣②計算特征值與特征向量③計算主成分貢獻率及累計貢獻率④計算主成分載荷主成分分析方法(舉例)3.主成分分
5、析方法應(yīng)用實例1)實例1:流域系統(tǒng)的主成分分析(張超,1984)表3.5.1(點擊顯示該表)給出了某流域系統(tǒng)57個流域盆地的9項變量指標。其中,x1代表流域盆地總高度(m),x2代表流域盆地山口的海拔高度(m),x3代表流域盆地周長(m),x4代表河道總長度(m),x5代表河道總數(shù),x6代表平均分叉率,x7代表河谷最大坡度(度),x8代表河源數(shù),x9代表流域盆地面積(km2)。注:表中數(shù)據(jù)詳見書本87和88頁。(1)分析過程:①將表3.5.1中的原始數(shù)據(jù)作標準化處理,然后將它們代入相關(guān)系數(shù)公式計算,得到相關(guān)系數(shù)矩陣(表3.5.2)。②由相關(guān)系數(shù)
6、矩陣計算特征值,以及各個主成分的貢獻率與累計貢獻率(見表3.5.3)。由表3.5.3可知,第一,第二,第三主成分的累計貢獻率已高達86.5%,故只需求出第一、第二、第三主成分z1,z2,z3即可。z3上的載荷?。ū?.5.4)。