主成分分析方法.doc

主成分分析方法.doc

ID:51015235

大?。?12.00 KB

頁數(shù):7頁

時間:2020-03-17

主成分分析方法.doc_第1頁
主成分分析方法.doc_第2頁
主成分分析方法.doc_第3頁
主成分分析方法.doc_第4頁
主成分分析方法.doc_第5頁
資源描述:

《主成分分析方法.doc》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫

1、主成分分析方法——以地理系統(tǒng)分析為例?地理環(huán)境是多要素的復雜系統(tǒng),在我們進行地理系統(tǒng)分析時,多變量問題是經(jīng)常會遇到的。變量太多,無疑會增加分析問題的難度與復雜性,而且在許多實際問題中,多個變量之間是具有一定的相關(guān)關(guān)系的。因此,我們就會很自然地想到,能否在各個變量之間相關(guān)關(guān)系研究的基礎(chǔ)上,用較少的新變量代替原來較多的變量,而且使這些較少的新變量盡可能多地保留原來較多的變量所反映的信息?事實上,這種想法是可以實現(xiàn)的,本節(jié)擬介紹的主成分分析方法就是綜合處理這種問題的一種強有力的方法。第一節(jié)主成分分析方法的原理主成分分析是把原來多個變量化為少

2、數(shù)幾個綜合指標的一種統(tǒng)計分析方法,從數(shù)學角度來看,這是一種降維處理技術(shù)。假定有n個地理樣本,每個樣本共有p個變量描述,這樣就構(gòu)成了一個n×p階的地理數(shù)據(jù)矩陣:如何從這么多變量的數(shù)據(jù)中抓住地理事物的內(nèi)在規(guī)律性呢?要解決這一問題,自然要在p維空間中加以考察,這是比較麻煩的。為了克服這一困難,就需要進行降維處理,即用較少的幾個綜合指標來代替原來較多的變量指標,而且使這些較少的綜合指標既能盡量多地反映原來較多指標所反映的信息,同時它們之間又是彼此獨立的。那么,這些綜合指標(即新變量)應如何選取呢?顯然,其最簡單的形式就是取原來變量指標的線性組

3、合,適當調(diào)整組合系數(shù),使新的變量指標之間相互獨立且代表性最好。如果記原來的變量指標為x1,x2,…,xp,它們的綜合指標——新變量指標為x1,x2,…,zm(m≤p)。則在(2)式中,系數(shù)lij由下列原則來決定:(1)zi與zj(i≠j;i,j=1,2,…,m)相互無關(guān);(2)z1是x1,x2,…,xp的一切線性組合中方差最大者;z2是與z1不相關(guān)的x1,x2,…,xp的所有線性組合中方差最大者;……;zm是與z1,z2,……zm-1都不相關(guān)的x1,x2,…,xp的所有線性組合中方差最大者。這樣決定的新變量指標z1,z2,…,zm分別

4、稱為原變量指標x1,x2,…,xp的第一,第二,…,第m主成分。其中,z1在總方差中占的比例最大,z2,z3,…,zm的方差依次遞減。在實際問題的分析中,常挑選前幾個最大的主成分,這樣既減少了變量的數(shù)目,又抓住了主要矛盾,簡化了變量之間的關(guān)系。從以上分析可以看出,找主成分就是確定原來變量xj(j=1,2,…,p)在諸主成分zi(i=1,2,…,m)上的載荷lij(i=1,2,…,m;j=1,2,…,p),從數(shù)學上容易知道,它們分別是x1,x2,…,xp的相關(guān)矩陣的m個較大的特征值所對應的特征向量。第二節(jié)主成分分析的解法主成分分析的計算

5、步驟通過上述主成分分析的基本原理的介紹,我們可以把主成分分析計算步驟歸納如下:(1)計算相關(guān)系數(shù)矩陣在公式(3)中,rij(i,j=1,2,…,p)為原來變量xi與xj的相關(guān)系數(shù),其計算公式為因為R是實對稱矩陣(即rij=rji),所以只需計算其上三角元素或下三角元素即可。(2)計算特征值與特征向量首先解特征方程|λI-R|=0求出特征值λi(i=1,2,…,p),并使其按大小順序排列,即λ1≥λ2≥…,≥λp≥0;然后分別求出對應于特征值λi的特征向量ei(i=1,2,…,p)。(3)計算主成分貢獻率及累計貢獻率一般取累計貢獻率達8

6、5-95%的特征值λ1,λ2,…,λm所對應的第一,第二,……,第m(m≤p)個主成分。(4)計算主成分載荷由此可以進一步計算主成分得分:第三節(jié)主成分分析應用實例主成分分析實例對于某區(qū)域地貌-水文系統(tǒng),其57個流域盆地的九項地理要素:x1為流域盆地總高度(m)x2為流域盆地山口的海拔高度(m),x3為流域盆地周長(m),x4為河道總長度(km),x5為河表2-14?某57個流域盆地地理要素數(shù)據(jù)道總數(shù),x6為平均分叉率,x7為河谷最大坡度(度),x8為河源數(shù)及x9為流域盆地面積(km2)的原始數(shù)據(jù)如表2-14所示。張超先生(1984)曾

7、用這些地理要素的原始數(shù)據(jù)對該區(qū)域地貌-水文系統(tǒng)作了主成分分析。下面,我們將其作為主成分分析方法在地理學研究中的一個應用實例介紹給讀者,以供參考。表2-15相關(guān)系數(shù)矩陣?(1)首先將表2-14中的原始數(shù)據(jù)作標準化處理,由公式(4)計算得相關(guān)系數(shù)矩陣(見表2-15)。(2)由相關(guān)系數(shù)矩陣計算特征值,以及各個主成分的貢獻率與累計貢獻率(見表2-16)。由表2-16可知,第一,第二,第三主成分的累計貢獻率已高達86.5%,故只需求出第一,第二,第三主成分z1,z2,z3即可。表2-16?特征值及主成分貢獻率(3)對于特征值λ1=5.043,λ

8、2=1.746,λ3=0.997分別求出其特征向量e1,e2,e3,并計算各變量x1,x2,……,x9在各主成分上的載荷得到主成分載荷矩陣(見表2-17)。表2-17?主成分載荷矩陣從表2-17可以看出,第一主成分z1與

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。