資源描述:
《主成分分析實例》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、在統(tǒng)計學(xué)中,主成分分析(principalcomponentsanalysis,PCA)是一種簡化數(shù)據(jù)集的技術(shù)。它是一個線性變換。這個變換把數(shù)據(jù)變換到一個新的坐標系統(tǒng)中,使得任何數(shù)據(jù)投影的第一大方差在第一個坐標(稱為第一主成分)上,第二大方差在第二個坐標(第二主成分)上,依次類推。主成分分析經(jīng)常用減少數(shù)據(jù)集的維數(shù),同時保持數(shù)據(jù)集的對方差貢獻最大的特征。這是通過保留低階主成分,忽略高階主成分做到的。這樣低階成分往往能夠保留住數(shù)據(jù)的最重要方面。在實證問題研究中,為了全面、系統(tǒng)地分析問題,我們必須考慮眾多影響因素。這些涉及的
2、因素一般稱為指標,在多元統(tǒng)計分析中也稱為變量。因為每個變量都在不同程度上反映了所研究問題的某些信息,并且指標之間彼此有一定的相關(guān)性,因而所得的統(tǒng)計數(shù)據(jù)反映的信息在一定程度上有重疊。在用統(tǒng)計方法研究多變量問題時,變量太多會增加計算量和增加分析問題的復(fù)雜性,人們希望在進行定量分析的過程中,涉及的變量較少,得到的信息量較多。主成分分析正是適應(yīng)這一要求產(chǎn)生的,是解決這類題的理想工具主成分分析法是一種降維的統(tǒng)計方法,它借助于一個正交變換,將其分量相關(guān)的原隨機向量轉(zhuǎn)化成其分量不相關(guān)的新隨機向量,這在代數(shù)上表現(xiàn)為將原隨機向量的協(xié)方差
3、陣變換成對角形陣,在幾何上表現(xiàn)為將原坐標系變換成新的正交坐標系,使之指向樣本點散布最開的p個正交方向,然后對多維變量系統(tǒng)進行降維處理,使之能以一個較高的精度轉(zhuǎn)換成低維變量系統(tǒng),再通過構(gòu)造適當?shù)膬r值函數(shù),進一步把低維系統(tǒng)轉(zhuǎn)化成一維系統(tǒng)。主成分分析的主要作用體現(xiàn)在五個方面,第一,主成分分析能降低所研究的數(shù)據(jù)空間的維數(shù)。第二,可通過因子負荷的結(jié)論,弄清X變量間的某些關(guān)系。第三,可用于多為數(shù)據(jù)的一種圖形表現(xiàn)方法。第四,可由主成分分析構(gòu)造回歸模型,即把各個主成分作為新自變量代替原來自變量做回歸分析。第五,用主成分分析篩選回歸變量
4、。案例分析:下表是關(guān)于全國31個省市的8項經(jīng)濟指標,以此為例,進行主成分分析。省份國內(nèi)生產(chǎn)1居民消費2固定資產(chǎn)3職工工資4貨物周轉(zhuǎn)5消費價格6商品零售7工業(yè)產(chǎn)值8北京11394.892505519.018144373.9117.3112.6843.43天津2920.112720345.466501342.8115.2110.6582.51河北32849.521258704.8748392033.3115.2115.81234.85山西41092.481250290.94721717.3116.9115.6697.25內(nèi)
5、蒙5832.881387250.234134781.7117.5116.8419.39遼寧62793.372397387.9949111371.7116.11141840.55吉林71129.21872320.454430497.4115.2114.2762.47黑龍江82014.532334435.734145824.8116.1114.31240.37上海92462.575343996.489279207.4118.71131642.95江蘇105155.2519261434.9559431025.5115.811
6、4.32026.64浙江113524.7922491006.396619754.4116.6113.5916.59安徽122003.5812544744609908.3114.8112.7824.14福建132160.522320553.975857609.3115.2114.4433.67江西141205.111182282.844211411.7116.9115.9571.84山東155002.3415271229.5551451196.6117.6114.22207.69河南163002.741034670.35
7、43441574.4116.5114.91367.92湖北172391.421527571.684685849120116.61220.72湖南182195.71408422.6147971011.8119115.5843.83廣東195381.7226991639.838250656.5114111.61396.35廣西201606.151314382.595105556118.4116.4554.97海南21364.171814198.355340232.1113.5111.364.33四川223534126182
8、2.544645902.3118.51171431.81貴州23630.07942150.844475301.1121.4117.2324.72云南241206.6812613345149310.4121.3118.1716.65西藏2555.98111017.8773824.2117.3114.95.57陜西261000.031