主成分分析及matlab應(yīng)用

主成分分析及matlab應(yīng)用

ID:15790370

大?。?48.50 KB

頁(yè)數(shù):11頁(yè)

時(shí)間:2018-08-05

主成分分析及matlab應(yīng)用_第1頁(yè)
主成分分析及matlab應(yīng)用_第2頁(yè)
主成分分析及matlab應(yīng)用_第3頁(yè)
主成分分析及matlab應(yīng)用_第4頁(yè)
主成分分析及matlab應(yīng)用_第5頁(yè)
資源描述:

《主成分分析及matlab應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)

1、主成分分析類型:一種處理高維數(shù)據(jù)的方法。降維思想:在實(shí)際問(wèn)題的研究中,往往會(huì)涉及眾多有關(guān)的變量。但是,變量太多不但會(huì)增加計(jì)算的復(fù)雜性,而且也會(huì)給合理地分析問(wèn)題和解釋問(wèn)題帶來(lái)困難。一般說(shuō)來(lái),雖然每個(gè)變量都提供了一定的信息,但其重要性有所不同,而在很多情況下,變量間有一定的相關(guān)性,從而使得這些變量所提供的信息在一定程度上有所重疊。因而人們希望對(duì)這些變量加以“改造”,用為數(shù)極少的互補(bǔ)相關(guān)的新變量來(lái)反映原變量所提供的絕大部分信息,通過(guò)對(duì)新變量的分析達(dá)到解決問(wèn)題的目的。一、總體主成分1.1定義設(shè)X1,X2,…,Xp為某實(shí)際問(wèn)題所涉及的p個(gè)隨機(jī)變量。

2、記X=(X1,X2,…,Xp)T,其協(xié)方差矩陣為它是一個(gè)p階非負(fù)定矩陣。設(shè)(1)則有(2)第i個(gè)主成分:一般地,在約束條件及下,求li使Var(Yi)達(dá)到最大,由此li所確定的稱為X1,X2,…,Xp的第i個(gè)主成分。1.2總體主成分的計(jì)算設(shè)是的協(xié)方差矩陣,的特征值及相應(yīng)的正交單位化特征向量分別為及則X的第i個(gè)主成分為(3)此時(shí)1.3總體主成分的性質(zhì)1.3.1主成分的協(xié)方差矩陣及總方差記為主成分向量,則Y=PTX,其中,且由此得主成分的總方差為即主成分分析是把p個(gè)原始變量X1,X2,…,Xp的總方差分解成p個(gè)互不相關(guān)變量Y1,Y2,…,Yp

3、的方差之和,即而。第k個(gè)主成分的貢獻(xiàn)率:;前m個(gè)主成分累計(jì)貢獻(xiàn)率:,它表明前m個(gè)主成分Y1,Y2,…,Ym綜合提供X1,X2,…,Xp中信息的能力。1.3.2主成分Yi與變量Xj的相關(guān)系數(shù)由于Y=PTX,故X=PY,從而由此可得Yi與Xj的相關(guān)系數(shù)為(4)1.4標(biāo)準(zhǔn)化變量的主成分在實(shí)際問(wèn)題中,不同的變量往往有不同的量綱,由于不同的量綱會(huì)引起各變量取值的分散程度差異較大,這時(shí)總體方差則主要受方差較大的變量的控制。為了消除由于量綱的不同可能帶來(lái)的影響,常采用變量標(biāo)準(zhǔn)化的方法,即令(5)其中這時(shí)的協(xié)方差矩陣便是的相關(guān)矩陣,其中(6)利用X的相關(guān)

4、矩陣作主成分分析,有如下結(jié)論:設(shè)為標(biāo)準(zhǔn)化的隨機(jī)向量,其協(xié)方差矩陣(即X的相關(guān)矩陣)為,則的第i個(gè)主成分為(7)并且(8)其中為的特征值,為相應(yīng)于特征值的正交單位特征向量。第i個(gè)主成分的貢獻(xiàn)率:;前m個(gè)主成分的累計(jì)貢獻(xiàn)率:;與的相關(guān)系數(shù)為。二、樣本主成分前面討論的是總體主成分,但在實(shí)際問(wèn)題中,一般(或)是未知的,需要通過(guò)樣本來(lái)估計(jì)。設(shè)為取自的一個(gè)容量為n的簡(jiǎn)單隨機(jī)樣本,則樣本協(xié)方差矩陣及樣本相關(guān)矩陣分別為(9)其中分別以S和R作為和的估計(jì),然后按總體主成分分析的方法作樣本主成分分析。三、例題某市為了全面分析機(jī)械類個(gè)企業(yè)的經(jīng)濟(jì)效益,選擇了8個(gè)

5、不同的利潤(rùn)指標(biāo),14企業(yè)關(guān)于這8個(gè)指標(biāo)的統(tǒng)計(jì)數(shù)據(jù)如下表所示,試進(jìn)行主成分分析。表114家企業(yè)的利潤(rùn)指標(biāo)的統(tǒng)計(jì)數(shù)據(jù)變量企業(yè)序號(hào)凈產(chǎn)值利潤(rùn)率(%)xi1固定資產(chǎn)利潤(rùn)率(%)xi2總產(chǎn)值利潤(rùn)率(%)xi2銷售收入利潤(rùn)率(%)xi3產(chǎn)品成本利潤(rùn)率(%)xi5物耗利潤(rùn)率(%)xi6人均利潤(rùn)率xi7(千元/人)流動(dòng)資金利潤(rùn)率(%)xi8140.424.77.26.18.38.72.44220.0225.012.711.211.012.920.23.5429.1313.23.33.94.34.45.50.5783.6422.36.75.63.76.07

6、.40.1767.3534.311.87.17.18.08.91.72627.5635.612.516.416.722.829.33.01726.6722.07.89.910.212.617.60.84710.6848.413.410.99.910.913.91.77217.8940.619.119.819.029.739.62.44935.81024.88.09.88.911.916.20.78913.71112.59.74.24.24.66.50.8743.9121.80.60.70.70.81.10.0561.01332.313.9

7、9.48.39.813.32.12617.11438.59.111.39.512.216.41.32711.6解:樣本均值向量為:,樣本協(xié)方差矩陣為:由于S中主對(duì)角線元素差異較大,因此我們樣本相關(guān)矩陣R出發(fā)進(jìn)行主成分分析。樣本相關(guān)矩陣R為:矩陣R的特征值及相應(yīng)的特征向量分別為:特征值特征向量6.13660.321130.295160.389120.384720.379550.370870.319960.355461.0421-0.4151-0.597660.229740.278690.316320.37151-0.27814-0.1568

8、40.43595-0.451230.10303-0.0398950.053874-0.0372920.0751860.77059-0.424780.22037-0.668170.36336-0

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。