資源描述:
《實驗八 主成分分析》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在行業(yè)資料-天天文庫。
1、學號:班級:姓名:實驗八主成分分析一、實驗目的和要求能利用原始數(shù)據(jù)與相關矩陣、協(xié)主差矩陣作主成分分析,并能理解標準化變量主成分與原始數(shù)據(jù)主成分的聯(lián)系與區(qū)別;能根據(jù)SAS輸出結果選出滿足要求的幾個主成分.實驗要求:編寫程序,結果分析.實驗內(nèi)容:1.何為主成分?主成分的求法、性質(zhì)?主成分個數(shù)選取的依據(jù)?主成分定義:滿足:(1)系數(shù)向量單位化;(2)各主成分不相關,無重疊信息,;(3)主成分方差由此遞減.步驟:1)解,求的p個特征值;2)對應的正交單位化的特征向量分別為;其中,3)的第個主成分為;為個主成分構成的隨機向量,則,其中為正交矩陣,且故主成分向量的協(xié)方差陣為學
2、號:班級:姓名:各主成分的總方差4)主成分的貢獻率與累計貢獻率——第k個主成分的貢獻率它反映了第k個主成分提取全部信息的多少——前k個主成分的累積貢獻率它反映了前k個主成分共同提取全部信息的多少.性質(zhì):(1)系數(shù)向量單位化;(2)各主成分不相關,無重疊信息,;(3)主成分方差由此遞減.依據(jù):正交單位化特征向量第K個主成分可以記為:2.利用樣品求主成分的步驟?1)求樣本協(xié)方差矩陣特征值;2)相應的正交單位化特征向量,;3)第個樣本主成分,4)——第k個樣本主成分的貢獻率——前k個主成分的累積貢獻率學號:班級:姓名:5)第個樣本主成分的個觀測值稱為第個樣本主成分的得分
3、,可以依據(jù)得分對各組樣本觀測數(shù)據(jù)進行排序:()樣本主成分的觀測數(shù)據(jù)(得分向量)3.書上4.54.64.5(1)程序如下:dataexamp4_5;inputidx1-x8;cards;18.3523.537.518.6217.4210.001.0411.2129.2523.756.619.1917.7710.481.7210.5138.1930.504.729.7816.287.602.5210.3247.7329.205.429.4319.298.492.5210.0059.4227.938.208.1416.179.421.559.7669.1627.989.
4、019.3215.999.101.8211.35710.0628.6410.5210.0516.188.391.9610.8189.0928.127.409.6217.2611.122.4912.6599.4128.205.7710.8016.3611.561.5312.17108.7028.127.2110.5319.4513.301.6611.96116.9329.854.549.4916.6210.651.8813.61128.6736.057.317.7516.6711.682.3812.88139.9837.697.018.9416.1511.080.8
5、311.67146.7738.696.018.8214.7911.441.7413.23158.1437.759.618.4913.159.761.2811.28167.6735.718.048.3115.137.761.4113.25177.9039.778.4912.9419.2711.052.0413.29187.1840.917.328.9417.6012.751.1414.80198.8233.707.5910.9818.8214.731.7810.10206.2535.024.726.2810.037.151.9310.392110.6052.417.
6、709.9812.5311.702.3114.69227.2752.653.849.1613.0315.261.9814.572313.4555.855.507.459.559.522.2116.302410.8544.687.3214.5117.1312.081.2611.57學號:班級:姓名:257.2145.797.6610.3616.5612.862.2511.69267.6850.3711.3513.3019.2514.592.7514.87277.7848.448.0020.5122.1215.731.1516.61287.9439.6520.9720
7、.8222.5212.411.757.90298.2864.348.0022.2220.0615.120.7222.893012.4776.395.5211.2414.5222.005.4625.50;run;procprincompdata=examp4_5prefix=yout=bb;;varx1-x8;run;procprintdata=bb;run;結果如下:相關系數(shù)矩陣R為(2)樣本相關系數(shù)矩陣R的特征值、各主成分貢獻率及累計貢獻率學號:班級:姓名:貢獻率累計貢獻率(3)程序如下:procplotdata=bb;ploty2*y1$id='*';proc
8、sortd