資源描述:
《實(shí)例說(shuō)明利用excel進(jìn)行主成分分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。
1、方法:1利用Excel2000進(jìn)行主成分分析第一步,錄入數(shù)據(jù),并對(duì)進(jìn)行標(biāo)準(zhǔn)化?!纠恳唤M古生物腕足動(dòng)物貝殼標(biāo)本的兩個(gè)變量:長(zhǎng)度和寬度。圖1原始數(shù)據(jù)和標(biāo)準(zhǔn)化數(shù)據(jù)及其均值、方差(取自張超、楊秉庚《計(jì)量地理學(xué)基礎(chǔ)》)計(jì)算的詳細(xì)過(guò)程如下:⑴將原始數(shù)據(jù)繪成散點(diǎn)圖(圖2)。主持分分析原則上要求數(shù)據(jù)具有線性相關(guān)趨勢(shì)——如果數(shù)據(jù)之間不相關(guān)(即正交),則沒(méi)有必要進(jìn)行主成分分析,因?yàn)橹鞒煞址治龅哪康木褪怯谜坏淖兞看嬖瓉?lái)非正交的變量;如果原始數(shù)據(jù)之間為非線性關(guān)系,則有必要對(duì)數(shù)據(jù)進(jìn)行線性轉(zhuǎn)換,否則效果不佳。從圖2可見(jiàn),原始數(shù)據(jù)具
2、有線性相關(guān)趨勢(shì),且測(cè)定系數(shù)R2=0.4979,相應(yīng)地,相關(guān)系數(shù)R=0.7056。⑵對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)化的數(shù)學(xué)公式為這里假定按列標(biāo)準(zhǔn)化,式中,分別為第j列數(shù)據(jù)的均值和標(biāo)準(zhǔn)差,為第i行(即第i個(gè)樣本)、第j列(即第j個(gè)變量)的數(shù)據(jù),為相應(yīng)于的標(biāo)準(zhǔn)化數(shù)據(jù),為樣本數(shù)目。圖2原始數(shù)據(jù)的散點(diǎn)圖圖3標(biāo)準(zhǔn)化數(shù)據(jù)的散點(diǎn)圖對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化的具體步驟如下:①求出各列數(shù)據(jù)的均值,命令為average,語(yǔ)法為:average(起始單元格:終止單元格)。如圖1所示,在單元格B27中輸入“=AVERAGE(B1:B26)”,確定或回車,即
3、得第一列數(shù)據(jù)的均值;然后抓住單元格B27的右下角(光標(biāo)的十字變細(xì))右拖至C27,便可自動(dòng)生成第二列數(shù)據(jù)的均值。②求各列數(shù)據(jù)的方差。命令為varp,語(yǔ)法同均值。如圖1所示,在單元格B28中輸入“=VARP(B2:B26)”,確定或回車,可得第一列數(shù)據(jù)的方差,右拖至C28生成第二列數(shù)據(jù)的方差。③求各列數(shù)據(jù)的標(biāo)準(zhǔn)差。將方差開(kāi)方便得標(biāo)準(zhǔn)差。也可利用命令stdevp直接生成標(biāo)準(zhǔn)差,語(yǔ)法和操作方法同均值、方差,不贅述。④標(biāo)準(zhǔn)化計(jì)算。如圖1所示,在單元格D2中輸入“=(B2-$B$27)/$B$29”,回車可得第一列第一個(gè)
4、數(shù)據(jù)“3”的標(biāo)準(zhǔn)化數(shù)值-1.786045,然后按住單元格D2的右下角下拖至D26,便會(huì)生成第一列數(shù)據(jù)的全部標(biāo)準(zhǔn)化數(shù)值;按照單元格D2的右下角右拖至E2,就能生成第二列第一個(gè)數(shù)據(jù)“2”的標(biāo)準(zhǔn)化數(shù)據(jù)-1.806077,抓住單元格E2的右下角下拖至E26便會(huì)生成第二列數(shù)據(jù)的全部標(biāo)準(zhǔn)化數(shù)值。⑤作標(biāo)準(zhǔn)化數(shù)據(jù)的散點(diǎn)圖(圖3)??梢钥闯?,點(diǎn)列的總體趨勢(shì)沒(méi)有變換,兩種數(shù)據(jù)的相關(guān)系數(shù)與標(biāo)準(zhǔn)化以前完全相同。但回歸模型的截距近似為0,即有,斜率等于相關(guān)系數(shù),即有。⑶求標(biāo)準(zhǔn)化數(shù)據(jù)的相關(guān)系數(shù)矩陣或協(xié)方差矩陣。求相關(guān)系數(shù)矩陣的方法是:沿
5、著“工具(T)”→“數(shù)據(jù)分析(D)”的路徑打開(kāi)“分析工具(A)”選項(xiàng)框(圖4),確定,彈出“相關(guān)系數(shù)”對(duì)話框(圖5),在“輸入?yún)^(qū)域”的空白欄中輸入標(biāo)準(zhǔn)化數(shù)據(jù)范圍,并以單元格G1為輸出區(qū)域,具體操作方法類似于回歸分析。確定,即會(huì)在輸出區(qū)域給出相關(guān)圖4分析工具選項(xiàng)框圖5相關(guān)系數(shù)對(duì)話框系數(shù)矩陣的下三角即對(duì)角線部分,由于系對(duì)稱矩陣,上三角的數(shù)值與下三角相等,故未給出(圖6),可以通過(guò)“拷貝——轉(zhuǎn)置——粘帖”的方式補(bǔ)充空白部分。圖6標(biāo)準(zhǔn)化數(shù)據(jù)的相關(guān)系數(shù)和協(xié)方差求協(xié)方差的方法是在“分析工具”選項(xiàng)框中選擇“協(xié)方差”(圖7)
6、,彈出“協(xié)方差”選項(xiàng)框(圖8),具體設(shè)置與“相關(guān)系數(shù)”類似,不贅述。結(jié)果見(jiàn)圖6,可以看出,對(duì)于標(biāo)準(zhǔn)化數(shù)據(jù)而言,協(xié)方差矩陣與相關(guān)系數(shù)矩陣完全一樣。因此,二者任取其一即可。圖7在分析工具選項(xiàng)框中選擇“協(xié)方差”圖8協(xié)方差選項(xiàng)框⑷計(jì)算特征根。我們已經(jīng)得到相關(guān)系數(shù)矩陣為,而二階單位矩陣為,于是根據(jù)公式,我們有按照行列式化為代數(shù)式的規(guī)則可得根據(jù)一元二次方程的求根公式,當(dāng)時(shí),我們有據(jù)此解得,(對(duì)于本例,顯然,)。這便是相關(guān)系數(shù)矩陣的兩個(gè)特征根。⑸求標(biāo)準(zhǔn)正交向量。將代入矩陣方程,得到在系數(shù)矩陣中,用第一行加第二行,化為由此得
7、,令,則有,于是得基礎(chǔ)解系,單位化為單位化的公式為()。完全類似,將代入矩陣方程,得到用系數(shù)矩陣的第二行減去第一行,化為于是得到,取,則有,因此得基礎(chǔ)解系為,單位化為這里、便是標(biāo)準(zhǔn)正交向量。⑹求對(duì)角陣。首先建立標(biāo)準(zhǔn)正交矩陣P,即有該矩陣的一個(gè)特殊性質(zhì)便是,即矩陣的轉(zhuǎn)置等于矩陣的逆。根據(jù),可知下面說(shuō)明一下利用Excel進(jìn)行矩陣乘法運(yùn)算的方法。矩陣乘法的命令為mmult,語(yǔ)法是mmult(矩陣1的單元格范圍,矩陣2的單元格范圍)。例如,用矩陣與矩陣C相乘,首先選擇一個(gè)輸出區(qū)域如G1:H2,然后輸入“=mmult(
8、A1:B2,C1:D2)”,然后按下“Ctrl+Shift+Enter”鍵(圖9),即可給出1.2060441.2060440.20817-0.20817再用乘得的結(jié)果與P陣相乘,便得對(duì)角矩陣1.705603000.294397如果希望一步到位也不難,選定輸出區(qū)域如C3:D4,然后輸入“=mmult(mmult(A1:B2,C1:D2),E1:F2)”(圖10),同時(shí)按下“Ctrl+Shift+En