資源描述:
《主成分分析聚類分析[2]》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、隨機(jī)抽取管理學(xué)院10名學(xué)生,對(duì)其4門課程的考試成績(jī)進(jìn)行統(tǒng)計(jì),如下表所示,這4門課程分別為多元統(tǒng)計(jì)分析,運(yùn)籌學(xué),經(jīng)濟(jì)學(xué),管理學(xué).使用主成分分析方法對(duì)學(xué)生成績(jī)進(jìn)行分析.學(xué)生編號(hào)多元統(tǒng)計(jì)分析運(yùn)籌學(xué)經(jīng)濟(jì)學(xué)管理學(xué)1778267812637880813757371814557263685315560736678182677708178808668173719706872631057735560>>x1=[77637555316770667057];>>x2=[82787372558181816873];>>x3=[67807163608278737255];>>x4=[81818
2、168736780716360];>>data=[x1;x2;x3;x4]';%輸入觀測(cè)值數(shù)據(jù)矩陣>>[n,m]=size(data);>>fori=1:m%將數(shù)據(jù)矩陣中心標(biāo)準(zhǔn)化sddata(:,i)=(data(:,i)-mean(data(:,i)))./std(data(:,i),1);end>>[P,score,egenvalue,t2]=princomp(sddata)%做主成分分析P=-0.55110.3268-0.36240.6769-0.55880.3358-0.2089-0.7289-0.5110-0.11930.84600.0944-0.3505-
3、0.8753-0.3307-0.0398score=-1.3489-0.2567-1.2840-0.0315-1.2458-0.97400.5341-0.2698-0.8704-0.7467-0.58630.73361.16420.3096-0.2225-0.27073.3634-1.56900.3950-0.0572-1.10540.84801.1534-0.2345-1.5954-0.52120.0958-0.1867-0.69920.48720.1005-0.41050.47380.97990.57681.0306371.86371.4430-0.7628-0.
4、3031egenvalue=2.75020.93340.52750.2334t2=3.86202.43333.82971.00347.06093.97241.38341.17326.29124.9906>>fork=1:mgxl(k)=sum(egenvalue(1:k))/sum(egenvalue);end>>gxl%輸出累計(jì)貢獻(xiàn)率gxl=0.61880.82880.94751.0000>>plot(score(:,1),score(:,2),'r+')%畫出第一第二主成分的散點(diǎn)圖>>gname第一主成分,所有科目考試成績(jī)的系數(shù)均為負(fù),且差異不大,故可解釋為學(xué)生的
5、綜合學(xué)習(xí)成績(jī),該主成分得分越?。ㄉⅫc(diǎn)圖中的位置越靠左),綜合成績(jī)?cè)胶?第二主成分,數(shù)學(xué)科目考試成績(jī)的系數(shù)均為正,專業(yè)科目考試成績(jī)的系數(shù)均為負(fù),故可解釋為學(xué)生的數(shù)學(xué)科目與專業(yè)科目學(xué)習(xí)成績(jī)的差異,該主成分得分絕對(duì)值越大則差異越大,由散點(diǎn)圖可以看出,10號(hào)學(xué)生的數(shù)學(xué)科目明顯優(yōu)于其專業(yè)科目成績(jī),而5號(hào)學(xué)生的數(shù)學(xué)科目明顯差于其專業(yè)科目成績(jī).37>>Y1=score(:,1);ZF=(sum(data'))';%提取第一主成分得分,求每個(gè)學(xué)生的總分>>fork=1:norder(k,1)=find(Y1==min(Y1));Y1(order(k,1))=inf;%按第一主成分得分
6、由高到低排序order(k,2)=find(ZF==max(ZF));ZF(order(k,2))=-inf;%按總分由高到低排序end>>orderorder=7711226336889944101055兩種排序方式下3號(hào)學(xué)生和6號(hào)學(xué)生的排序結(jié)果相反,原因在于37可見,這四個(gè)科目成績(jī)的重要性是依次遞減的,3號(hào)學(xué)生的總分雖略高于6號(hào)學(xué)生,但他的最高分出現(xiàn)在重要性最低的第4科.>>R=sddata'*sddata./n%求標(biāo)準(zhǔn)化數(shù)據(jù)的樣本相關(guān)矩陣R=1.00000.78670.53220.28900.78671.00000.57490.27680.53220.57491
7、.00000.39750.28900.27680.39751.0000建模2011A主成分分析-聚類分析:data1=[7.84153.8044.3120.56266.0018.2035.3872.355.93146.2045.0522.5186.0017.2036.1894.594.90439.2029.0764.56109.0010.6074.32218.376.56223.9040.0825.17950.0015.4032.28117.356.35525.2059.35117.53800.0020.20169.96726.0214.081092