資源描述:
《主成分分析聚類分析(精品)》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、隨機(jī)抽取管理學(xué)院10名學(xué)生,對英4門課程的考試成績進(jìn)行統(tǒng)計,如下表所示,這4門課程分別為多元統(tǒng)計分析運(yùn)籌學(xué)X2,經(jīng)濟(jì)學(xué)X3,管理學(xué)X,使用主成分分析方法對學(xué)生成績進(jìn)行分析.學(xué)生編號多元統(tǒng)計分析運(yùn)籌學(xué)經(jīng)濟(jì)學(xué)管理學(xué)177S267S12637SsoS1375737181455726368531556073667S1S26777081788086()SI73719706872631057735560?xl=[77637555316770667057];?x2=[82787372558181816873J;?x3=[67807163608278737255
2、];?x4=[8181816873678071636()1;?data=[xl;x2;x3;x4]';%輸入觀測值數(shù)據(jù)矩陣?[n,m]=size(data);?fori=l:m%將數(shù)據(jù)矩陣中心標(biāo)準(zhǔn)化sddata(:,i)=(data(:,i)-mean(data(:,i)))./std(data(:,i),l);end?[P,score,egenvalue,t2]=princomp(sddata)%做主成分分析P=-0.55110.3268-0.36240.6769-0.5588().3358-0.2089-0.7289-0.5110-0.119
3、30.84600.0944-0.3505-0.8753-0.3307-0.0398score=-1.3489-0.2567-1.2840-0.0315-1.2458-0.97400.5341-0.2698-0.8704-0.7467-0.58630.73361.16420.3096-0.2225-0.27073.3634-1.56900.3950-0.0572-l」0540.84801.1534-0.2345-1.5954-0.52120.0958-0」867-0.69920.48720.1005-0.41050.47380.97990.5768
4、1.03061.86371.443()-0.7628?0.3031egenvalue=2.75020.93340.52750.2334t2=3.86202.43333.82971.00347.06093.97241.38341.17326.29124.9906?fork=l:mgxl(k)=sum(egenvalue(1:k))/sum(egenvalue);end?gxl%輸出累計貢獻(xiàn)率gxl=0.6188().82880.94751.0000?plot(score(:,1),score(:,2);r4-*)%畫出第?第二主成分的散點(diǎn)圖?gna
5、me第一主成分=-0.551IX,-0.5588X2-0.5110X3-0.3505X4,所有科目考試成績的系數(shù)均為負(fù),且差異不人,故拆可解釋為學(xué)生的綜合學(xué)習(xí)成績,該主成分得分越小(散點(diǎn)圖屮的位置越靠左),綜合成績越好.第二主成分Y2=0.3268X
6、+0.3358X?-0.1193X?-0.8753X4,數(shù)學(xué)科目考試成績的系數(shù)均為正,專業(yè)科目考試成績的系數(shù)均為負(fù),故均可解釋為學(xué)生的數(shù)學(xué)科目與專業(yè)科目學(xué)習(xí)成績的差異,該主成分得分絕對值越人則芳異越人,由散點(diǎn)圖可以看出,1()號學(xué)生的數(shù)學(xué)科目明顯優(yōu)于其專業(yè)科目成績,而5號學(xué)牛的數(shù)學(xué)科目明顯差于其專業(yè)
7、科目成績.-1.5-2201234第一主成分?Yl=score(:,l);ZF=(sum(data'))';%提取第?匸成分得分,求每個學(xué)4:的總分?fork=l:norder(k,1)=find(Y1==min(Y1));Y1(order(k,l))=inf;%按第■主成分得分由高至!j低排序order(k,2)=find(ZF==max(ZF));ZF(order(k,2))=-inf;%按總分由高到低排序end?orderorder=7711226336889944101055兩種排序方式下3號學(xué)牛和6號學(xué)牛的排序結(jié)果相反,原因在于F,=-
8、0.5511X
9、?0.5588X2?0.5110X3-0.3505X4町見,這四個科H成績的重要性是依次遞減的,3號學(xué)生的總分雖略高于6號學(xué)生,但他的最高分出現(xiàn)在重要性最低的第4科.?R=sddata'*sddata./n%求標(biāo)準(zhǔn)化數(shù)據(jù)的樣本相關(guān)矩陣1.00000.78670.53220.28900.78671.00000.57490.27680.53220.57491.00000.39750.28900.27680.39751.0000建模2011A主成分分析?聚類分析:data1=[7.84153.8044.3120.56266.001&20
10、35.3872.355.93146.2045.0522.5186.0017.2036.1894.594.90439.2029.0764.