資源描述:
《應(yīng)用多元統(tǒng)計分析應(yīng)用報告》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、應(yīng)用多元統(tǒng)計分析課程報告班級專業(yè):市調(diào)0901學(xué)號:2009*****姓名:CYQ成績:2010年10月7口我國部分城市主要經(jīng)濟(jì)指標(biāo)統(tǒng)計——官方與民間數(shù)據(jù)差異分析一、引言經(jīng)濟(jì)指標(biāo)是反映一定社會經(jīng)濟(jì)現(xiàn)象數(shù)量方面的名稱及其數(shù)值。本題主要經(jīng)濟(jì)指標(biāo)包括人均GDP若(元)、人均工業(yè)產(chǎn)值%(元)、客運(yùn)總量兀(萬人)、貨運(yùn)總量兀(萬噸)、兀(億元)、固定資產(chǎn)投資總額竝(億元)、在崗職工占總?cè)丝诘谋壤秊椋ǎィ?、在崗職工人均工資額兀(元)、城鄉(xiāng)居民年底儲蓄余額兀(億元)。所以我們借助這一指標(biāo)體系對我國部分城市的主要經(jīng)濟(jì)指標(biāo)進(jìn)行分析。二、數(shù)據(jù)分析過程1.在SP
2、SS窗口中選擇Analyze—>Classify—>HierachicalCluster,調(diào)出系統(tǒng)聚類分析主界面,并將變量X]?£移入Variables框中。在Cluster欄中選擇Cases單選按鈕,即對樣品進(jìn)行聚類(若選擇Variables,則對變量進(jìn)行聚類)。在Display欄中選擇Statistics和Plots復(fù)選框,這樣在結(jié)果輸出窗口中可以同時得到聚類結(jié)果統(tǒng)計量和統(tǒng)計圖。4c“ern4CC2?點(diǎn)擊Statistics按鈕,設(shè)置在結(jié)果輸岀窗口中給出的聚類分析統(tǒng)計量。這里我們選擇系統(tǒng)默認(rèn)值,點(diǎn)擊Continue按鈕,返回主界面。3?
3、點(diǎn)擊Plots按鈕,設(shè)置結(jié)果輸出窗口中給出的聚類分析統(tǒng)計圖。選中Dendrogram復(fù)選框和Icicle欄中的None單選按鈕,即只給出聚類樹形圖,而不給出冰柱圖。單擊Continue按鈕,返回主界面。4?點(diǎn)擊Method按鈕,設(shè)置系統(tǒng)聚類的方法選項。這里我們?nèi)匀痪赜孟到y(tǒng)默認(rèn)選項。單擊Continue按鈕,返回主界面。5?點(diǎn)擊Save按鈕,指定保存在數(shù)據(jù)文件中的用于表明聚類結(jié)果的新變量。None表示不保存任何新變量;Singlesolution表示生成一個分類變量,在其后的矩形框中輸入要分成的類數(shù);Rangeofsolutions表示生成
4、多個分類變量。這里我們選擇Rangeofsolutions,并在后面的兩個矩形框中分別輸入2和4,即生成三個新的分類變量,分別表明將樣品分為2類、3類和4類時的聚類結(jié)果。點(diǎn)擊Continue,返回主界面。HierarchicalClusterAnalysis:S…ClusterMembership([)NoneOMinglesolutionNumberofclusters:G)Rangeofsolutions妙nimumnumberofclusters:2Maximumnumberofclusters:4ContinueCancelHelp
5、6?點(diǎn)擊OK按鈕,運(yùn)行系統(tǒng)聚類過程從上面的樹狀圖可以直接的觀察到,如果用聚類分析將這些地區(qū)分為三類,則24深圳獨(dú)自為一類,10上海和16廈門為一類,剩下的城市為一類。三,K值聚類分析過程1?在SPSS窗口中選擇Analyze^Classify—>K-MeansCluster,調(diào)出K均值聚類分析主界面,并將變量一移入Variables框中,將標(biāo)志變量Region移入LabelCaseby框中。在Method框中選擇Iterateclassify,即使用K-means算法不斷計算新的類中心,并替換舊的類中心(若選擇Classifyonly,則根
6、據(jù)初始類中心進(jìn)行聚類,在聚類過程中不改變類中心)。如果不手工設(shè)置,則系統(tǒng)會自動設(shè)置初始類中心,這里我們不作設(shè)置。1.1.在SPSS窗口中選擇Analyze—>Classify—>K-MeansCluster,調(diào)出K均值聚類分析主界面,并將變量一移入Variables框中,將標(biāo)志變量Region移入LabelCaseby框中。在Method框中選擇Iterateclassify,即使用K-means算法不斷計算新的類中心,并替換舊的類中心(若選擇Classifyonly,則根據(jù)初始類中心進(jìn)行聚類,在聚類過程中不改變類中心)。如果不手工設(shè)置,則
7、系統(tǒng)會自動設(shè)置初始類中心,這里我們不作設(shè)置。3?點(diǎn)擊Save按鈕,設(shè)置保存在數(shù)據(jù)文件中的表明聚類結(jié)果的新變量。其中Clustermembership選項用于建立一個代表聚類結(jié)果的變量,默認(rèn)變量名為qcl_l;Distancefromclustercenter選項建立一個新變量,代表各觀測量與其所屬類中心的歐氏距離。我們將兩個復(fù)選框都選中,單擊Continue按鈕返回。4?點(diǎn)擊Options按鈕,指定要計算的統(tǒng)計量。選中Initialclustercenters和Clusterinformationforeachcase復(fù)選框。這樣,在輸出窗
8、口中將給出聚類的初始類中心和每個觀測量的分類信息,包括分配到哪一類和該觀測量距所屬類中心的距離。單擊Continue返回。5?點(diǎn)擊OK按鈕,運(yùn)行K均值聚類分析程序2.K值聚類分析