資源描述:
《應(yīng)用多元統(tǒng)計(jì)分析課后答案》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、應(yīng)用多元統(tǒng)計(jì)分析課后答案第五章聚類分析5.1判別分析和聚類分析有何區(qū)別?答:即根據(jù)一定的判別準(zhǔn)則,判定一個(gè)樣本歸屬于哪一類。具體而言,設(shè)有n個(gè)樣本,對(duì)每個(gè)樣本測(cè)得p項(xiàng)指標(biāo)(變量)的數(shù)據(jù),已知每個(gè)樣本屬于k個(gè)類別(或總體)中的某一類,通過找出一個(gè)最優(yōu)的劃分,使得不同類別的樣本盡可能地區(qū)別開,并判別該樣本屬于哪個(gè)總體。聚類分析是分析如何對(duì)樣品(或變量)進(jìn)行量化分類的問題。在聚類之前,我們并不知道總體,而是通過一次次的聚類,使相近的樣品(或變量)聚合形成總體。通俗來講,判別分析是在已知有多少類及是什么類的情況下進(jìn)行分類,而聚類分析是在不知道類的情況下進(jìn)行
2、分類。5.2試述系統(tǒng)聚類的基本思想。答:系統(tǒng)聚類的基本思想是:距離相近的樣品(或變量)先聚成類,距離相遠(yuǎn)的后聚成類,過程一直進(jìn)行下去,每個(gè)樣品(或變量)總能聚到合適的類中。5.3對(duì)樣品和變量進(jìn)行聚類分析時(shí),所構(gòu)造的統(tǒng)計(jì)量分別是什么?簡要說明為什么這樣構(gòu)造?答:對(duì)樣品進(jìn)行聚類分析時(shí),用距離來測(cè)定樣品之間的相似程度。因?yàn)槲覀儼裯個(gè)樣本看作p維空間的n個(gè)點(diǎn)。點(diǎn)之間的距離即可代表樣品間的相似度。常用的距離為(一)閔可夫斯基距離:q取不同值,分為(1)絕對(duì)距離()(2)歐氏距離()(3)切比雪夫距離()(二)馬氏距離(三)蘭氏距離對(duì)變量的相似性,我們更多地要
3、了解變量的變化趨勢(shì)或變化方向,因此用相關(guān)性進(jìn)行衡量。將變量看作p維空間的向量,一般用(一)夾角余弦(二)相關(guān)系數(shù)5.4在進(jìn)行系統(tǒng)聚類時(shí),不同類間距離計(jì)算方法有何區(qū)別?選擇距離公式應(yīng)遵循哪些原則?答:設(shè)dij表示樣品Xi與Xj之間距離,用Dij表示類Gi與Gj之間的距離。(1).最短距離法(2)最長距離法(3)中間距離法其中(4)重心法(5)類平均法(6)可變類平均法其中b是可變的且b<1(7)可變法其中b是可變的且b<1(8)離差平方和法通常選擇距離公式應(yīng)注意遵循以下的基本原則:(1)要考慮所選擇的距離公式在實(shí)際應(yīng)用中有明確的意義。如歐氏距離就有非
4、常明確的空間距離概念。馬氏距離有消除量綱影響的作用。(2)要綜合考慮對(duì)樣本觀測(cè)數(shù)據(jù)的預(yù)處理和將要采用的聚類分析方法。如在進(jìn)行聚類分析之前已經(jīng)對(duì)變量作了標(biāo)準(zhǔn)化處理,則通常就可采用歐氏距離。(3)要考慮研究對(duì)象的特點(diǎn)和計(jì)算量的大小。樣品間距離公式的選擇是一個(gè)比較復(fù)雜且?guī)в幸欢ㄖ饔^性的問題,我們應(yīng)根據(jù)研究對(duì)象的特點(diǎn)不同做出具體分折。實(shí)際中,聚類分析前不妨試探性地多選擇幾個(gè)距離公式分別進(jìn)行聚類,然后對(duì)聚類分析的結(jié)果進(jìn)行對(duì)比分析,以確定最合適的距離測(cè)度方法。5.5試述K均值法與系統(tǒng)聚類法的異同。答:相同:K—均值法和系統(tǒng)聚類法一樣,都是以距離的遠(yuǎn)近親疏為標(biāo)準(zhǔn)
5、進(jìn)行聚類的。不同:系統(tǒng)聚類對(duì)不同的類數(shù)產(chǎn)生一系列的聚類結(jié)果,而K—均值法只能產(chǎn)生指定類數(shù)的聚類結(jié)果。具體類數(shù)的確定,離不開實(shí)踐經(jīng)驗(yàn)的積累;有時(shí)也可以借助系統(tǒng)聚類法以一部分樣品為對(duì)象進(jìn)行聚類,其結(jié)果作為K—均值法確定類數(shù)的參考。5.6試述K均值法與系統(tǒng)聚類有何區(qū)別?試述有序聚類法的基本思想。答:K均值法的基本思想是將每一個(gè)樣品分配給最近中心(均值)的類中。系統(tǒng)聚類對(duì)不同的類數(shù)產(chǎn)生一系列的聚類結(jié)果,而K—均值法只能產(chǎn)生指定類數(shù)的聚類結(jié)果。具體類數(shù)的確定,有時(shí)也可以借助系統(tǒng)聚類法以一部分樣品為對(duì)象進(jìn)行聚類,其結(jié)果作為K均值法確定類數(shù)的參考。有序聚類就是解
6、決樣品的次序不能變動(dòng)時(shí)的聚類分析問題。如果用表示個(gè)有序的樣品,則每一類必須是這樣的形式,即,其中且,簡記為。在同一類中的樣品是次序相鄰的。一般的步驟是(1)計(jì)算直徑{D(i,j)}。(2)計(jì)算最小分類損失函數(shù){L[p(l,k)]}。(3)確定分類個(gè)數(shù)k。(4)最優(yōu)分類。5.7檢測(cè)某類產(chǎn)品的重量,抽了六個(gè)樣品,每個(gè)樣品只測(cè)了一個(gè)指標(biāo),分別為1,2,3,6,9,11.試用最短距離法,重心法進(jìn)行聚類分析。(1)用最短距離法進(jìn)行聚類分析。采用絕對(duì)值距離,計(jì)算樣品間距離陣0102105430876301098520由上表易知中最小元素是于是將,,聚為一類,記
7、為計(jì)算距離陣0306308520中最小元素是=2于是將,聚為一類,記為計(jì)算樣本距離陣030630中最小元素是于是將,聚為一類,記為因此,(2)用重心法進(jìn)行聚類分析計(jì)算樣品間平方距離陣0104102516906449369010081642540易知中最小元素是于是將,,聚為一類,記為計(jì)算距離陣01604990812540注:計(jì)算方法,其他以此類推。中最小元素是=4于是將,聚為一類,記為計(jì)算樣本距離陣016064160中最小元素是于是將,聚為一類,記為因此,5.8下表是15個(gè)上市公司2001年的一些主要財(cái)務(wù)指標(biāo),使用系統(tǒng)聚類法和K-均值法分別對(duì)這些公
8、司進(jìn)行聚類,并對(duì)結(jié)果進(jìn)行比較分析。公司編號(hào)凈資產(chǎn)收益率每股凈利潤總資產(chǎn)周轉(zhuǎn)率資產(chǎn)負(fù)債率流動(dòng)負(fù)債比率每股凈資產(chǎn)凈利潤增長率總