資源描述:
《《動態(tài)聚類法三》PPT課件》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、動態(tài)聚類法思想:首先選擇若干個樣本作為聚類中心,再按照事先確定的聚類準則進行聚類.在聚類過程中,根據(jù)聚類準則對聚類中心反復(fù)修改,直到分類合理為止.K-均值聚類又稱為C-均值聚類,是根據(jù)函數(shù)準則進行分類的聚類算法,使聚類準則函數(shù)最小化.準則函數(shù)K-均值算法的聚類準則算法描述設(shè)共有N個模式樣本,計算步驟如下:算法討論K-均值算法受以下幾個因素的影響(1)指定聚類中心的個數(shù)是否符合模式的實際分布;(2)所選聚類中心的初始位置;(3)樣本分布的幾何性質(zhì);(4)樣本的讀入次序.試探聚類結(jié)果的評價常見的幾個評價指標(1)聚類中心之間的距離同一類樣本相聚比較密集,不同類
2、樣本相距較遠.聚類中心之間的距離通??偞笥诟黝悩颖镜念悆?nèi)平均距離.類間距離太小,說明兩類靠得太緊,有可能合并.(2)諸聚類域中的樣本數(shù)目如果樣本的抽取比較合理,通常各類的樣本數(shù)相差不大.因此聚類結(jié)果中,若某一類的樣本數(shù)較其它類的樣本數(shù)明顯多得多,該類有可能是幾類樣本的集合.綜合考慮(1)、(2)(3)諸聚類域內(nèi)樣本距離的標準差向量聚類域內(nèi)樣本與聚類中心對應(yīng)分量差的平方和的平均值叫方差.方差的算術(shù)平方根叫做標準差.此外還可以用其它距離度量之分析模式樣本的聚類性質(zhì).例如:在一個聚類域內(nèi),距離聚類中心最遠與最近的樣本位置等.考試重點模式識別的基本概念模式識別系統(tǒng)
3、最小錯誤率貝葉斯分類器最小風險貝葉斯分類器線性判別分類器的設(shè)計步驟廣義線性分類器(非線性→線性)感知器準則函數(shù)及迭代解最小均方誤差準則與偽擬解Fisher判別分類的思想、原則及準則函數(shù)特征提取、特征選擇的概念歐氏距離、馬氏距離基于類內(nèi)散布矩陣的單類模式特征提取聚類的概念與理解監(jiān)督分類、無監(jiān)督分類聚類與分類基于距離閾值、函數(shù)準則的聚類近鄰聚類法最大最小距離算法層次聚類法動態(tài)聚類法:K-均值聚類算法考試題型第一題概念題(2個小題)10分第二題簡答題(3個小題)30分第三題計算題(4個小題)50分第四題綜合應(yīng)用題10分