基于劃分的聚類算法

基于劃分的聚類算法

ID:47491309

大?。?15.50 KB

頁數(shù):9頁

時(shí)間:2020-01-12

基于劃分的聚類算法_第1頁
基于劃分的聚類算法_第2頁
基于劃分的聚類算法_第3頁
基于劃分的聚類算法_第4頁
基于劃分的聚類算法_第5頁
資源描述:

《基于劃分的聚類算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫

1、文獻(xiàn)閱讀報(bào)告課程名稱:《模式識(shí)別》課程編號(hào):題目:基于劃分的聚類算法研究生姓名:學(xué)號(hào):論文評(píng)語:成績:任課教師:評(píng)閱日期:8基于劃分的聚類算法2016-11-20摘 要:聚類分析是數(shù)據(jù)挖掘的一個(gè)重要研究分支,已經(jīng)提出了許多聚類算法,劃分方法是其中之一?;趧澐值木垲愃惴ň褪怯媒y(tǒng)計(jì)分析的方法研究分類問題。本文介紹了聚類的定義以及聚類算法的種類,詳細(xì)闡述了K均值聚類算法和K中心點(diǎn)聚類算法的基本原理并對(duì)他們的性能進(jìn)行分析,對(duì)近年來各學(xué)者對(duì)基于劃分的聚類算法的研究現(xiàn)狀進(jìn)行梳理,對(duì)其具體應(yīng)用實(shí)例作簡要介紹。關(guān)鍵字:數(shù)據(jù)挖掘;聚類;K均值聚類算法;K中心點(diǎn)聚類算法;K眾數(shù)算法;k多

2、層次聚類算法PartitionalclusteringalgorithmsAbstract:Clusteringanalysisisanimportantbranchofdatamining,manyclusteringalgorithmshavebeenproposed,thedividingmethodisoneofthem.Basedontheclusteringalgorithmisdividedintoclassificationproblemsusingthemethodofstatisticalanalysis.Inthispaper,weintroduc

3、esthedefinitionofclusteringandtypeofclusteringalgorithm,thebasicprincipleofk-meansclusteringalgorithmandK-centerclusteringalgorithmareexpoundedindetail,wealsoanalyzetheirperformance,thescholarsinrecentyearsthestudyoftheclusteringalgorithmbasedonpartitioningpresentsituationhascarriedonthe

4、comb,makeabriefintroductiontoitsspecificapplicationinstance.Keywords:Datamining;clustering;k-meansclusteringalgorithms;k-medoidsclusteringalgorithms;k-modesclusteringalgorithms;k-prototypeclusteringalgorithms1.引言把單個(gè)的數(shù)據(jù)對(duì)象的集合劃分為相類似的樣本組成的多個(gè)簇或多個(gè)類的過程,這就叫聚類[[]QIANWei-ning,ZHOUAo-ying.Analyzing

5、PopularClusteringAlgorithmsfromDifferentViewpoints[J].軟件學(xué)報(bào),Vol.13,No.8:1382-1394.]。在無監(jiān)督的情況下,具有獨(dú)立的學(xué)習(xí)能力,這就是聚類。將數(shù)據(jù)空間中的所有數(shù)據(jù)點(diǎn)分別劃分到不同的類中,相近距離的劃分到相同類,較遠(yuǎn)距離的劃分到不同類,這就是聚類的目的.聚類分析常作為一種數(shù)據(jù)的預(yù)處理過程被用于許多應(yīng)用當(dāng)中,它是更深一步分析數(shù)據(jù)、處理數(shù)據(jù)的基礎(chǔ)。人們通過聚類分析這一最有效的手段來認(rèn)識(shí)事物、探索事物之間的內(nèi)在聯(lián)系,而且,關(guān)聯(lián)規(guī)則等分析算法的預(yù)處理步驟也可以用它?,F(xiàn)在,在氣象分析中,在圖像處理時(shí),在模式

6、識(shí)別領(lǐng)域,在食品檢驗(yàn)過程中,都有用到它。隨著現(xiàn)代科技水平的不斷提高、網(wǎng)絡(luò)的迅猛發(fā)展、計(jì)算機(jī)技術(shù)的不斷改革和創(chuàng)新,大批量的數(shù)據(jù)不斷涌現(xiàn)。怎樣從這些數(shù)據(jù)中提取有意義的信息成為人們關(guān)注的問題。這對(duì)聚類分析技術(shù)來說無疑是個(gè)巨大的挑戰(zhàn)。只有具有處理高維的數(shù)據(jù)的能力的聚類算法才能解決該問題.研究者們開始設(shè)計(jì)各種聚類算法,于是,基于劃分的聚類算法便應(yīng)運(yùn)而生,而且,取得了很好的效果。2.正文1聚類概述1.1定義8聚類的定義[[]孫吉貴,劉杰,趙連宇.聚類算法研究[J].JournalofSoftware,Vol.19,No.1,January2008,pp.48?61.]為:在已知的數(shù)

7、據(jù)的集合中,尋找數(shù)據(jù)點(diǎn)集的同類的集合.其中,每一個(gè)數(shù)據(jù)集合為一個(gè)類,還確定了一個(gè)區(qū)域,區(qū)域中的對(duì)象的密度高于其他區(qū)域中的對(duì)象的密度.聚類的實(shí)質(zhì)就是“把數(shù)據(jù)集合中的所有數(shù)據(jù)分成許多的類簇,其中必有一個(gè)類簇內(nèi)的實(shí)體它們都是相似的,而其它不同類簇的實(shí)體它們是不相似的;一個(gè)類簇是被測試空間中的點(diǎn)的會(huì)聚,而且,同一個(gè)類簇的任意兩個(gè)點(diǎn)之間的距離小于不同的類簇的任意兩個(gè)點(diǎn)之間的距離;一個(gè)包含的密度相對(duì)較高的點(diǎn)集的多維空間中的連通區(qū)域可以被描述為一個(gè)類簇,這時(shí),它們可以借助包含的密度相對(duì)較低的點(diǎn)集的區(qū)域與其他的區(qū)域分離開來?!?.1聚類算法的種類截止目前

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。