資源描述:
《基于k-means算法及層次聚類算法的研究與應(yīng)用》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、.TP311:10183分類號.5單位代碼3密級:公開研究生學(xué)號:20口53H13■戀吉林大學(xué)碩女學(xué)位論文"(專他學(xué)T充)基于K-weans算法及層次聚類算法的硏究與應(yīng)用esearchitionBasedOnK-meansAlorithmandRaidAlcag|ppHcalClusterinAlorithmierarchigg作者姓名;喬端瑞類別;工程碩±孩領(lǐng)域巧向;)軟件工程指導(dǎo)教師:李古山教授墻養(yǎng)單位:軟件學(xué)院201
2、6年6月基于K-means算法及層次聚類算法的研究與應(yīng)用ResearchandApplicationBasedOnK-meansAlgorithmandHierarchicalClusteringAlgorithm作者姓名:喬端瑞專業(yè)名稱:軟件工程指導(dǎo)教師:李占山教授學(xué)位類別:在職工程碩士答辯日期:2016年5月15日未經(jīng)本論文作者的書面授權(quán),依法收存和保管本論文書面版本、電子版本的任何單位和個人,均不得對本論文的全部或部分內(nèi)容進(jìn)行任何形式的復(fù)制、修改、發(fā)行、出租、改編等有礙作者著作權(quán)的商
3、業(yè)性使用(但純學(xué)術(shù)性使用不在此限)。否則,應(yīng)承擔(dān)侵權(quán)的法律責(zé)任。吉林大學(xué)碩±學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交學(xué)位論義,是本人在指導(dǎo)教師的指導(dǎo)下,獨立進(jìn)行研究工作所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本論文不包含任何其他個人或集體己經(jīng)發(fā)表或撰寫過的作品成果。對本文的研究做出重要貢獻(xiàn)的個人和集體,均已在文中明確方式標(biāo)明。本人完全意識到本聲明的法律結(jié)果由本人承擔(dān)。學(xué)位論文作者簽名:日期:2016年摘要基于K-means算法及層次聚類算法的研究與應(yīng)用隨著世界上各行
4、各業(yè)的快速發(fā)展,人們面臨著越來越多的數(shù)據(jù),大數(shù)據(jù)的時代已經(jīng)到來,人們開始探索研究大數(shù)據(jù)為生活以及社會活動帶來的影響。在研究中,對大數(shù)據(jù)的處理方法成為備受關(guān)注的熱點之一。在對大量數(shù)據(jù)的處理中,聚類分析是一個重要的手段。在醫(yī)療診斷、圖像處理、信息檢索、統(tǒng)計學(xué)、生物學(xué)等領(lǐng)域的應(yīng)用都非常廣泛。由于聚類算法在應(yīng)用中呈現(xiàn)的算法簡單、容易實現(xiàn)且應(yīng)用效果較好,從而引起了專家學(xué)者的廣泛關(guān)注。隨著聚類算法的應(yīng)用領(lǐng)域的不斷拓寬,使得人們對聚類算法的研究成為數(shù)據(jù)挖掘領(lǐng)域的一個熱點問題,也使其成為是利用計算機實現(xiàn)低級視覺到高級視覺
5、的核心環(huán)節(jié)。本文在學(xué)習(xí)基于大數(shù)據(jù)背景下的聚類算法的原理與應(yīng)用的基礎(chǔ)上,借鑒前人的研究經(jīng)驗,對算法的產(chǎn)生、原理及實現(xiàn)進(jìn)行了研究,同時對聚類算法進(jìn)行了實驗對比,通過分析聚類的效果驗證了算法的可行性和具體應(yīng)用條件。本論文主要描述了K-means算法、層次聚類算法的原理和實現(xiàn)方法及其優(yōu)缺點,并針對算法存在的缺點進(jìn)行改進(jìn),提出改進(jìn)方案;對K-means算法的初始聚類中心點選取對聚類效果的影響進(jìn)行分析;對于層次聚類算法在聚類中存在合并點選擇的難題進(jìn)行實驗分析;對K-means算法和層次聚類算法的聚類效果進(jìn)行了實驗對比
6、。以逐步改進(jìn)算法聚類效果為目的,為實際應(yīng)用提供可靠依據(jù),我們使用Java軟件對分割算法進(jìn)行了仿真,取得了一定的研究經(jīng)驗。I最后,對聚類算法的改進(jìn)過程進(jìn)行記錄,測試改進(jìn)的算法,使它給出在某種環(huán)境和數(shù)據(jù)范圍下會產(chǎn)生更好的聚類結(jié)果。為聚類算法在數(shù)據(jù)處理中的應(yīng)用提供了參考依據(jù),為解決其它類似復(fù)雜模式的識別問題的研究提供重要啟示。關(guān)鍵詞:聚類改進(jìn);k-means算法;算法實現(xiàn);凝聚型層次聚類算法;IIAbstractResearchandApplicationBasedOnK-meansAlgorithmandHi
7、erarchicalClusteringAlgorithmWiththerapiddevelopmentofvariousindustriesintheworld,peoplearefacedwithmoreandmoredata,theeraofthebigdataiscoming.Peoplebegantoexploretheimpactofbigdatathatbringstoourlifeandsocialactivities.Inthestudy,theprocessingmethodofthe
8、bigdatahasbecomeoneofthecentralissuesofconcern.Intheprocessingofbigdata,clusteranalysisisanimportantmeans.Ithasaverywiderangeofapplications,likeinthefieldofmedicaldiagnostics,imageprocessing,informationretrieval,sta