資源描述:
《基于密度的空間聚類(lèi)算法的研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、Y
2、219528分類(lèi)號(hào)TP311密級(jí)公開(kāi)重慶郵電大學(xué)碩士學(xué)位論文論文題目基于密度的空間聚類(lèi)算法的研究(題名和副題名)英文題目B墜塑堡塾鯉墜塑!i復(fù)二墜墅盟墨巳璺垡型ClusteringAlgorithm碩士碩究生高墨指導(dǎo)教師薹垂堡熬蕉論文提交日期;螋2生5且論文答辯日期20Q2生‘目3日論文評(píng)閱人一—縫t§一塹生紅魚(yú)聾生絲迸&型煎紐碰叢塾答辯委員會(huì)主席余建橋教授西南大學(xué)2007年5月30日重慶郵電人學(xué)碩士論文摘要空間數(shù)據(jù)挖掘是指從包含空問(wèn)信息的數(shù)據(jù)庫(kù)中抽取隱含的知識(shí)、空間關(guān)系或有意義的特征模式。它在理解空間數(shù)據(jù)、獲取空間與非空間數(shù)據(jù)的內(nèi)在關(guān)
3、系上具有重要意義??臻g聚類(lèi)分析是空間數(shù)據(jù)挖掘中一個(gè)重要的研究方向,它是按照某種相似性度量值,對(duì)空間數(shù)據(jù)集中的數(shù)據(jù)對(duì)象進(jìn)行歸類(lèi)和標(biāo)識(shí)成簇,使得同簇中的對(duì)象盡可能相似,而不同簇問(wèn)的對(duì)象彼此不相似。空間聚類(lèi)分析既可作為獨(dú)立的空陽(yáng)J數(shù)據(jù)挖掘工具,又可作為其它方法的預(yù)處理方法,目前己經(jīng)應(yīng)用在地理信息系統(tǒng)、遙感、醫(yī)學(xué)圖像處理、環(huán)境研究等領(lǐng)域,具有重要的實(shí)用價(jià)值。目前,聚類(lèi)算法大體上分為劃分的方法、層次的方法、基于密度的方法、基于網(wǎng)格的方法和基于模型的方法。這些算法存在如下的問(wèn)題:符號(hào)屬性問(wèn)題、算法的效率問(wèn)題、初值的選擇問(wèn)題、對(duì)輸入順序的敏感性問(wèn)題、最優(yōu)
4、解問(wèn)題、算法對(duì)輸入?yún)?shù)的依賴性問(wèn)題。該研究對(duì)聚類(lèi)算法的發(fā)展現(xiàn)狀作了介紹,對(duì)現(xiàn)有的聚類(lèi)算法作了深入的研究,并對(duì)其優(yōu)缺點(diǎn)進(jìn)行了比較分析。通過(guò)對(duì)一種基于密度的聚類(lèi)算法DBSCAN進(jìn)行分析,針對(duì)其FO開(kāi)銷(xiāo)和內(nèi)存消耗大的缺陷,提出了一種基于可達(dá)核心點(diǎn)的聚類(lèi)算法DRDBSCAN。該算法主要思想是:選擇數(shù)據(jù)庫(kù)中無(wú)任何標(biāo)識(shí)的點(diǎn)進(jìn)行核心點(diǎn)判斷,圍繞核心點(diǎn)生成源簇,再對(duì)含有共享點(diǎn)的源簇不斷合并,從而得到最終結(jié)果。通過(guò)上述思想,該算法減少了DBSCAN算法中需要查詢的點(diǎn)的數(shù)量,從而克服了DBSCAN算法I/O開(kāi)銷(xiāo)和內(nèi)存消耗大的缺陷,提高了DBSCAN算法的聚類(lèi)效
5、率。利用vC++開(kāi)發(fā)工具實(shí)現(xiàn)該算法,并從聚類(lèi)質(zhì)量和效率兩方面對(duì)該算法進(jìn)行了測(cè)試。實(shí)驗(yàn)結(jié)果表明,本算法具有良好的可擴(kuò)展性,可以高效地發(fā)現(xiàn)任意形狀的聚類(lèi),不受“噪聲”的影響。關(guān)鍵詞:空間數(shù)據(jù)挖掘,聚類(lèi)分析,密度重慶郵屯人學(xué)碩七論文摘要AbstractSpatialdataminingreferstopickingupconnotativeideas,rulesorsignificantmodesfromaspatialdatabase.IthasagreatsignificanceforUStounderstandspatialdataandp
6、ickuprelationsbetweenspatialdataandnon-spatialdata.Spatialclusteringisaprimaryfieldforspatialdatamining.ItisthetaskofgroupingtheobjectsofaspatialdatabaseofsomecriteriaintomeaningfulsubclassesSOthatthemembersofaclusterareassimilaraspossiblewhereasthemembersofdifferentcluste
7、rsdifferasmuchaspossiblefromeachother.Spatialclusteringcannotonlybeaspecialtechniqueofspatialdataminingbutalsothetechniqueofpretreatmentofothermeans.NowspatialclusteringhasmanyapplicationsinGIS,remotesensing,imageprocessing,andenvironmentresearchandSOon.Sofar,therearefivek
8、indsofclusteringalgorithmswhichincludepartitioned,hierarchical,densitybased,grid-based,andmodelbasedalgorithms.Unfortunately,therearemanydisadvantagesintheseclusteringalgorithms,forexample,workingonlyonnumericvalues,efficiency,sensitivetoinitialstartingconditions,sensitive
9、totheorderofdatainput,bestsolutions,relyingonparametersinpuRedandSOon.Thebackgroundofthec