資源描述:
《基于最優(yōu)劃分的多密度梯度網(wǎng)格聚類算法》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、AMulti-densityGradientGridClusteringAlgorithmbasedontheOptimalDivisionDissertationSubmittedtotheGraduateSchoolofHenanUniversityinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofScienceByZhangZhendongSupervisor:ZhengFengbinMay2012關(guān)于學位論文獨創(chuàng)聲明和學術(shù)誠信承諾本人向河南大學提出碩士學位申請.本人鄭
2、重聲明:所呈交的學位論文是本人在導師的指導下獨立完成的,對所研究的課題有新的見解.據(jù)我所知,除文中特別加以說明、標注和致謝的地方外,論文中不包括其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包括其他人為獲得任何教育、科研機構(gòu)的學位或證書而使用過的材料.與我一同工作的同事對本研究所做的任何貢獻均已在論文中作了明確的說明并表示了謝意。在此本人鄭重承諾:所呈交的學位論文不存在舞弊作偽行為,文責自負.學位申請人(學位論文作者)簽名:羽幽∑201Z,年占月f8日關(guān)于學位論文著作權(quán)使用授權(quán)書本人經(jīng)河南大學審核批準授予碩士學位.作為學位論文的作者,本人完全了解并同
3、意河南大學有關(guān)保留、使用學位論文的要求,即河南大學有權(quán)向國家圖書館、科研信息機構(gòu)、數(shù)據(jù)收集機構(gòu)和本校圖書館等提供學位論文(紙質(zhì)文本和電子文本)以供公眾檢索、查閱。本人授權(quán)河南大學出于宣揚、展覽學校學術(shù)發(fā)展和進行學術(shù)交流等目的,可以采取影印、縮印、掃描和拷貝等復制手段保存、匯編學位論文(紙質(zhì)文本和電子文本).(涉及保密內(nèi)容的學位論文在解密后適用本授權(quán)書)學位獲得者(學位論文作者)簽名:201≯年S月f彥日學位論文指導教師簽名:201摘要數(shù)據(jù)挖掘是從數(shù)量龐大的、隨機出現(xiàn)的、客觀存在的、不完全的并充滿噪聲的數(shù)據(jù)中提取和發(fā)現(xiàn)有價值的信息,從而為商務分
4、析與決策、自然科學理論、人文地理等提供有效的技術(shù)支持和可靠的數(shù)據(jù)依據(jù)。其中,聚類分析是數(shù)據(jù)挖掘中一項十分重要而有趣的研究課題,并且因為其強大的應用和研究價值而受到越來越廣泛的關(guān)注。為解決網(wǎng)格聚類算法中對參數(shù)過于敏感、無法自動識別不同密度梯度類以及不同梯度類間劃分不夠精確等問題,提出了基于最優(yōu)劃分的多密度梯度網(wǎng)格聚類算法(OPMDG)。該算法只需用戶輸入一個大致的密度閾值范圍,網(wǎng)格邊長自動計算并可自動調(diào)節(jié)適應,減少了算法對參數(shù)的敏感性;提出了二重劃分技術(shù),可挖掘不同密度梯度的類;對于處于不同類上的交界點,引入了電荷間吸引力的概念,能有效解決類間
5、聚類精度不高等問題。實驗結(jié)果表明,OPMDG算法能識別各種不同形狀、大小的簇,挖掘具有不同密度梯度類,并能有效地劃分邊界和去除離群點與噪聲點。在通過和GCOD算法的對比中,可以顯著發(fā)現(xiàn)OPMDG算法的精度和準確度更高,且時間復雜度是一個不大的線性函數(shù)。關(guān)鍵詞:網(wǎng)格聚類,參數(shù)半自動化,最優(yōu)劃分,多密度梯度,算法ABSTRACTDataminingisamethod,which,fromahugenumberofrandomlyoccurring,objectiveexistence,incompleteandnoisydatawereextra
6、ctedandfindvaluableinformationforbusinessanalysisanddecision,thus,thetheoryofnaturalscience,humangeographyandprovideeffectivetechnicalsupportandreliabledatabasis.Amongthem,clusteringanalysisindataminingisaveryimportantandinterestingresearchtopics,andbecauseofitsgreatapplica
7、tionandresearchvalueandhasattractedmoreandmoreattention.InordertosolvethegridclusteringalgorithmtoparametertOOsensitive,Canautomaticallyidentifythedifferentdensitygradientanddifferentgradientdifferentiatesbetweenpreciseenoughtowaitforaproblem,putforwardAMulti·densityGradien
8、tGridClusteringAlgorithmbasedontheOptimalDivision(OPMDG).Thisalgorithmonlyneedstoi