資源描述:
《帶交叉變異算子自適應粒子群聚類算法地研究》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。
1、學校代號10530學號200811041386分類號TP393密級碩士學位論文帶交叉變異算子的自適應粒子群聚類算法的研究學位申請人盤俊良指導教師石躍祥教授學院名稱信息工程學院學科專業(yè)信號與信息處理研究方向智能信息處理與數(shù)據(jù)挖掘二○一一年五月十日StudyinadaptiveParticleSwarmOptimizationwithCrossoverandmutationoperatorCandidatePanJunLiangSupervisorProfessorShiCueingCollegeCollegeofInformationEngi
2、neeringProgramSignal&InformationProcessSpecializationIntelligentProcessing&DataMiningDegreeEngineeringMasterUniversityXiangtanUniversityDate2011-5-10湘潭大學學位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導師的指導下獨立進行研究所取得的研究成果。除了文中特別加以標注引用的內(nèi)容外,本論文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫的成果作品。對本文的研究做出重要貢獻的個人和集體,均已在文中以明確方
3、式標明。本人完全意識到本聲明的法律后果由本人承擔。作者簽名:日期:年月日學位論文版權使用授權書本學位論文作者完全了解學校有關保留、使用學位論文的規(guī)定,同意學校保留并向國家有關部門或機構送交論文的復印件和電子版,允許論文被查閱和借閱。本人授權湘潭大學可以將本學位論文的全部或部分內(nèi)容編入有關數(shù)據(jù)庫進行檢索,可以采用影印、縮印或掃描等復制手段保存和匯編本學位論文。涉密論文按學校規(guī)定處理。作者簽名:日期:年月日導師簽名:日期:年月日摘要聚類分析是數(shù)據(jù)挖掘中一項重要的挖掘任務。所謂“物以類聚”,聚類分析從大量數(shù)據(jù)對象中尋找數(shù)據(jù)屬性間的相似性,并以此為
4、數(shù)據(jù)對象分類,從而達到和優(yōu)化大規(guī)模數(shù)據(jù)的查詢和發(fā)現(xiàn)隱含有用信息的目的。本文著重對聚類分析中應用最廣泛的是基于劃分的聚類方法——K-means聚類方法進行了深入地研究,并對其優(yōu)缺點進行了分析,該算法具有思想簡單、結構簡單、執(zhí)行效率高等優(yōu)點,但是算法也存在著對初始聚類中心敏感、容易陷入局部最優(yōu)的缺點,而這兩個缺點也是制約該算法應用的主要原因。為了改善K-means聚類方法對初始聚類中心敏感、容易陷入局部最優(yōu)的缺點,本文采用具有全局尋優(yōu)能力和更高分類準確度的改進型粒子群算法與K-means算法相結合。其中主要研究工作包括:(1)對標準粒子群算法慣
5、性權重因子的研究。由于標準粒子群算法中粒子飛行方向與速度對慣性權重w的依賴性強,本文提出了慣性權重改進方案,即隨粒子群算法執(zhí)行過程動態(tài)變化的自適應慣性權重。(2)設計了基于適應度為基準的交叉操作,這樣保證了種群中粒子的多樣性,加強了粒子的全局搜索能力,也加快粒子群收斂速度。提出了基于群適應度標準差的變異操2作,變異操作通過粒子群的群體適應度標準差?和當前粒子理論最優(yōu)值fgbest來控制粒子的變異概率。同時,構造了比較直觀的適應度函數(shù)。粒子群算法中適應度函數(shù)至關重要,特別在本文中適應度函數(shù)不僅直接影響交叉算子對粒子的操作而且決定著變異操作,這
6、樣適應度函數(shù)將會影響聚類中心點的優(yōu)化及聚類劃分的情況。在本文中所給出的適應度函數(shù)主要依據(jù)類內(nèi)總的離散度,即通過類內(nèi)盡量緊湊、類間盡量松散的原則來構建。(3)將改進后的粒子群算法與K-means聚類算法融合。給出了把粒子群優(yōu)化算法引入到K-means算法中去的粒子的編碼方案和算法流程。通過兩種算法的結合改善K-means算法對初始聚類中心選擇敏感等問題。文章最后將基于交叉變異算子的自適應粒子群聚類算法應用到UCI學習型數(shù)據(jù)庫中,并通過將該文提出的聚類方法與K-means聚類算法、基于遺傳算法的聚類算法、基于粒子群算法的聚類算法作比較,從實驗結
7、果可以看出,本文中提出的聚類算法較上述三種算法擁有更好的適應度值和分類正確率并且算法更加穩(wěn)定,因此,本文的方法改善了K-means聚類算法對初始聚類中心敏感和容易陷入局部最優(yōu)的缺陷。關鍵字:交叉變異算子;自適應慣性權重;粒子群;K-means;聚類分析IAbstractClusteranalysisisanimportanttaskindatamining.Theso-called"featherflocktogether".Inordertooptimizequeriesandfindusefulinformationinthelarge
8、-scaledata,clusteranalysisinsearchforsimilaritiesbetweendataattributesbyclusteranalysis,a