資源描述:
《帶交叉變異算子自適應(yīng)粒子群聚類算法地研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、學(xué)校代號10530學(xué)號200811041386分類號TP393密級碩士學(xué)位論文帶交叉變異算子的自適應(yīng)粒子群聚類算法的研究學(xué)位申請人盤俊良指導(dǎo)教師石躍祥教授學(xué)院名稱信息工程學(xué)院學(xué)科專業(yè)信號與信息處理研究方向智能信息處理與數(shù)據(jù)挖掘二○一一年五月十日StudyinadaptiveParticleSwarmOptimizationwithCrossoverandmutationoperatorCandidatePanJunLiangSupervisorProfessorShiCueingCollegeCollegeofInformationEngi
2、neeringProgramSignal&InformationProcessSpecializationIntelligentProcessing&DataMiningDegreeEngineeringMasterUniversityXiangtanUniversityDate2011-5-10湘潭大學(xué)學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨立進(jìn)行研究所取得的研究成果。除了文中特別加以標(biāo)注引用的內(nèi)容外,本論文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫的成果作品。對本文的研究做出重要貢獻(xiàn)的個人和集體,均已在文中以明確方
3、式標(biāo)明。本人完全意識到本聲明的法律后果由本人承擔(dān)。作者簽名:日期:年月日學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)湘潭大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。涉密論文按學(xué)校規(guī)定處理。作者簽名:日期:年月日導(dǎo)師簽名:日期:年月日摘要聚類分析是數(shù)據(jù)挖掘中一項重要的挖掘任務(wù)。所謂“物以類聚”,聚類分析從大量數(shù)據(jù)對象中尋找數(shù)據(jù)屬性間的相似性,并以此為
4、數(shù)據(jù)對象分類,從而達(dá)到和優(yōu)化大規(guī)模數(shù)據(jù)的查詢和發(fā)現(xiàn)隱含有用信息的目的。本文著重對聚類分析中應(yīng)用最廣泛的是基于劃分的聚類方法——K-means聚類方法進(jìn)行了深入地研究,并對其優(yōu)缺點進(jìn)行了分析,該算法具有思想簡單、結(jié)構(gòu)簡單、執(zhí)行效率高等優(yōu)點,但是算法也存在著對初始聚類中心敏感、容易陷入局部最優(yōu)的缺點,而這兩個缺點也是制約該算法應(yīng)用的主要原因。為了改善K-means聚類方法對初始聚類中心敏感、容易陷入局部最優(yōu)的缺點,本文采用具有全局尋優(yōu)能力和更高分類準(zhǔn)確度的改進(jìn)型粒子群算法與K-means算法相結(jié)合。其中主要研究工作包括:(1)對標(biāo)準(zhǔn)粒子群算法慣
5、性權(quán)重因子的研究。由于標(biāo)準(zhǔn)粒子群算法中粒子飛行方向與速度對慣性權(quán)重w的依賴性強(qiáng),本文提出了慣性權(quán)重改進(jìn)方案,即隨粒子群算法執(zhí)行過程動態(tài)變化的自適應(yīng)慣性權(quán)重。(2)設(shè)計了基于適應(yīng)度為基準(zhǔn)的交叉操作,這樣保證了種群中粒子的多樣性,加強(qiáng)了粒子的全局搜索能力,也加快粒子群收斂速度。提出了基于群適應(yīng)度標(biāo)準(zhǔn)差的變異操2作,變異操作通過粒子群的群體適應(yīng)度標(biāo)準(zhǔn)差?和當(dāng)前粒子理論最優(yōu)值fgbest來控制粒子的變異概率。同時,構(gòu)造了比較直觀的適應(yīng)度函數(shù)。粒子群算法中適應(yīng)度函數(shù)至關(guān)重要,特別在本文中適應(yīng)度函數(shù)不僅直接影響交叉算子對粒子的操作而且決定著變異操作,這
6、樣適應(yīng)度函數(shù)將會影響聚類中心點的優(yōu)化及聚類劃分的情況。在本文中所給出的適應(yīng)度函數(shù)主要依據(jù)類內(nèi)總的離散度,即通過類內(nèi)盡量緊湊、類間盡量松散的原則來構(gòu)建。(3)將改進(jìn)后的粒子群算法與K-means聚類算法融合。給出了把粒子群優(yōu)化算法引入到K-means算法中去的粒子的編碼方案和算法流程。通過兩種算法的結(jié)合改善K-means算法對初始聚類中心選擇敏感等問題。文章最后將基于交叉變異算子的自適應(yīng)粒子群聚類算法應(yīng)用到UCI學(xué)習(xí)型數(shù)據(jù)庫中,并通過將該文提出的聚類方法與K-means聚類算法、基于遺傳算法的聚類算法、基于粒子群算法的聚類算法作比較,從實驗結(jié)
7、果可以看出,本文中提出的聚類算法較上述三種算法擁有更好的適應(yīng)度值和分類正確率并且算法更加穩(wěn)定,因此,本文的方法改善了K-means聚類算法對初始聚類中心敏感和容易陷入局部最優(yōu)的缺陷。關(guān)鍵字:交叉變異算子;自適應(yīng)慣性權(quán)重;粒子群;K-means;聚類分析IAbstractClusteranalysisisanimportanttaskindatamining.Theso-called"featherflocktogether".Inordertooptimizequeriesandfindusefulinformationinthelarge
8、-scaledata,clusteranalysisinsearchforsimilaritiesbetweendataattributesbyclusteranalysis,a