資源描述:
《帶交叉變異算子的自適應(yīng)粒子群聚類算法的研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、學(xué)校代號(hào)分類號(hào)10530TP393學(xué)密號(hào)級(jí)200811041386碩士學(xué)位論文帶交叉變異算子的自適應(yīng)粒子群聚類算法的研究學(xué)位申請(qǐng)人盤俊良指導(dǎo)教師石躍祥教授學(xué)學(xué)研院科究名專方稱業(yè)向信息工程學(xué)院信號(hào)與信息處理智能信息處理與數(shù)據(jù)挖掘二○一一年五月十日StudyinadaptiveParticleSwarmOptimizationwithCrossoverandmutationoperatorCandidateSupervisorCollegeProgramSpecializat
2、ionDegreeUniversityDatePanJunLiangProfessorShiCueingCollegeofInformationEngineeringSignal&InformationProcessIntelligentProcessing&DataMiningEngineeringMasterXiangtanUniversity2011-5-10湘潭大學(xué)學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立進(jìn)行研究所取得的研究成果。除了文中特別加以標(biāo)注引用的內(nèi)容外
3、,本論文不包含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫的成果作品。對(duì)本文的研究做出重要貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。本人完全意識(shí)到本聲明的法律后果由本人承擔(dān)。作者簽名:日期:年月日學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國(guó)家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)湘潭大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。涉密論文按學(xué)校規(guī)定處理
4、。作者簽名:導(dǎo)師簽名:日期:日期:年年月月日日摘要聚類分析是數(shù)據(jù)挖掘中一項(xiàng)重要的挖掘任務(wù)。所謂“物以類聚”,聚類分析從大量數(shù)據(jù)對(duì)象中尋找數(shù)據(jù)屬性間的相似性,并以此為數(shù)據(jù)對(duì)象分類,從而達(dá)到和優(yōu)化大規(guī)模數(shù)據(jù)的查詢和發(fā)現(xiàn)隱含有用信息的目的。本文著重對(duì)聚類分析中應(yīng)用最廣泛的是基于劃分的聚類方法——K-means聚類方法進(jìn)行了深入地研究,并對(duì)其優(yōu)缺點(diǎn)進(jìn)行了分析,該算法具有思想簡(jiǎn)單、結(jié)構(gòu)簡(jiǎn)單、執(zhí)行效率高等優(yōu)點(diǎn),但是算法也存在著對(duì)初始聚類中心敏感、容易陷入局部最優(yōu)的缺點(diǎn),而這兩個(gè)缺點(diǎn)也是制約該算法應(yīng)用的
5、主要原因。為了改善K-means聚類方法對(duì)初始聚類中心敏感、容易陷入局部最優(yōu)的缺點(diǎn),本文采用具有全局尋優(yōu)能力和更高分類準(zhǔn)確度的改進(jìn)型粒子群算法與K-means算法相結(jié)合。其中主要研究工作包括:(1)對(duì)標(biāo)準(zhǔn)粒子群算法慣性權(quán)重因子的研究。由于標(biāo)準(zhǔn)粒子群算法中粒子飛行方向與速度對(duì)慣性權(quán)重w的依賴性強(qiáng),本文提出了慣性權(quán)重改進(jìn)方案,即隨粒子群算法執(zhí)行過(guò)程動(dòng)態(tài)變化的自適應(yīng)慣性權(quán)重。(2)設(shè)計(jì)了基于適應(yīng)度為基準(zhǔn)的交叉操作,這樣保證了種群中粒子的多樣性,加強(qiáng)了粒子的全局搜索能力,也加快粒子群收斂速度。提出了基于群適
6、應(yīng)度標(biāo)準(zhǔn)差的變異操作,變異操作通過(guò)粒子群的群體適應(yīng)度標(biāo)準(zhǔn)差s2和當(dāng)前粒子理論最優(yōu)值fgbest來(lái)控制粒子的變異概率。同時(shí),構(gòu)造了比較直觀的適應(yīng)度函數(shù)。粒子群算法中適應(yīng)度函數(shù)至關(guān)重要,特別在本文中適應(yīng)度函數(shù)不僅直接影響交叉算子對(duì)粒子的操作而且決定著變異操作,這樣適應(yīng)度函數(shù)將會(huì)影響聚類中心點(diǎn)的優(yōu)化及聚類劃分的情況。在本文中所給出的適應(yīng)度函數(shù)主要依據(jù)類內(nèi)總的離散度,即通過(guò)類內(nèi)盡量緊湊、類間盡量松散的原則來(lái)構(gòu)建。(3)將改進(jìn)后的粒子群算法與K-means聚類算法融合。給出了把粒子群優(yōu)化算法引入到K-mean
7、s算法中去的粒子的編碼方案和算法流程。通過(guò)兩種算法的結(jié)合改善K-means算法對(duì)初始聚類中心選擇敏感等問(wèn)題。文章最后將基于交叉變異算子的自適應(yīng)粒子群聚類算法應(yīng)用到UCI學(xué)習(xí)型數(shù)據(jù)庫(kù)中,并通過(guò)將該文提出的聚類方法與K-means聚類算法、基于遺傳算法的聚類算法、基于粒子群算法的聚類算法作比較,從實(shí)驗(yàn)結(jié)果可以看出,本文中提出的聚類算法較上述三種算法擁有更好的適應(yīng)度值和分類正確率并且算法更加穩(wěn)定,因此,本文的方法改善了K-means聚類算法對(duì)初始聚類中心敏感和容易陷入局部最優(yōu)的缺陷。關(guān)鍵字:交叉變異算子;
8、自適應(yīng)慣性權(quán)重;粒子群;K-means;聚類分析IAbstractClusteranalysisisanimportanttaskindatamining.Theso-called"featherflocktogether".Inordertooptimizequeriesandfindusefulinformationinthelarge-scaledata,clusteranalysisinsearchforsimilaritiesbetweendataattri