資源描述:
《基于遺傳算法和改進(jìn)興趣度的關(guān)聯(lián)規(guī)則挖掘算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、-馬酵-"10603;;:::學(xué)校代碼I2010-3367'-"學(xué)號(hào),1—'''..—,—::::r:^i::1;T-;-密級(jí)公開(kāi)_:—————————UDCI鷄種捉f修GUANGXITEAC刖RSEDUCATIONUNIVERSITY碩古學(xué)位論文基于遺傳算法和改迸興趣度的關(guān)聯(lián)規(guī)則挖掘算法了heAssociationRulesMiningAlorithmBased〇打GeneticgAlorithmandanImroved
2、InterestModelgp學(xué)科專(zhuān)業(yè):軟件工程專(zhuān)業(yè)方向:數(shù)據(jù)挖擁二級(jí)學(xué)院:計(jì)算機(jī)與信息工程學(xué)院年級(jí);2013研究生姓名:包勇導(dǎo)師姓名及職稱(chēng);黎英副教授:2016年完成日期5月巧日廣巧師落學(xué)餘碩上-學(xué)位論文C■申墻X學(xué)碩±學(xué)位j基于遺傳黨法和改進(jìn)興趣度銷(xiāo)關(guān)聯(lián)規(guī)麵巧搖算法TheAssociationRulesMiningA]orlthmBasedonGenetkgAlgori地mandanimprovedin化restModel專(zhuān)化名稱(chēng);軟件I穏牽請(qǐng)人姓名:包
3、勇導(dǎo)師體名及職稱(chēng):黎英副敎摸答瓣委奴會(huì)譚員J簽名)主席:裹委員;、乎崎、為二〇---7^年A月摘要互聯(lián)網(wǎng)社會(huì)改變了人們的行為方式和思考方式,在這個(gè)信息社會(huì)里人類(lèi)積累海量的數(shù)據(jù),如何從這些海量數(shù)據(jù)中挖掘出“黃金”知識(shí)變得越來(lái)越重要。因此,數(shù)據(jù)挖掘這門(mén)學(xué)科越來(lái)越成為社會(huì)關(guān)注的焦點(diǎn)。關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘的重要研究?jī)?nèi)容,研究關(guān)聯(lián)規(guī)則挖掘是為了從大量的數(shù)據(jù)中找出項(xiàng)與項(xiàng)之間的相關(guān)關(guān)系。本文首先介紹了關(guān)聯(lián)規(guī)則的基本概念和有關(guān)性質(zhì),然后對(duì)關(guān)聯(lián)規(guī)則的經(jīng)典算法—apriori算法進(jìn)行了詳細(xì)的介紹,接著對(duì)數(shù)據(jù)挖掘的重要方法之一的遺傳
4、算法進(jìn)行簡(jiǎn)要的介紹,包括遺傳算法的基本術(shù)語(yǔ)和運(yùn)行過(guò)程。在傳統(tǒng)支持度—置信度框架下挖掘關(guān)聯(lián)規(guī)則可能會(huì)挖掘出一些無(wú)用的甚至有誤導(dǎo)性的規(guī)則,而一些有用的關(guān)聯(lián)規(guī)則卻不一定能被挖掘出來(lái),于是引入了興趣度來(lái)改進(jìn)傳統(tǒng)框架。興趣度表征一個(gè)規(guī)則的有趣程度,通過(guò)它可將一些無(wú)用的有誤導(dǎo)性的規(guī)則給淘汰掉。本文首先提出了一種改進(jìn)的興趣度模型,然后從理論上和實(shí)驗(yàn)兩個(gè)方面證明該興趣度模型要好于常見(jiàn)的興趣度模型。本文分析了遺傳算法在關(guān)聯(lián)規(guī)則挖掘中的天然優(yōu)勢(shì),對(duì)遺傳算法挖掘關(guān)聯(lián)規(guī)則研究現(xiàn)狀和不足進(jìn)行了總結(jié),并且闡述了將遺傳算法和興趣度結(jié)合挖掘關(guān)聯(lián)規(guī)則的思想。最后將遺傳算法和本
5、文提出的改進(jìn)興趣度模型進(jìn)行結(jié)合,得到了一種新的關(guān)聯(lián)規(guī)則挖掘算法,即基于遺傳算法和改進(jìn)興趣度的關(guān)聯(lián)規(guī)則挖掘算法。通過(guò)和已經(jīng)存在的兩個(gè)關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行實(shí)驗(yàn)對(duì)比表明了本文提出的算法能更多地淘汰無(wú)趣規(guī)則,因而本文提出的算法是高效的,具有一定的應(yīng)用價(jià)值,可將其應(yīng)用到科研和實(shí)踐中。關(guān)鍵詞:IAbstractTheInternethaschangedpeople'swaysofthinkingandbehavior,inthisinformationsocietythehumanhasaccumulatedvastamountsofdata,andho
6、wtousethesedatatodigoutthe"gold"knowledgehasbecomemoreandmoreimportant.AssociationrulesisanimportantresearchcontentinthefieldofDatamining,andthereasonforresearchingtheassociationrulesistofindoutthecorrelationbetweenitemsanditemsfromalargeamountofdata.Thispaperfirstintroduce
7、sthebasicconceptsandpropertiesaboutassociationrules,andthenintroducestheapriorialgorithmindetail,aclassicalalgorithmofassociationrules,thenintroducesthegeneticalgorithmbriefly,includingthebasictermsandoperationprocessofgeneticalgorithm,whichisoneoftheimportantmethodsofdatam
8、ining.Thispaperanalyzesthattheminingmethodwhichbasedonthetraditionalframeworkwhich