資源描述:
《基于遺傳算法和改進(jìn)興趣度的關(guān)聯(lián)規(guī)則挖掘算法》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、-馬酵-"10603;;:::學(xué)校代碼I2010-3367'-"學(xué)號,1—'''..—,—::::r:^i::1;T-;-密級公開_:—————————UDCI鷄種捉f修GUANGXITEAC刖RSEDUCATIONUNIVERSITY碩古學(xué)位論文基于遺傳算法和改迸興趣度的關(guān)聯(lián)規(guī)則挖掘算法了heAssociationRulesMiningAlorithmBased〇打GeneticgAlorithmandanImroved
2、InterestModelgp學(xué)科專業(yè):軟件工程專業(yè)方向:數(shù)據(jù)挖擁二級學(xué)院:計(jì)算機(jī)與信息工程學(xué)院年級;2013研究生姓名:包勇導(dǎo)師姓名及職稱;黎英副教授:2016年完成日期5月巧日廣巧師落學(xué)餘碩上-學(xué)位論文C■申墻X學(xué)碩±學(xué)位j基于遺傳黨法和改進(jìn)興趣度銷關(guān)聯(lián)規(guī)麵巧搖算法TheAssociationRulesMiningA]orlthmBasedonGenetkgAlgori地mandanimprovedin化restModel?;Q;軟件I穏牽請人姓名:包
3、勇導(dǎo)師體名及職稱:黎英副敎摸答瓣委奴會譚員J簽名)主席:裹委員;、乎崎、為二〇---7^年A月摘要互聯(lián)網(wǎng)社會改變了人們的行為方式和思考方式,在這個信息社會里人類積累海量的數(shù)據(jù),如何從這些海量數(shù)據(jù)中挖掘出“黃金”知識變得越來越重要。因此,數(shù)據(jù)挖掘這門學(xué)科越來越成為社會關(guān)注的焦點(diǎn)。關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘的重要研究內(nèi)容,研究關(guān)聯(lián)規(guī)則挖掘是為了從大量的數(shù)據(jù)中找出項(xiàng)與項(xiàng)之間的相關(guān)關(guān)系。本文首先介紹了關(guān)聯(lián)規(guī)則的基本概念和有關(guān)性質(zhì),然后對關(guān)聯(lián)規(guī)則的經(jīng)典算法—apriori算法進(jìn)行了詳細(xì)的介紹,接著對數(shù)據(jù)挖掘的重要方法之一的遺傳
4、算法進(jìn)行簡要的介紹,包括遺傳算法的基本術(shù)語和運(yùn)行過程。在傳統(tǒng)支持度—置信度框架下挖掘關(guān)聯(lián)規(guī)則可能會挖掘出一些無用的甚至有誤導(dǎo)性的規(guī)則,而一些有用的關(guān)聯(lián)規(guī)則卻不一定能被挖掘出來,于是引入了興趣度來改進(jìn)傳統(tǒng)框架。興趣度表征一個規(guī)則的有趣程度,通過它可將一些無用的有誤導(dǎo)性的規(guī)則給淘汰掉。本文首先提出了一種改進(jìn)的興趣度模型,然后從理論上和實(shí)驗(yàn)兩個方面證明該興趣度模型要好于常見的興趣度模型。本文分析了遺傳算法在關(guān)聯(lián)規(guī)則挖掘中的天然優(yōu)勢,對遺傳算法挖掘關(guān)聯(lián)規(guī)則研究現(xiàn)狀和不足進(jìn)行了總結(jié),并且闡述了將遺傳算法和興趣度結(jié)合挖掘關(guān)聯(lián)規(guī)則的思想。最后將遺傳算法和本
5、文提出的改進(jìn)興趣度模型進(jìn)行結(jié)合,得到了一種新的關(guān)聯(lián)規(guī)則挖掘算法,即基于遺傳算法和改進(jìn)興趣度的關(guān)聯(lián)規(guī)則挖掘算法。通過和已經(jīng)存在的兩個關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行實(shí)驗(yàn)對比表明了本文提出的算法能更多地淘汰無趣規(guī)則,因而本文提出的算法是高效的,具有一定的應(yīng)用價(jià)值,可將其應(yīng)用到科研和實(shí)踐中。關(guān)鍵詞:IAbstractTheInternethaschangedpeople'swaysofthinkingandbehavior,inthisinformationsocietythehumanhasaccumulatedvastamountsofdata,andho
6、wtousethesedatatodigoutthe"gold"knowledgehasbecomemoreandmoreimportant.AssociationrulesisanimportantresearchcontentinthefieldofDatamining,andthereasonforresearchingtheassociationrulesistofindoutthecorrelationbetweenitemsanditemsfromalargeamountofdata.Thispaperfirstintroduce
7、sthebasicconceptsandpropertiesaboutassociationrules,andthenintroducestheapriorialgorithmindetail,aclassicalalgorithmofassociationrules,thenintroducesthegeneticalgorithmbriefly,includingthebasictermsandoperationprocessofgeneticalgorithm,whichisoneoftheimportantmethodsofdatam
8、ining.Thispaperanalyzesthattheminingmethodwhichbasedonthetraditionalframeworkwhich