資源描述:
《基于關(guān)聯(lián)規(guī)則算法的研究與改進(jìn)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、學(xué)校代號(hào):10532學(xué)號(hào):G10065294密級(jí):湖南大學(xué)工程碩士學(xué)位論文基于關(guān)聯(lián)規(guī)則算法的研究與改進(jìn)堂僮蟲(chóng)遣厶姓名;塑王穗昱啞姓名壁驅(qū)猛;邳適j匕數(shù)援衄夏王直級(jí)王猩短墻差望僮i泅直太堂筮』生堂院童些名鹽;筮住工程詮?fù)嵬科冢?Q13:!!:Q2詮室筌避目期;2Q13:12:Q!筌辯委雖會(huì)圭廑;塞4嵐掛塾援ResearchandImproVementofAssociationRulesAlgorithmbyDENGZisuiB.E.(XiangtanUniVersity)2005Athesissubmittedinpanialsatisfactio
2、noftherequirementsf.orthedegreeofMasterofEngineeringlnSoRwareengineeringintheGraduateschoolofHunanUniversitySuperVisorProfessor,DENGYuan曲eiSeniorEngineerHEWanpingNovember,2013湖南大學(xué)學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立進(jìn)行研究所取得的研究成果。除了文中特別加以標(biāo)注引用的內(nèi)容外,本論文不包含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫(xiě)的成果作品。對(duì)本文的研究做
3、出重要貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。本人完全意識(shí)到本聲明的法律后果由本人承擔(dān)。作者繇可吼嗍洲"月夸日學(xué)位論文版權(quán)使用授權(quán)書(shū)本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國(guó)家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)湖南大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。本學(xué)位論文屬于1.保密口,在年解密后適用本授權(quán)書(shū)。2.不保密曰。(請(qǐng)?jiān)谝陨舷鄳?yīng)方框內(nèi)打”√”)作者簽糾7步雙吼川弓年,2月?tīng)?zhēng)日導(dǎo)師緲日期:》『;年,上月手
4、日知野工程碩士學(xué)位論文摘要計(jì)算機(jī)技術(shù)的發(fā)展及新的理論、模型及算法的出現(xiàn)使得數(shù)據(jù)挖掘成為信息技術(shù)的熱門研究領(lǐng)域之一,關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘中重要的研究分支,在很多方面目前已經(jīng)取得了豐碩的成果,但是海量數(shù)據(jù)及大型數(shù)據(jù)庫(kù)的出現(xiàn),對(duì)關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘提出了新的挑戰(zhàn)與要求,迫切需要提高關(guān)聯(lián)規(guī)則挖掘的效率、精確性等。本文主要針對(duì)關(guān)聯(lián)規(guī)則的算法作了一些探索性的研究,首先簡(jiǎn)要地介紹了數(shù)據(jù)挖掘技術(shù)的發(fā)展,闡述了數(shù)據(jù)挖掘和關(guān)聯(lián)規(guī)則的概念、數(shù)據(jù)挖掘的領(lǐng)域及現(xiàn)階段存在的問(wèn)題,接著對(duì)關(guān)聯(lián)規(guī)則的種類與常用的算法作了簡(jiǎn)單的介紹,對(duì)關(guān)聯(lián)規(guī)則Apriori算法及FPgro叭h算法及Parr
5、tition算法作了簡(jiǎn)要的性能分析與比較,然后按照數(shù)值型關(guān)聯(lián)規(guī)則的挖掘技術(shù)多以及多層次的關(guān)聯(lián)規(guī)則、頻繁項(xiàng)集挖掘規(guī)則等幾個(gè)熱點(diǎn)研究方向,對(duì)多層次關(guān)聯(lián)規(guī)則、頻繁項(xiàng)集挖掘規(guī)則算法作了分析與評(píng)述。最后本文對(duì)基于用戶興趣度的關(guān)聯(lián)規(guī)則進(jìn)行了分析,對(duì)興趣度度量的方法進(jìn)行了剖析與比較,并提出了改進(jìn)后的算法。本文對(duì)關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘中算法的的效率問(wèn)題作了大篇幅的闡述,緊緊依靠這一中心命題提出一系列的算法。基于數(shù)據(jù)挖掘任務(wù)的復(fù)雜多樣性及算法應(yīng)用領(lǐng)域的單一性,所以提出單一的算法而解決全部的數(shù)據(jù)挖掘問(wèn)題是不可能的,更進(jìn)一步的是,在同一應(yīng)用領(lǐng)域也有不同側(cè)重點(diǎn)的算法。關(guān)聯(lián)規(guī)則挖掘
6、算法的設(shè)計(jì)問(wèn)題及效率問(wèn)題是本文探討、研究的最重要的方面。本文重點(diǎn)是對(duì)基于用戶興趣度的關(guān)聯(lián)規(guī)則進(jìn)行了闡述,對(duì)興趣度度量的方法:基于信息量的興趣度度量、基于概率相關(guān)性的興趣度度量、綜合的興趣度度量進(jìn)行詳細(xì)的分析,提出了改進(jìn)的算法Bit.interest,對(duì)算法的定義、格式、代碼進(jìn)行了闡述,并舉例驗(yàn)證,加以性能分析與結(jié)果分析。關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;用戶興趣度;頻繁項(xiàng)集挖掘基于關(guān)聯(lián)規(guī)則算法的研究與改進(jìn)AbstractDatamininghasbecomeoneofthehotresearchfieldininfomationtechn0109y,也et
7、endencyisbasedonthedeVelopmentofcomputertechnology,theappearanceofnewtheorythemodelandthelike。algorithmoftheassociationrulesisanimportantresearchbranchofdatamining,manyflmitmlresuItsaboutithasbeenachieVed,butthedeVelopmentofmassofdataandtheemergenceoflargedatabasesissofastthatt
8、oimproVetheefnciencyandaccuracyofminingassociationrule