基于關(guān)聯(lián)規(guī)則挖掘的分類算法研究

基于關(guān)聯(lián)規(guī)則挖掘的分類算法研究

ID:33184687

大?。?12.10 KB

頁數(shù):54頁

時間:2019-02-21

基于關(guān)聯(lián)規(guī)則挖掘的分類算法研究_第1頁
基于關(guān)聯(lián)規(guī)則挖掘的分類算法研究_第2頁
基于關(guān)聯(lián)規(guī)則挖掘的分類算法研究_第3頁
基于關(guān)聯(lián)規(guī)則挖掘的分類算法研究_第4頁
基于關(guān)聯(lián)規(guī)則挖掘的分類算法研究_第5頁
資源描述:

《基于關(guān)聯(lián)規(guī)則挖掘的分類算法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、論文題目:基于關(guān)聯(lián)規(guī)則挖掘的分類算法研究專業(yè):計算機應(yīng)用技術(shù)碩士生:許立莎(簽名)指導(dǎo)教師:楊君銳(簽名)摘要隨著社會信息化的高速發(fā)展,數(shù)據(jù)挖掘技術(shù)在各領(lǐng)域的重要作用日益凸顯出來。分類是數(shù)據(jù)挖掘領(lǐng)域的一種重要分析手段,而關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘領(lǐng)域的一個重要研究方向,兩者作為數(shù)據(jù)挖掘中兩個高度活躍的研究領(lǐng)域,有著一定的相似性—挖掘關(guān)聯(lián)性強的項目集。由此以來,將這兩項重要技術(shù)組合在一起,即把關(guān)聯(lián)規(guī)則挖掘用于分類任務(wù),便開啟了數(shù)據(jù)分類的新征程—關(guān)聯(lián)分類。關(guān)聯(lián)分類實質(zhì)上就是基于關(guān)聯(lián)規(guī)則的分類,它既反映了知識的應(yīng)用特點—分類或預(yù)測,又體現(xiàn)了知識內(nèi)在的關(guān)聯(lián)特性。各關(guān)聯(lián)分類方法之間的不同之處主要體現(xiàn)在

2、兩個方面:挖掘頻繁項集所用的方法和如何分析挖掘出的規(guī)則并將其用于分類。本文在分析與比較現(xiàn)有關(guān)聯(lián)分類算法的優(yōu)勢和不足的基礎(chǔ)上,提出了一種基于P-Trie樹的關(guān)聯(lián)分類算法CARPT。算法使用垂直數(shù)據(jù)格式來壓縮存儲原始數(shù)據(jù)庫,在減少數(shù)據(jù)庫掃描次數(shù)的同時,方便支持?jǐn)?shù)計數(shù),從而提高算法效率;算法把頻繁項集視為字符串,采用P-Trie樹來存儲頻繁信息,然后挖掘分類關(guān)聯(lián)規(guī)則,另外,其在P-Trie樹構(gòu)造過程中加入對頻繁項類別標(biāo)簽支持?jǐn)?shù)的計數(shù),使其能直接去除不能生成頻繁規(guī)則的頻繁項目,相當(dāng)于對P-Trie樹的預(yù)剪枝,可有效減少P-Trie樹的節(jié)點數(shù)目,進而減少挖掘過程的遍歷時間。實驗結(jié)果表明,該算法的分

3、類準(zhǔn)確率和算法效率相對CBA和CMAR算法有所提高,算法克服了CMAR算法中存在冗余節(jié)點的不足,明顯節(jié)省了內(nèi)存空間。因此,該算法是有效可行的。關(guān)鍵詞:;數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則挖掘;分類算法;關(guān)聯(lián)分類;P-Trie樹研究類型:理論研究Subject:ResearchofClassificationAlgorithmBasedonAssociationRuleMiningSpecialty:ComputerApplicationTechnologyName:XuLisha(Signature)Instructor:YangJunrui(Signature)ABSTRACTWiththerapid

4、developmentofinformationsociety,theimportanceofdatamininginallfieldsismoreandmoreprominent.Intheareaofdatamining,classificationisanimportantanalyticalmethod,andassociationruleminingisanimportantresearchdirection.Astheyaretwohighlyactiveresearchareasindatamining,theyhavesimilaritiesinminingitemset

5、swithstrongrelevance.Therefore,thecombinationofthetwotechniquesthatapplyminingassociationrulesinthetaskofclassificationopensanewjourneyfordataclassification-associativeclassification.Associativeclassificationisessentialclassificationbasedonassociationrules,whichnotonlyreflectstheapplicationcharac

6、teristicsofknowledge-classificationandprediction,butalsoembodiestheinherentassociatedcharacteristicsofknowledge.Thedifferencesbetweentheassociativeclassificationmethodsaremainlyreflectedintwoaspects:themethodusedinminingfrequentitemsetsandanalyzingtheminedrulesforclassification.Onthebaseofanalyzi

7、ngandcomparingbothstrengthsandweaknessesoftheexistingassociativeclassificationalgorithm,thispaperpresentsanassociativeclassificationalgorithmbasedonP-Trietree,namedCARPT.Thisalgorithmusesaverticaldataformattocompressan

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。