基于BDIF的關(guān)聯(lián)規(guī)則挖掘算法研究-論文.pdf

基于BDIF的關(guān)聯(lián)規(guī)則挖掘算法研究-論文.pdf

ID:53028235

大小:192.75 KB

頁數(shù):3頁

時間:2020-04-14

基于BDIF的關(guān)聯(lián)規(guī)則挖掘算法研究-論文.pdf_第1頁
基于BDIF的關(guān)聯(lián)規(guī)則挖掘算法研究-論文.pdf_第2頁
基于BDIF的關(guān)聯(lián)規(guī)則挖掘算法研究-論文.pdf_第3頁
資源描述:

《基于BDIF的關(guān)聯(lián)規(guī)則挖掘算法研究-論文.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、第37卷第2期唐山師范學(xué)院學(xué)報2015年3月)1.37No.2JournalofTangshanNormalUniversityMar2015基于BDIF的關(guān)聯(lián)規(guī)則挖掘算法研究郭昌建(合肥學(xué)院計算機科學(xué)與技術(shù)系,安徽合肥230601)摘要:闡述了關(guān)聯(lián)規(guī)則挖掘的研究情況,關(guān)聯(lián)規(guī)則的分類方法等,對經(jīng)典Apriori算法進行了分析和評價,在此基礎(chǔ)上提出了一種高效產(chǎn)生頻繁集的BDIF(BasedTransactionalDatabasesIncludingFrequentItemSet)算法;它通過劃分數(shù)據(jù)塊,快速的搜尋頻繁項目集,從而減少對數(shù)據(jù)塊的掃描次數(shù),提

2、高了算法的效率并用BorlandC++Builder6.0開發(fā)環(huán)境來調(diào)試、驗證該算法關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;BDIF中圖分類號:TP391.1文獻標(biāo)識碼:A文章編號:1009.9115(2015)02—0042—03D0I:1O.3969~.issn.1009—9115.2015.02.013OntheMiningAlgorithmBasedonBDIFAssoeiationRuleGUOChang-jian(DepartmentofComputerScienceandTechnology,HefeiUniversity,Hefei230601,Ch

3、ina)Abstract:ThisarticledescribesresearchonassociationruleminingandClassificationmethodsofassociationrules,analyzesandevaluatestheclassicApriorialgorithm,whichgivesrisetoaneficientfrequentBDIF(BasedTransactionalDatabasesIncludingFrequentItemSet)algorithm.Ittherebyreducesscanningd

4、atablockandimprovesalgorithmeficiencybydividingdatablockandquicklysearchingforfrequentitemset.KeyWords:datamining;associationrules;basedtransactionaldatabasesincludingfrequentitemset隨著經(jīng)濟的發(fā)展和信息的增長,許多企業(yè)和組織積的研究人員對關(guān)聯(lián)規(guī)則的挖掘問題進行了大量的研究。累了大量的數(shù)據(jù),隱含在數(shù)據(jù)中的關(guān)聯(lián)規(guī)則、模式等知包括對關(guān)聯(lián)規(guī)則挖掘的理論探索、原有的算法的改進和識是對決

5、策有幫助的信息。數(shù)據(jù)挖掘的目的就是發(fā)現(xiàn)隱新算法的設(shè)計、并行關(guān)聯(lián)規(guī)則挖掘等問題【2]。含在數(shù)據(jù)中對決策有幫助的信息,它是實現(xiàn)智能決策支1.1關(guān)聯(lián)規(guī)則的基本概念持系統(tǒng)的一個重要手段。數(shù)據(jù)挖掘是從大量的、不完全設(shè)I={il,..,i}是二進制文字的集合,其中的元的、有噪聲的、模糊的、隨機的數(shù)據(jù)集中識別有效的、素稱為項(item),其中(k=-I,2?.,m)可以是購物籃新穎的、潛在有用的,以及最終可理解的模式的非平凡中的物品,也可以是保險公司的顧客。設(shè)任務(wù)相關(guān)的數(shù)過程”。據(jù)D是事務(wù)集(DB),其中每個事務(wù)是項集,使得l關(guān)聯(lián)規(guī)則挖掘綜述T_cl。這里沒有考慮事務(wù)

6、中項的數(shù)量,也就是說項是山關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘中最活躍的研究方法之一個二進制的變量來表示它是否在事務(wù)中出現(xiàn)。每個事一。關(guān)聯(lián)規(guī)則是發(fā)現(xiàn)交易數(shù)據(jù)庫中不同商品(項)之間務(wù)都有一個相關(guān)的標(biāo)識符或TID。(設(shè)是‘個項集,的聯(lián)系,這些規(guī)則找出顧客購買行為模式,如購買了某且)關(guān)聯(lián)規(guī)則是如下形式的邏輯蘊涵:==>口,At1,一商品對購買其他商品的影響。發(fā)現(xiàn)這樣的規(guī)則可以應(yīng)Bd,且n=。關(guān)聯(lián)規(guī)則具有支持度和置信度兩個用于商品貨架設(shè)計、貨存安排以及根據(jù)購買模式對用戶重要的屬性L3J。進行分類。最早是由Agrawal等人提出的。之后有諸多1.2關(guān)聯(lián)規(guī)則的分類基金項目:合肥學(xué)

7、院重點建設(shè)學(xué)科(2014xk08)收稿日期:2014.09.02作者簡介:郭昌建(1965.),男,安徽合肥人,碩士,副教授,研究方向為計算機網(wǎng)絡(luò)、人工智能。.42.郭昌建:基于BDIF的關(guān)聯(lián)規(guī)則挖掘算法研究關(guān)聯(lián)規(guī)則按不同情況可分為:(1)基于規(guī)則中處理開始計)。根據(jù)該順序,排列相應(yīng)的事務(wù)集Txl。的變量的類別:關(guān)聯(lián)規(guī)則可分為布爾型和數(shù)值型;(2)3.1.2搜尋包含最大頻繁項集的事務(wù)集基于規(guī)則中數(shù)據(jù)的抽象層次:可以分為單層關(guān)聯(lián)規(guī)則和經(jīng)過第一步后,利用以上推論,掃描包含頻繁1一多層關(guān)聯(lián)規(guī)則;(3)基于規(guī)則中涉及到的數(shù)據(jù)的維數(shù):項集的事務(wù)集Txl。若P為數(shù)據(jù)

8、庫D中的項目數(shù),為避關(guān)聯(lián)規(guī)則可分為單維的和多維的l4】。免重復(fù)產(chǎn)生相同的事務(wù)集,

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。