數(shù)據(jù)挖掘中常用關(guān)聯(lián)規(guī)則挖掘算法

數(shù)據(jù)挖掘中常用關(guān)聯(lián)規(guī)則挖掘算法

ID:5294659

大?。?35.69 KB

頁(yè)數(shù):4頁(yè)

時(shí)間:2017-12-07

數(shù)據(jù)挖掘中常用關(guān)聯(lián)規(guī)則挖掘算法_第1頁(yè)
數(shù)據(jù)挖掘中常用關(guān)聯(lián)規(guī)則挖掘算法_第2頁(yè)
數(shù)據(jù)挖掘中常用關(guān)聯(lián)規(guī)則挖掘算法_第3頁(yè)
數(shù)據(jù)挖掘中常用關(guān)聯(lián)規(guī)則挖掘算法_第4頁(yè)
資源描述:

《數(shù)據(jù)挖掘中常用關(guān)聯(lián)規(guī)則挖掘算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。

1、第2。期計(jì)算機(jī)技術(shù)與發(fā)展V01.2ONo.42010年4月COⅣI丌RTEa閹10GYANDDEVEU]l’MENTApr.2010數(shù)據(jù)挖掘中常用關(guān)聯(lián)規(guī)則挖掘算法王愛平,王占鳳,陶嗣干,燕飛飛(安徽大學(xué)計(jì)算智能與信號(hào)處理教育部重點(diǎn)實(shí)驗(yàn)室,安徽合肥230039)摘要:文中首先介紹了數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的經(jīng)典算法——A州算法。再?gòu)膶挾取⑸疃?、劃分、采樣、增量式更新等幾個(gè)角度對(duì)關(guān)聯(lián)規(guī)則挖掘進(jìn)行了分類討論。然后運(yùn)用文獻(xiàn)查詢和比較分析的方法對(duì)常見的關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行了概述,主要包括FP—growth算法、DHP算法、Partition

2、算法、兀JP算法、CD算法等算法。最后對(duì)關(guān)聯(lián)規(guī)則挖掘的發(fā)展遠(yuǎn)景進(jìn)行了展望。關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;頻繁項(xiàng)集;挖掘算法中圖分類號(hào):TP311文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1673—629X(2010)04—0105—04CommonAlgorithmsofAssociationRulesMininginDataMiningWANGAi.ping,WANGZhan-feng,TAOSi.gan,YANFei—fei(MinistryofEducationKeyLaboratoryofInteligentComputing&Si1a

3、1Processing,AnhuiUniversity,I-hfei230039,China)A:rStintroducestheclassicalalgorithmofassociationrulemining—Apriori.Thenclassifieddiscussestheassociationruleminingfromseveralanglessuchaswidth,depth,partition,samplingandi~mnentalupdating.ItslmfⅡnazestheo01rnmo~algori

4、thmsofassocia·tionrulenn.mgtJghqueryingdoctmaentsandcomparativeanalysis.ItmainlyincludesFP—Growth~onthm,DHPalgorithm,Patti-tionalgorithm。FUPalgorithm,CDalgorithmand80on.Atlastprospecttheassociationrulemining.Keymints:datamining;associationrule;frequentitemsets;mini

5、ng~gorithmO引言法,其中以Agawal提出的Apri~算法[】最為著名,大數(shù)據(jù)挖掘(DataMining),又稱數(shù)據(jù)庫(kù)中的知識(shí)發(fā)多數(shù)挖掘算法都是建立在Apriori算法基礎(chǔ)之上,但是現(xiàn)(KnowledgeDiscoveryinDatabase),是從大量的、不Apriori算法無(wú)論在時(shí)間效率還是空間伸縮性上都面完整的、有噪聲的、模糊的、隨機(jī)的大型數(shù)據(jù)中提取隱臨著挑戰(zhàn),因此研究人員探索出很多新的挖掘方法,并含在其中的、人們事先未知的、具有潛在價(jià)值的信息和拓展了關(guān)聯(lián)規(guī)則概念及應(yīng)用范圍。知識(shí)的過(guò)程_1J。簡(jiǎn)單的說(shuō),數(shù)據(jù)挖

6、掘就是從大量數(shù)據(jù)中提取或“挖掘”出人們有用的知識(shí)。面對(duì)當(dāng)前“海量1關(guān)聯(lián)規(guī)則的基本概念數(shù)據(jù),微量信息”的現(xiàn)狀,數(shù)據(jù)挖掘的重要研究分支設(shè)集合J={i1,i2,?,i},其中ik(k=1,2,?,——關(guān)聯(lián)規(guī)則,作為一種高級(jí)和智能的數(shù)據(jù)處理和分m)表示項(xiàng)。如果xcj,集合x被稱為項(xiàng)集。當(dāng)lx析技術(shù)的研究正方興未艾。I=k,則X被稱為k一項(xiàng)集。事務(wù)二元組T=(tid,X),通過(guò)關(guān)聯(lián)規(guī)則挖掘,可以得到隱含于海量數(shù)據(jù)中tid是事務(wù)唯一的標(biāo)識(shí)符稱為事務(wù)號(hào)。數(shù)據(jù)集D={t1,具有潛在價(jià)值的有用信息。關(guān)聯(lián)規(guī)則的目標(biāo)是以有效t2,?,t}是由t1

7、,t2,?,t事務(wù)組成的集合。的方式提取最有趣的模式。關(guān)聯(lián)規(guī)則可以描述為:形如AB的蘊(yùn)涵式,其中迄今為止已提出了許多高效的關(guān)聯(lián)規(guī)則挖掘算AJ,BcJ,并且AnB=。項(xiàng)集X的支持度s是D中包含X的事務(wù)數(shù)占所有事務(wù)數(shù)的百分比,記為(x)=戶(x):。項(xiàng)集x的置信度f(wàn)是D中同收稿日期:2009—08—15;修回日期:2009一Il一21基金項(xiàng)目:國(guó)家自然科學(xué)基金項(xiàng)目(60472065)時(shí)包含xUy的事務(wù)數(shù)占包含x的所有事務(wù)數(shù)的百作者簡(jiǎn)介:王愛平(1956一),女,甘肅慶陽(yáng)人,教授,從事計(jì)算機(jī)教學(xué)分比,記為f(x)=P(XIy)=。

8、至于與研究?!?06·計(jì)算機(jī)技術(shù)與發(fā)展第20卷最小支持度minsup和最小置信度mineonf都是由用戶,由連接得到候選k一項(xiàng)集,直到?jīng)]有新的候所給定,如果項(xiàng)集x的sup(X)>minsup,那么項(xiàng)集X選集產(chǎn)生為止。被稱為頻繁項(xiàng)集,其中生成的關(guān)聯(lián)規(guī)則中所有支持度Apriori算法需掃描數(shù)據(jù)

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。