Apriori算法改進(jìn)及其實現(xiàn)

Apriori算法改進(jìn)及其實現(xiàn)

ID:39869676

大?。?33.65 KB

頁數(shù):26頁

時間:2019-07-13

Apriori算法改進(jìn)及其實現(xiàn)_第1頁
Apriori算法改進(jìn)及其實現(xiàn)_第2頁
Apriori算法改進(jìn)及其實現(xiàn)_第3頁
Apriori算法改進(jìn)及其實現(xiàn)_第4頁
Apriori算法改進(jìn)及其實現(xiàn)_第5頁
資源描述:

《Apriori算法改進(jìn)及其實現(xiàn)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、Apriori算法改進(jìn)及其實現(xiàn)內(nèi)容摘要信息技術(shù)的不斷推廣應(yīng)用,將企業(yè)帶入了一個信息爆炸的時代。如何充分利用這些數(shù)據(jù)信息為企業(yè)決策者提供決策支持成為一個十分迫切的又棘手的問題,人們除了利用現(xiàn)有的關(guān)系數(shù)據(jù)庫標(biāo)準(zhǔn)查詢語句得到一般的直觀的信息以外,必須挖掘其內(nèi)含的、未知的卻又實際存在的數(shù)據(jù)關(guān)系。著名的Apriori算法是一種挖掘關(guān)聯(lián)規(guī)則的算法。本文通過對參與候選集的元素計數(shù)的方法來減少產(chǎn)生候選集的組合和減少數(shù)據(jù)庫的掃描次數(shù)來達(dá)到要求。這有利于提高挖掘的速度和減少數(shù)據(jù)庫的I/O操作時間的開銷。關(guān)鍵字:數(shù)據(jù)挖掘,關(guān)聯(lián)規(guī)則,Apriori算法AprioriAlgorithmAndImprov

2、edAprioriAlgorithmAbstract:AninformationburstageiscomingwiththevariousapplicationofInformationtechnology.Howtomaximizetheinformationisaveryimportantproblemforthedecision-makerofthecompanies.BesidesgettingtheregularinformationfromtheDatabasebySQL-query,peoplestillneedtominethedatarelationwhic

3、hisunclearbutreallyexists.Associationrulesisoneofthedataminingmethods,thefamousalgorithmAprioriisamethod,whichcanbeusedtosolutethoseproblems.ThisarticleanalyzesandstudiestheimprovedalgorithmAprioribasedonthealgorithmofminingassociationrulesApriori.Themainideaistodecreasethenumberofcandidatei

4、temsandtodecreasethetimesofDatabasescanning.Thesolutionisavailable.Itupgradesthespeedofdatamininganddecreasescomputer'sI/Ooperation.It'sprovedtobemoreefficientthanthetraditionalKeywords:Datamining,associationrules,Apriorialgorithm,目錄1數(shù)據(jù)挖掘-1-1.1技術(shù)上的定義及含義-1-1.2商業(yè)角度的定義-2-1.3數(shù)據(jù)挖掘與傳統(tǒng)分析方法的區(qū)別-2-1.4

5、數(shù)據(jù)挖掘不能干什么-3-2數(shù)據(jù)挖掘的幾種主要形式:-3-2.1:規(guī)則挖掘:-3-2.2聚類分析:-4-3關(guān)于關(guān)聯(lián)規(guī)則的討論-4-3.1購物籃分析-4-3.2關(guān)聯(lián)規(guī)則基本問題描述-4-3.3關(guān)聯(lián)規(guī)則挖掘舉例-6-3.4關(guān)聯(lián)規(guī)則問題的分解-8-4Apriori算法的描述-8-4.1Apriori算法的說明-8-4.2Apriori算法的描述-9-4.3Apriori算法的舉例-11-5一種Apriori的改進(jìn)算法-14-5.1算法產(chǎn)生的思路-14-5.2算法的圖例說明-15-5.3本算法的評價:-15-附錄1程序運行圖示-18-附錄2程序代碼-20-陜西理工學(xué)院數(shù)學(xué)與計算機(jī)科學(xué)系開

6、放性實驗結(jié)題報告1數(shù)據(jù)挖掘1.1技術(shù)上的定義及含義  數(shù)據(jù)挖掘(DataMining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。與數(shù)據(jù)挖掘相近的同義詞有數(shù)據(jù)融合、數(shù)據(jù)分析和決策支持等。這個定義包括好幾層含義:數(shù)據(jù)源必須是真實的、大量的、含噪聲的;發(fā)現(xiàn)的是用戶感興趣的知識;發(fā)現(xiàn)的知識要可接受、可理解、可運用;并不要求發(fā)現(xiàn)放之四海皆準(zhǔn)的知識,僅支持特定的發(fā)現(xiàn)問題。  ----何為知識?從廣義上理解,數(shù)據(jù)、信息也是知識的表現(xiàn)形式,但是人們更把概念、規(guī)則、模式、規(guī)律和約束等看作知識。人們把數(shù)據(jù)看

7、作是形成知識的源泉,好像從礦石中采礦或淘金一樣。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系數(shù)據(jù)庫中的數(shù)據(jù);也可以是半結(jié)構(gòu)化的,如文本、圖形和圖像數(shù)據(jù);甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識的方法可以是數(shù)學(xué)的,也可以是非數(shù)學(xué)的;可以是演繹的,也可以是歸納的。發(fā)現(xiàn)的知識可以被用于信息管理,查詢優(yōu)化,決策支持和過程控制等,還可以用于數(shù)據(jù)自身的維護(hù)。因此,數(shù)據(jù)挖掘是一門交叉學(xué)科,它把人們對數(shù)據(jù)的應(yīng)用從低層次的簡單查詢,提升到從數(shù)據(jù)中挖掘知識,提供決策支持。在這種需求牽引下,匯聚了不同領(lǐng)域的研究者,尤其是數(shù)據(jù)庫

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。