一種apriori的改進(jìn)算法

一種apriori的改進(jìn)算法

ID:33157714

大小:752.16 KB

頁(yè)數(shù):40頁(yè)

時(shí)間:2019-02-21

一種apriori的改進(jìn)算法_第1頁(yè)
一種apriori的改進(jìn)算法_第2頁(yè)
一種apriori的改進(jìn)算法_第3頁(yè)
一種apriori的改進(jìn)算法_第4頁(yè)
一種apriori的改進(jìn)算法_第5頁(yè)
資源描述:

《一種apriori的改進(jìn)算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、浙江大學(xué)碩士學(xué)位論文一種Apriori的改進(jìn)算法姓名:莊代波申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):計(jì)算數(shù)學(xué)指導(dǎo)教師:王興華20030601致謝爭(zhēng)s‰1本人在三年的碩士求學(xué)過(guò)程中,得到了導(dǎo)師王興華老師的悉心指導(dǎo)和無(wú)私傳授知識(shí),終得以完成學(xué)業(yè)。尤其是本人在本文的整個(gè)寫(xiě)作過(guò)程得到了他的熱心指導(dǎo),給我提出了許多寶貴的、實(shí)用的建議,使得我得以順利地完成。真心并誠(chéng)摯地感謝他的關(guān)心和幫助。感謝本系全體的老師,他們是韓丹夫、吳慶標(biāo)、鄭士明、江金生、黃正達(dá)等,是他們無(wú)私地傳授了許多知識(shí)和經(jīng)驗(yàn)給了我,同時(shí)也感謝我單位的領(lǐng)導(dǎo)和同事王何宇給予我的鼓勵(lì)和幫助。莊

2、代波2003.6本文摘要信息技術(shù)的不斷推廣應(yīng)用,將企業(yè)帶入了一個(gè)信息爆炸的時(shí)代。如何充分利用這些數(shù)據(jù)信息為企業(yè)決策者提供決策支持成為一個(gè)十分迫切的又棘手的問(wèn)題,人們除了利用現(xiàn)有的關(guān)系數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)查詢語(yǔ)句得到一般的直觀的信息以外,必須挖掘其內(nèi)含的、未知的卻又實(shí)際存在的數(shù)據(jù)關(guān)系。相似序列地挖掘和關(guān)聯(lián)規(guī)則的挖掘是其中之二種數(shù)據(jù)挖掘的類型。著名的Apriori算法是一種挖掘關(guān)聯(lián)規(guī)則的算法。本文在相似序列的度量上提出一個(gè)用“生態(tài)位相似度量”的度量方法來(lái)解決序列的相似度量問(wèn)題和在Apriori算法基礎(chǔ)上提出改進(jìn)的算法,通過(guò)對(duì)參與候選集的

3、元素計(jì)數(shù)的方法來(lái)減少產(chǎn)生候選集的組合和減少數(shù)據(jù)庫(kù)的掃描次數(shù)來(lái)達(dá)到要求。這有利于提高挖掘的速度和減少數(shù)據(jù)庫(kù)的I/O操作時(shí)間的開(kāi)銷。本文所提出的算法已經(jīng)在信息管理系統(tǒng)得到應(yīng)用,并證明是有效的。關(guān)鍵字:數(shù)據(jù)庫(kù),數(shù)據(jù)挖掘,相似序列,生態(tài)位相似度量,關(guān)聯(lián)規(guī)則,Apriori算法,算法效率AbstractAninformationburstageiscomingwiththevariousapplicationofInformationtechnology.Howtomaximizetheinformationisaveryimpor

4、tantproblemforthedecision-makerofthecompanies.BesidesgettingtheregularinformationfromtheDatabasebySQL-query,peoplestillneedtominethedatarelationwhichisunclearbutreallyexistsAssociationrulesisoneofthedataminingmethods,thefamousalgorithmAprioriisamethod,whichcanbeus

5、edtosolutethoseproblemsThisarticleanalyzesandstudiestheimprovedalgorithmAprioribasedonthealgorithmofminingassociationrulesApriori.ThemainideaistodecreasethenumberofcandidateitemsandtodecreasethetimesofDatabasescanning.Thesolutionisavailable.Itupgradesthespeedofdat

6、amininganddecreasescomputer’SI/Ooperation.It’SprovedtobemoreefficientthanthetraditionalmethodKeywords:Database,Datamining,similarline,associationrules,Apriorialgorithm,algorithm’Sefficient4第一章:數(shù)據(jù)庫(kù)信息技術(shù)的不斷推廣應(yīng)用,將企業(yè)帶入了一個(gè)信息爆炸的時(shí)代。每日、每時(shí)、每刻都有潮水般的信息出現(xiàn)在管理者的面前,等待管理者去處理、去使用。這

7、些管理信息的處理類型主要有事務(wù)型[4]和信息型[4]處理兩大類。事務(wù)型處理,也就是通常所說(shuō)的業(yè)務(wù)操作,對(duì)信息進(jìn)行查詢和修改,目的是滿足特定的日常管理需要。在這類事件處理中,管理者關(guān)心的是信息能否得到快速的處理,信息的安全性能否得到保證,信息的完整性是否會(huì)遭到破壞。信息型處理則是指對(duì)信息做進(jìn)一步的分析,為管理人員的決策提供支持。例如,為決策支持系統(tǒng)DDS[5]、經(jīng)理信息系統(tǒng)、戰(zhàn)略信息系統(tǒng)等提供信息分析的支持。1.關(guān)于數(shù)據(jù)庫(kù)的概念數(shù)據(jù)庫(kù)是一個(gè)結(jié)構(gòu)化的數(shù)據(jù)集合。主要是通過(guò)綜合各個(gè)用戶的文件,除去不必要的冗余,使之相互聯(lián)系形成的數(shù)

8、據(jù)結(jié)構(gòu)。聯(lián)系是數(shù)據(jù)庫(kù)的重要特點(diǎn)。它用于描述一個(gè)或多個(gè)相關(guān)組織的活動(dòng)?!?】例如:一個(gè)零售藥店的數(shù)據(jù)庫(kù)可能包含如下信息:實(shí)體:藥品信息,供貨方信息,購(gòu)買者信息實(shí)體間聯(lián)系:藥品進(jìn)銷,藥品庫(kù)存,資金收付2.?dāng)?shù)據(jù)庫(kù)管理系統(tǒng)(DBMS)DBMS是輔助用戶管理和利用大數(shù)據(jù)庫(kù)集的軟件,它具有如下幾個(gè)優(yōu)點(diǎn):1).?dāng)?shù)據(jù)獨(dú)

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。