Apriori算法優(yōu)化及其在挖掘?qū)W生成績中的應(yīng)用

Apriori算法優(yōu)化及其在挖掘?qū)W生成績中的應(yīng)用

ID:47425665

大小:262.01 KB

頁數(shù):16頁

時(shí)間:2020-01-10

Apriori算法優(yōu)化及其在挖掘?qū)W生成績中的應(yīng)用_第頁
預(yù)覽圖正在加載中,預(yù)計(jì)需要20秒,請(qǐng)耐心等待
資源描述:

《Apriori算法優(yōu)化及其在挖掘?qū)W生成績中的應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、數(shù)據(jù)挖掘---關(guān)聯(lián)規(guī)則摘要隨著數(shù)據(jù)庫技術(shù)的發(fā)展,人們采集數(shù)據(jù)的能力越來越高,信息快速膨脹,人們急需從這些數(shù)據(jù)中得到有用的知識(shí),于是數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。數(shù)據(jù)挖掘的過程即是從大量的數(shù)據(jù)中獲取有趣知識(shí)的過程,而關(guān)聯(lián)規(guī)則作為它的一個(gè)重要分支,更是為決策過程提供良好的手段。本文則是圍繞著這一關(guān)聯(lián)規(guī)則這一主題進(jìn)行探索。首先簡單介紹了關(guān)聯(lián)規(guī)則的定義、分類、挖掘過程,然后著重介紹了挖掘模型Apriori算法,并提出了一種基于事務(wù)壓縮的改進(jìn)算法,最后針對(duì)我們信管專業(yè)同學(xué)的成績這一成績作為原始數(shù)據(jù),在SPSSClementine這一挖掘平臺(tái)上進(jìn)行關(guān)聯(lián)規(guī)則的挖掘,以獲取不同課程學(xué)習(xí)之間的一些關(guān)系

2、。關(guān)鍵詞 數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則Apriori算法SPSSClementineAbstractWiththedevelopmentofdatabasetechnology,thecapacityfordatacollectionhasadvancedmoreandmorequickly,inducingtherapidexpansionofinformation,Dataminingtechniquesemergedforpeopleneedtogetinterestingknowledgefromthesedata.Dataminingprocessistoobtaininter

3、estingknowledgefromalargenumberofdata.Associationrulesasanimportantbranchofit,istoprovideagoodmeansofdecision-makingprocess.Thisarticleiscenteredonthethemeofthisassociationrules.First,abriefdefinitionofassociationrules,classificationanddataminingprocess,andthenfocusesontheminingmodelApriori

4、algorithm,andproposesatransaction-basedcompressionoftheimprovedalgorithm,andfinallyfusesourstudents’scoresastheoriginaldata,makingdataminingaboutassociationruleontheminingplatSPSSClementine,toobtainanumberofdifferentrelationshipsbetweencourses.KeywordsDataMiningassociationAprioriSPSSClement

5、ine不要?jiǎng)h除行尾的分節(jié)符,此行不會(huì)被打印16數(shù)據(jù)挖掘---關(guān)聯(lián)規(guī)則目錄目錄摘要IAbstractI第1章緒論31.1課題背景31.1.1學(xué)術(shù)背景31.1.2商業(yè)背景31.2研究內(nèi)容4第2章關(guān)聯(lián)規(guī)則52.1基本概念52.1.1定義52.1.2分類52.1.3過程62.2Apriori算法62.2.1算法思想62.2.2實(shí)例分析62.3Apriori算法改進(jìn)92.3.1改進(jìn)思想92.3.2實(shí)例分析9第3章數(shù)據(jù)挖掘在學(xué)生成績中的應(yīng)用113.1數(shù)據(jù)挖掘工具簡介-SPSSClementine113.2建模過程113.2.1數(shù)據(jù)清洗與集成113.2.2數(shù)據(jù)選擇與轉(zhuǎn)換123.2.3數(shù)據(jù)挖

6、掘123.3模式評(píng)估與表示13附1516數(shù)據(jù)挖掘---關(guān)聯(lián)規(guī)則第1章緒論1.1課題背景1.1.1學(xué)術(shù)背景隨著數(shù)據(jù)庫技術(shù)的逐漸成熟和計(jì)算機(jī)網(wǎng)絡(luò)的迅速普及,人們采集數(shù)據(jù)的能力得到了極大的提高,導(dǎo)致全球范圍的信息急劇膨脹,為了對(duì)這些少量信息的隱藏知識(shí)進(jìn)行開發(fā),數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。數(shù)據(jù)挖掘(DataMining,DM),是一種決策支持過程,它主要基于人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)技術(shù),高度自動(dòng)化地分析企業(yè)原有的數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,幫助決策者做出正確的決策。簡單地說:數(shù)據(jù)挖掘就是指從大量數(shù)據(jù)中提取知識(shí)。從廣義上講,關(guān)聯(lián)分析是數(shù)據(jù)挖掘的本質(zhì)。既然數(shù)據(jù)挖掘的目的是發(fā)

7、現(xiàn)潛藏在數(shù)據(jù)背后的知識(shí),那么這種知識(shí)一定是反映不同對(duì)象之間的關(guān)聯(lián)。關(guān)聯(lián)知識(shí)反映一個(gè)事件和其他事件之間的依賴和關(guān)聯(lián)。數(shù)據(jù)庫中的數(shù)據(jù)一般都存在著關(guān)聯(lián)關(guān)系,這種關(guān)聯(lián)是復(fù)雜的,有時(shí)是隱含的。關(guān)聯(lián)分析的目的就是要找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)信息。關(guān)聯(lián)分析發(fā)現(xiàn)關(guān)聯(lián)規(guī)則,這些規(guī)則展示屬性-值頻繁地在給定數(shù)據(jù)集中一起出現(xiàn)的條件。這些關(guān)聯(lián)并不總是事先知道的,而是通過數(shù)據(jù)庫中數(shù)據(jù)的關(guān)聯(lián)分析獲得的。關(guān)聯(lián)規(guī)則挖掘是關(guān)聯(lián)知識(shí)發(fā)現(xiàn)的最常用方法,它挖掘發(fā)現(xiàn)大量數(shù)據(jù)中項(xiàng)集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系。其目的就是從數(shù)據(jù)庫中挖掘出最低支持度和最低可

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。