資源描述:
《關(guān)聯(lián)規(guī)則挖掘在潮州電信寬帶業(yè)務(wù)中的應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、廣東工業(yè)大學(xué)碩士學(xué)位論文關(guān)聯(lián)規(guī)則挖掘在潮州電信寬帶業(yè)務(wù)中的應(yīng)用姓名:陸梅申請(qǐng)學(xué)位級(jí)別:碩士專(zhuān)業(yè):軟件工程指導(dǎo)教師:許孝元20070501翦?!瘛觥觥瘛觥瘛觥瘛瘛瘛瘛觥觥觥籌I■—●—■——■■■■■●——■—■—■————■●———■一摘要關(guān)聯(lián)知識(shí)反映一個(gè)事件和其他事件之間依賴(lài)或關(guān)聯(lián)的知識(shí),若兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性,就稱(chēng)為關(guān)聯(lián)。關(guān)聯(lián)規(guī)則是幾種主要的數(shù)據(jù)挖掘方法之一,它通過(guò)搜索系統(tǒng)中的所有事物,從中找出數(shù)據(jù)對(duì)象之間出現(xiàn)條件概率較高的模式,這些模式即被認(rèn)為是數(shù)據(jù)對(duì)象之間的關(guān)聯(lián)規(guī)則。關(guān)
2、聯(lián)規(guī)則的挖掘由兩個(gè)步驟來(lái)完成:一、找出所有頻繁項(xiàng)集;二、由頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則。技術(shù)的關(guān)鍵在第一步,有兩種比較常用的方法:Apriori算法和F-P增長(zhǎng)樹(shù)法??茖W(xué)決策是現(xiàn)代企業(yè)管理的核心與基礎(chǔ),傳統(tǒng)的市場(chǎng)調(diào)查數(shù)據(jù)分析主要是用統(tǒng)計(jì)方法對(duì)調(diào)查數(shù)據(jù)進(jìn)行單項(xiàng)統(tǒng)計(jì)處理,而要揭示事物問(wèn)客觀存在而未被人所知的聯(lián)系,就要找出數(shù)據(jù)庫(kù)中隱藏著的關(guān)聯(lián)網(wǎng)。關(guān)聯(lián)規(guī)則挖掘能夠從大量的數(shù)據(jù)中發(fā)現(xiàn)項(xiàng)集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系,因此它廣泛應(yīng)用于各種決策支持系統(tǒng)、專(zhuān)家系統(tǒng)和智能信息系統(tǒng)等等。本文嘗試把關(guān)聯(lián)規(guī)則技術(shù)應(yīng)用于電信寬帶市場(chǎng)研究中,建立了一個(gè)基于寬帶業(yè)務(wù)的數(shù)據(jù)挖掘子
3、系統(tǒng),以期發(fā)現(xiàn)寬帶用戶的使用規(guī)律,為決策者提供決策所需的信息。了解經(jīng)營(yíng)情況,為科學(xué)決策提供準(zhǔn)確的數(shù)據(jù)依據(jù)。根據(jù)電信的需求以及在現(xiàn)有的數(shù)據(jù)資料基礎(chǔ),本文設(shè)計(jì)了客戶消費(fèi)行為分析、投訴咨詢情況分析和離網(wǎng)情況分析三個(gè)功能模塊的關(guān)聯(lián)規(guī)則挖掘系統(tǒng),詳細(xì)地介紹了在SQLS啊ver2000上構(gòu)建系統(tǒng)的全過(guò)程,包括:(1)分析挖掘任務(wù),確定系統(tǒng)要完成的功能,以及為了實(shí)現(xiàn)這些功能需要準(zhǔn)備的數(shù)據(jù)資料:(2)系統(tǒng)設(shè)計(jì),包括硬件環(huán)境選擇、算法選擇和系統(tǒng)模型設(shè)計(jì)、數(shù)據(jù)庫(kù)模型設(shè)計(jì);(3)數(shù)據(jù)預(yù)處理,主要要做晦工作有數(shù)據(jù)的選擇和集成、數(shù)據(jù)清理和變換:(4)算法實(shí)現(xiàn),應(yīng)用
4、Apdori算法思想,通過(guò)PL/SQL語(yǔ)句及存儲(chǔ)過(guò)程實(shí)現(xiàn)頻繁項(xiàng)集的發(fā)現(xiàn)及關(guān)聯(lián)規(guī)則的產(chǎn)生。最后,運(yùn)用關(guān)聯(lián)規(guī)則價(jià)值衡量的方法,對(duì)挖掘結(jié)果進(jìn)行討論和分析,發(fā)現(xiàn)基本方法豹不是,分掰從客觀層面及主觀層面提出改進(jìn)系統(tǒng)實(shí)用效果的模型和方法:包括加入更多的興趣度度量和增加可選的參數(shù)設(shè)置,并對(duì)改進(jìn);崔笛誓;-_--兇;-葺。_‘耋王訾態(tài)蘭苫翟鏨言罄鯊鑾__-一_,后的結(jié)果再進(jìn)行分析和確認(rèn)。最后使系統(tǒng)得到更好的實(shí)用效果。關(guān)鍵詞:Apriori:關(guān)聯(lián)規(guī)則;數(shù)據(jù)挖掘:電信ⅡAbstractAssociationreflectstheinterdependento
5、rassociatedknowledgebetween粕eventandotherevents.Iftherearesomerulesbetweentwoormuchvariables.itisnamedasassociation.Associationruleisoneofthemaindataminingmeans.Throughsearchingallthingsofsystem,itfindsoutso融ehighconditionalprobabilitymodesbetweenthedataobjects.Thosemodes
6、areconsideredtobetheassociationrulesbetweenthedataobjects.Associationrulesminingisfinishedbytwosteps.Oneistofindallfrequentitemsets.Theotheristoproducestrongassociationrulesbyfrequentitemsets.Thefirststepisthekeystep.Itincludestwocommonmeans,whicharehpriorialgorithmandFP-
7、treealgorithm.Itisthecoreandbaseformoderncorporatemanagementtomakepolicyscientifically.Traditionaldataanalysisofmarketresearchistoprocessdataaftersurveyasperindividualitemthroughstatistics.Whileifwanttoexplodetherelationbetweenthingsthatisexistentobjectivelybutunknown,itn
8、eedtofindouttheassociatednethiddeninthedatabase.Associationrulesminingcanfindouttheinterestingas