資源描述:
《基于關(guān)聯(lián)規(guī)則的web日志挖掘系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、分類號學(xué)校代碼10487學(xué)號M201076023密級碩士學(xué)位論文基于關(guān)聯(lián)規(guī)則的Web日志挖掘系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)學(xué)位申請人:熊超學(xué)科專業(yè):軟件工程指導(dǎo)教師:黃立群答辯日期:2012.5.17副教授AThesisSubmittedinPartialFulfillmentoftheRequirementsfortheDegreefortheMasterofEngineeringDesignandImplementationofWebLogMiningSystemBasedonAssociationRulesCandidateMajorSupervisor:XiongChao:SoftwareE
2、ngineering:Assoc.Prof.HuangLiqunHuazhongUniversityofScienceandTechnologyWuhan430074,P.R.ChinaMay,2012獨(dú)創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是我個(gè)人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。盡我所知,除文中已經(jīng)標(biāo)明引用的內(nèi)容外,本論文不包含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫過的研究成果。對本文的研究做出貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。本人完全意識到本聲明的法律結(jié)果由本人承擔(dān)。學(xué)位論文作者簽名:日期:年月日學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定
3、,即:學(xué)校有權(quán)保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)華中科技大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。本論文屬于保密□,不保密□。在年解密后適用本授權(quán)書。(請?jiān)谝陨戏娇騼?nèi)打“√”)學(xué)位論文作者簽名:指導(dǎo)教師簽名:日期:年月日日期:年月日華中科技大學(xué)碩士學(xué)位論文摘要隨著Internet的飛速發(fā)展,通過Web從海量信息中獲取知識變成一項(xiàng)十分重要的技能。目前將數(shù)據(jù)挖掘技術(shù)應(yīng)用于互聯(lián)網(wǎng)數(shù)據(jù)挖掘(WebMining)逐漸成為許多研究領(lǐng)域的重點(diǎn)。Web日志挖掘是W
4、eb數(shù)據(jù)挖掘的一個(gè)分支,可以對用戶與Web服務(wù)器進(jìn)行交互產(chǎn)生的數(shù)據(jù)使用數(shù)據(jù)挖掘技術(shù)來發(fā)現(xiàn)其中隱含的規(guī)律性知識,得到用戶訪問站點(diǎn)的頻繁程度和行為模式,從而有利于網(wǎng)站設(shè)計(jì)人員掌握用戶的喜好和訪問習(xí)慣,也可以通過Web挖掘來發(fā)現(xiàn)系統(tǒng)的性能瓶頸,進(jìn)一步可以以此來改善系統(tǒng)架構(gòu),提高系統(tǒng)的可用性。在介紹了Web日志挖掘和關(guān)聯(lián)規(guī)則以及Apriori算法相關(guān)知識后,對Web日志挖掘系統(tǒng)進(jìn)行了需求分析,進(jìn)行概要設(shè)計(jì)時(shí)給出了系統(tǒng)的功能結(jié)構(gòu),將系統(tǒng)劃分為日志采集模塊、日志預(yù)處理模塊、日志挖掘模塊以及報(bào)表展示模塊四個(gè)模塊,并且描述了系統(tǒng)的幾個(gè)主要工作流程。詳細(xì)設(shè)計(jì)階段重點(diǎn)描述了各個(gè)功能模塊設(shè)計(jì)實(shí)現(xiàn)中使用到的核心算法
5、,數(shù)據(jù)庫設(shè)計(jì)階段給出了系統(tǒng)中所使用到的各個(gè)數(shù)據(jù)表的定義,并且對系統(tǒng)進(jìn)行了實(shí)現(xiàn)。系統(tǒng)的開發(fā)嚴(yán)格以軟件工程的規(guī)范作為準(zhǔn)繩。以經(jīng)典的三層模型作為系統(tǒng)的開發(fā)模型,使系統(tǒng)做到了松散耦合,提高了代碼的可維護(hù)性和可重用性。通過使用系統(tǒng)對Web日志進(jìn)行關(guān)聯(lián)規(guī)則挖掘,可以有效地得出用戶訪問的頻繁模式,繼而可以將挖掘所得到的關(guān)聯(lián)規(guī)則應(yīng)用于客戶端界面的重構(gòu),提高用戶的體驗(yàn),并且可以為用戶提供個(gè)性化的用戶界面。關(guān)鍵詞:數(shù)據(jù)挖掘Web日志挖掘數(shù)據(jù)預(yù)處理關(guān)聯(lián)規(guī)則I華中科技大學(xué)碩士學(xué)位論文AbstractWiththerapiddevelopmentoftheInternet,gettingknowledgefro
6、mhugeamountsofWebinformationhasbecomeaveryimportantskill.AtpresentthedataMiningtechnologyusingintheInternetdataMining(WebMining)hasbecomethekeyofmanyresearchfields.WeblogminingisabranchofWebdatamining,wecanusethistechnologytofindsomeimpliedregularknowledgethatwhentheuserandWebserverinteracttogenera
7、tedata.Inthisway,wecangetmoreinformationofthefrequencyandbehaviorpatternswhichtheusersgetaccessthesite,soastofacilitatethewebsitedesignstafftogetonwellwiththeuser’spreferencesandhabit.Afterintroducingrelate