資源描述:
《基于聚類的web使用挖掘研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、山東大學(xué)碩士學(xué)位論文基于聚類的Web使用挖掘研究姓名:劉國光申請學(xué)位級別:碩士專業(yè):管理科學(xué)與工程指導(dǎo)教師:彭志忠20070318原刨性聲明本人鄭重聲明:所呈交的學(xué)位論文,是本人在導(dǎo)師的指導(dǎo)下,獨(dú)立進(jìn)行研究所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本論文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫過的科研成果。對本文的研究作出重要貢獻(xiàn)的個人和集體,均已在文中以明確方式標(biāo)明。本聲明的法律責(zé)任由本人承擔(dān)。論文作者簽名:塑!墮知日關(guān)于學(xué)位論文使用授權(quán)的聲明本人同意學(xué)校保留或向國家有關(guān)部門或機(jī)構(gòu)送交論文的印刷件和
2、電子版,允許論文被查閱和借閱;本人授權(quán)山東大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或其他復(fù)制手段保存論文和匯編本學(xué)位論文。(保密論文在解密后應(yīng)遵守此規(guī)定)論文作者簽名:毫!!璺墊導(dǎo)師簽山東大學(xué)碩士學(xué)位論文摘要隨著Intemet的普及和WWW的迅猛發(fā)展,用戶對Web訪問的信息己經(jīng)成為世界上最大的信息倉庫之一。而信息的爆炸式增長與人們注意力的有限性之間的矛盾也隨之增加,Web使用挖掘正是解決這一矛盾的有效手段,它從用戶對Web的訪問信息中抽取出感興趣的模式,以發(fā)現(xiàn)用
3、戶訪問站點(diǎn)的瀏覽模式,為站點(diǎn)管理員提供各種利于Web站點(diǎn)改進(jìn)或可以帶來經(jīng)濟(jì)效益的信息,從而對網(wǎng)站運(yùn)營管理、開展電子商務(wù)和吸引用戶都有深遠(yuǎn)豹意義。本文研究了聚類與Web使用挖掘有關(guān)的理論和技術(shù)基礎(chǔ),提出了Web使用挖掘的系統(tǒng)框架,闡明了從Web數(shù)據(jù)預(yù)處理、w曲用戶訪問路徑模式發(fā)現(xiàn)、Web聚類分析和特征規(guī)則挖掘等方面開展對Web數(shù)據(jù)進(jìn)行使用挖掘的研究思路。在Web數(shù)據(jù)預(yù)處理方面,系統(tǒng)地研究了Web數(shù)據(jù)清理、用戶識別、會話識別、路徑補(bǔ)充和事務(wù)識別等過程,設(shè)計了有關(guān)算法。在Web用戶訪闖路徑模式發(fā)現(xiàn)方面,研
4、究了用戶訪問模式挖掘的理論和方法。在分析基于偏愛度的用戶訪問路徑挖掘模式的基礎(chǔ)上,提出了基于頁面層次和喜愛度的用戶瀏覽頻繁路徑獲取方法,闡明了全面考慮支持度、用戶瀏覽時間和頁面層次三種因素的用戶瀏覽頻繁路徑發(fā)現(xiàn)技術(shù)。在Web聚類方面,系統(tǒng)地研究了度量聚類對象相似度的方法,并根據(jù)Web特點(diǎn),研究了基于頁面間鏈接距離的頁面聚類方法。在Web用戶聚類方面,探索了一種基于矩陣變換的Web用戶聚類方法,系統(tǒng)地考慮聚類對象之間的相互作用和影響。綜上所述,論文系統(tǒng)地研究了Web使用挖掘過程,探索了從海量和半結(jié)構(gòu)化
5、的Web數(shù)據(jù)中挖掘隱含知識的理論和方法,為Web使用挖掘的進(jìn)一步發(fā)展提供了更為廣闊的空間。關(guān)鍵詞:Web使用挖掘;Web數(shù)據(jù)預(yù)處理;Web聚類,Web關(guān)聯(lián)規(guī)則挖掘7山東大學(xué)碩士學(xué)位論文AbstractWiththepopularityofIntenretandtheexplosionofWWW:Webnsageinformationisbecomingthelargestinformationwarehouse.Asaresult.theconflictbetweenthelimitedhumana
6、ttentionandtheunlimitedinformationisbecomingmoreandmoreserious.Luckily,WebUsageMiningisfoundtobeanefectivemethodtosolvethisproblem.Itcanbeusedtofindoutuse心normalbrowsingpaternsandgivesignificantadvisesforwebsitesupervisorsbyextractsinterestingpaterns舶m
7、theoriginalWebusageinformation.Bythismear塔,WebUsageMiningissignificantforWebsitedesignandmanagement,businessandmarketillgdecisionsupportandiLser$attraction.TMspaperfirstfocusesonthetheoreticalandtechnicalfoundationrelatedtowebusagemining,suchasclusteri
8、ngandassocimionrules.Ithasformedthesystematicframeworkforwebusageminingandillustratedtheapproachtowebusagemininginta/nisofdampreprocessing,discoveringuservisitingpattern,webclusteringandcharacteristicrules,ete.Inthefieldofdatapreprocess