基于序列模式的web日志挖掘

ID：33147586

大?。?.20 MB

頁(yè)數(shù)：47頁(yè)

時(shí)間：2019-02-21

資源描述：

《基于序列模式的web日志挖掘》由會(huì)員上傳分享，免費(fèi)在線閱讀，更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、長(zhǎng)春工業(yè)大學(xué)碩士學(xué)位論文基于序列模式的Web日志挖掘姓名：藏紅巖申請(qǐng)學(xué)位級(jí)別：碩士專業(yè)：計(jì)算機(jī)應(yīng)用技術(shù)指導(dǎo)教師：許建潮20070301長(zhǎng)備T業(yè)大學(xué)碩I+學(xué)位論文摘要隨著Internet的迅速發(fā)展，人們面對(duì)太多的信息無(wú)法選擇和消化，淹沒在繁雜的信息中，這種現(xiàn)象稱為信息過載。Internet上信息資源分布的廣泛性又給用戶尋找感興趣的信息增加了困難，用戶不知道如何更有效地發(fā)現(xiàn)自己所需的信息資源，即信息迷失。當(dāng)前我們主要采用搜索引擎來(lái)檢索Web上的信息，但是大多數(shù)搜索引擎缺少主動(dòng)性，沒有考慮用戶的興趣偏好和用戶的不同，無(wú)法有效地解決信息過載和信息迷失的問題。直接或

2、間接解決這個(gè)問題的途徑之一就是將數(shù)據(jù)挖掘技術(shù)應(yīng)用于Web服務(wù)器日志的挖掘，從用戶在Web上瀏覽行為數(shù)據(jù)中獲取用戶的瀏覽模式，根據(jù)用戶的行為模式，改進(jìn)站點(diǎn)的設(shè)計(jì)和服務(wù)，開展個(gè)性化服務(wù)和構(gòu)建智能Web站點(diǎn)。針對(duì)上面提出的問題以及解決辦法，本論文系統(tǒng)地闡述了從數(shù)據(jù)挖掘、Web數(shù)據(jù)挖掘到Web日志數(shù)據(jù)挖掘整個(gè)過程。本論文使用了基于序列模式的挖掘算法對(duì)Web日志進(jìn)行了挖掘，并對(duì)算法進(jìn)行了實(shí)驗(yàn)，給出了實(shí)驗(yàn)結(jié)果，證明了本方法的有效性。’本論文首先介紹了當(dāng)前Internet的發(fā)展以及數(shù)據(jù)挖掘在Web中的應(yīng)用，并著重介紹了數(shù)據(jù)挖掘的相關(guān)概念以及技術(shù)，然后介紹了數(shù)據(jù)挖掘領(lǐng)域中

3、Web日志挖掘相關(guān)方法，其中重點(diǎn)介紹了基于序列模式的Web日志挖掘技術(shù)。接下來(lái)論文詳細(xì)闡述了Web日志挖掘的整個(gè)過程，從Web日志數(shù)據(jù)的預(yù)處理工作(數(shù)據(jù)凈化、用戶識(shí)別、會(huì)話識(shí)別、路徑補(bǔ)充、事務(wù)識(shí)別)到使用序列模式對(duì)經(jīng)過預(yù)處理的數(shù)據(jù)進(jìn)行挖掘的方法。在Web日志挖掘算法中，使用了一種基于廣度優(yōu)先的序列模式挖掘算法，并對(duì)算法進(jìn)行了詳細(xì)的描述。我們使用java語(yǔ)言對(duì)算法進(jìn)行了實(shí)現(xiàn)并對(duì)Web日志進(jìn)行了挖掘，并且得出了挖掘結(jié)果。最后我們對(duì)挖掘結(jié)果進(jìn)行了仔細(xì)的分析以及把該算法的挖掘結(jié)果與其他算法的挖掘結(jié)果進(jìn)行了對(duì)比，實(shí)驗(yàn)證明我們的算法能有效挖掘出Web日志中的序列模式。

4、最后，對(duì)論文作出了總結(jié)并對(duì)將來(lái)的工作做了展望。關(guān)鍵詞：數(shù)據(jù)挖掘，Web日志挖掘，序列模式IIk備工業(yè)人學(xué)碩I學(xué)位論文AbstractWithrapiddevelopmentofIntemet，peoplecannotmakethefightchoicebecansetherearetoomanyinformationforpeopletochoose．ThisphenomenonjscalledinformationOVerloading．TheuniversalityoftheInternetinformationreCouI'Se镕distribute

5、alsomakeadifficultforUsertosearchtheinformationtheyinterested,theuserdonnotknowhowtofindtherightinformationtheywant,thisiscalledinformationlost．Currentlysearcha喀ineisthemaintoolwellseontheweb．butmostofsearchengineslackofgo-aheadism,theydonnotconsiderthedi岱=11cesoftheUsel'sandthetl

6、set售’favor,SOtheycannotsolvetheproblemsofinformationOVerloadingandinformationlost．OneofthewaystosolvetheproblemistoapplythedamminingtothewebserverlogminingdirectlyOrindirectly,andgetthebrowsepatternfromtheusefs’browsebehaviorontheweb．Accordingtothepatternweget,toimprovethesite’sde

7、signandservice，buildtheintelligencewebsite．Astheproblemswereferredbefore，thisdissertationexpatiatethepro伊essfromdatamining，webdataminingtoweblogdataminingsystematically．ThisdissertationusesequentialpatternmjniDgarithmetictominingweblogandwedid∞experimentonthisarithmeticandthengive

8、theexperimentresulttoprovethisari

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 47



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件，查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常，文件下載后無(wú)此問題，請(qǐng)放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤，付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。

基于序列模式的web日志挖掘

基于序列模式的web日志挖掘

相關(guān)文章

相關(guān)標(biāo)簽