教學(xué)資源搜索平臺web日志挖掘技術(shù)研究

教學(xué)資源搜索平臺web日志挖掘技術(shù)研究

ID:33153101

大?。?.68 MB

頁數(shù):57頁

時間:2019-02-21

教學(xué)資源搜索平臺web日志挖掘技術(shù)研究_第1頁
教學(xué)資源搜索平臺web日志挖掘技術(shù)研究_第2頁
教學(xué)資源搜索平臺web日志挖掘技術(shù)研究_第3頁
教學(xué)資源搜索平臺web日志挖掘技術(shù)研究_第4頁
教學(xué)資源搜索平臺web日志挖掘技術(shù)研究_第5頁
資源描述:

《教學(xué)資源搜索平臺web日志挖掘技術(shù)研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫

1、萬方數(shù)據(jù)分類號UDC密級工程碩士學(xué)位論文教學(xué)資源搜索平臺Web日志挖掘技術(shù)研究朱壽華論文答辯日期地1.生窆旦三Q旦學(xué)位授予日期2Q!壘生窆旦三Q旦答辯委員會主席醫(yī)友墊萬方數(shù)據(jù)廣西大學(xué)學(xué)位論文原創(chuàng)性和使用授權(quán)聲明本人盧明所呈交的論文,是本人在導(dǎo)師的指導(dǎo)下獨立進行研究所取得的研究成果。除已特別加以標注和致謝的地方外,論文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫的研究成果,也不包含本人或他人為獲得廣西大學(xué)或其它單位的學(xué)位而使用過的材料。與我一同工作的同事對本論文的研究工作所做的貢獻均已在論文中作了明確說明。本人在導(dǎo)師指導(dǎo)下所完成的學(xué)位論文及相關(guān)的職務(wù)作品,知識

2、產(chǎn)權(quán)歸屬廣西大學(xué)。本人授權(quán),’‘西大學(xué)擁有學(xué)位論文的部分使用權(quán),即:學(xué)校有權(quán)保存并向國家有關(guān)部門或機構(gòu)送交學(xué)位論文的復(fù)印件和電子版,允許論文被查閱和借閱,可以將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索和傳播,可以采用影印、縮印或其它復(fù)制手段保存、匯編學(xué)位論文。本學(xué)位論文屬于:口保密,在年解密后適用授權(quán)??刹槐C堋?請在以上相應(yīng)方框內(nèi)打“√”)論文作者簽名:錸舟華指導(dǎo)教師簽名:I岔I礦華作者聯(lián)系電話:日期:沙,牛.鄉(xiāng).涉日期矽f吖.鄉(xiāng).2,f電子郵箱:萬方數(shù)據(jù)教學(xué)資源搜索平臺Web日志挖掘技術(shù)研究摘要隨著Web應(yīng)用的不斷增多,Web數(shù)據(jù)庫的規(guī)模也在

3、不斷擴大,其數(shù)據(jù)量亦逐漸加大。Web日志挖掘利用數(shù)據(jù)挖掘技術(shù)對web服務(wù)器的log日志進行挖掘分析,探究同志中潛在的規(guī)則與模式,最終將其應(yīng)用到網(wǎng)站架構(gòu)設(shè)計、個性化服務(wù)等方面。Web日志挖掘的過程通常分為三個階段:數(shù)據(jù)預(yù)處理階段、模式發(fā)現(xiàn)階段以及模式分析階段。在整個Web日志挖掘過程中,最為重要的是數(shù)據(jù)預(yù)處理階段,它能直接影響到后面模式識別與模式分析的算法性能及計算結(jié)果。其中會話識別是數(shù)據(jù)預(yù)處理的主要環(huán)節(jié),同時也是最為基礎(chǔ)、關(guān)鍵的步驟。本文的主要研究工作包括:(1)給出了一種基于動態(tài)時間閥值的Web會話識別方法。對目前常用的幾種會話識別方法進行了詳細的描

4、述,分析了每種方法的優(yōu)缺點,在參考基于時間的啟發(fā)式識別方法基礎(chǔ)上,提出一1種以站點首頁作為新會話的開始,以動態(tài)時間閥值來決定會話邊界的改進會話識別方法,給出了算法流程圖以及具體的實現(xiàn)方法。實驗結(jié)果表明,改進的會話識別方法不僅ⅡJJ以識別出更多的真實用戶會話,而且還能有效地提高會話識別的精確度和識全度。(2)設(shè)計'r一個基于Web日志挖掘的教學(xué)資源搜索平臺。該平臺以廣西中醫(yī)藥大學(xué)學(xué)校網(wǎng)站IIS日志為處理對象,選取了2013年7月某天的日志信息作為系統(tǒng)的分析數(shù)據(jù)。設(shè)計了系統(tǒng)的整體架構(gòu),對系統(tǒng)各主要模塊l萬方數(shù)據(jù)的功能進行了詳細的說明,給出了數(shù)據(jù)表結(jié)構(gòu)和每個

5、環(huán)節(jié)的流程圖,編程實現(xiàn)了原型系統(tǒng)。關(guān)鍵詞:Web日志挖掘數(shù)據(jù)預(yù)處理會話識別動態(tài)時間閥值萬方數(shù)據(jù)ResearchontheWebLogMiningofTeachingResonrcesSearchingPlatformABSTRACTWiththegrowingnumberofWebapplications,Webdatabasesizeisalsoexpandingitsdatavolumewillgraduallyincrease.WeblogminingusingdataminingtechniquestologmiIlingwebserverlo

6、ganalysis,logintoexplorethepotentialofrulesandpatternsthatwilleventuallyapplytoaspectsofsitearchitecturedesign,personalizedservice.Weblogminingprocessisusuallydividedintothreephases:datapreprocessingstage,patterndiscoveryphaseandpattemanalysisphase.ThroughouttheWeblogminingproce

7、ss,themostimportantisthedatapreprocessingstage,itcandirectlyaffecttheperformanceofthealgorithmandtheresultsbackpatternrecognitionandpatternanalysis.Thisisthemainpartofthesessionidentificationdatapreprocessing,butalsothemostbasic,criticalstep.Themaininnovativeresearchworkincludes

8、:(1)GivesaWebsessionidentificationmethodbasedon

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。