試析基于xml的web數(shù)據(jù)挖掘及關聯(lián)算法的研究

試析基于xml的web數(shù)據(jù)挖掘及關聯(lián)算法的研究

ID:34817914

大?。?.16 MB

頁數(shù):49頁

時間:2019-03-11

試析基于xml的web數(shù)據(jù)挖掘及關聯(lián)算法的研究_第1頁
試析基于xml的web數(shù)據(jù)挖掘及關聯(lián)算法的研究_第2頁
試析基于xml的web數(shù)據(jù)挖掘及關聯(lián)算法的研究_第3頁
試析基于xml的web數(shù)據(jù)挖掘及關聯(lián)算法的研究_第4頁
試析基于xml的web數(shù)據(jù)挖掘及關聯(lián)算法的研究_第5頁
資源描述:

《試析基于xml的web數(shù)據(jù)挖掘及關聯(lián)算法的研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。

1、西南大學碩士學位論文基于XML的Web數(shù)據(jù)挖掘及關聯(lián)算法的研究姓名:廖鵬申請學位級別:碩士專業(yè):農業(yè)機械化工程指導教師:左源瑞20090401摘要基于XML的Web數(shù)據(jù)挖掘及關聯(lián)算法的研究農業(yè)機械化工程專業(yè)碩士研究生廖鵬指導教師左源瑞副教授近年來,隨著互聯(lián)網(wǎng)的迅速發(fā)展,互聯(lián)網(wǎng)上的數(shù)據(jù)越來越龐大,而且數(shù)據(jù)的種類也越來越繁雜,怎樣能夠有效地利用這些復雜的數(shù)據(jù),從中發(fā)掘有價值的信息成了現(xiàn)今的研究熱點。由于Web上的數(shù)據(jù)沒有特定的模型描述,是一種半結構化或者是無結構的數(shù)據(jù),那么相對于傳統(tǒng)的數(shù)據(jù)庫挖掘技術而言,就存在著很多的困難;瑚L是一種半結構化的數(shù)據(jù)模型,可以很容易地將XML的文檔描述與關系數(shù)據(jù)庫中

2、的屬性對應起來,實施精確的查詢和模型抽取。所以,面向XML的數(shù)據(jù)挖掘技術有著不同于傳統(tǒng)數(shù)據(jù)庫上的數(shù)據(jù)挖掘技術的特點。此外Apriori算法是一個經典的關聯(lián)規(guī)則挖掘算法,但是它存在這需要頻繁重復掃描數(shù)據(jù)庫以及產生數(shù)量龐大的2一項集等弊端。本文在介紹了數(shù)據(jù)挖掘、Web數(shù)據(jù)挖掘、)a幾等一些基本概念、技術、方法、過程的基礎上,完成了從XMLSchema文檔映射為關系模式的設計,即在基于)眥的Web數(shù)據(jù)挖掘與傳統(tǒng)的基于關系數(shù)據(jù)模式的數(shù)據(jù)挖掘算法中間建立了聯(lián)系之后,對傳統(tǒng)的Apriori算法進行了分析和改進,通過實驗證明,改進后的算法獲得了較好的效率和性能。關鍵字:Ⅺ兒Web數(shù)據(jù)挖掘關聯(lián)規(guī)則Abstra

3、ctRecentyears,thequantityandthekindofdataonIntemetbecomehuge.HowtoBsethesecomplexdata,andgetusefulinformationfromthemisaresearchhotspot.BecameofthedataOnInternethas110specialmodeldescription,theyareakindofsenti.structureornon.structuredata.SoitishardforUStododataminingcomparedtothetraditiondatabase.

4、XMLisakindsemi—structuredatamodel,itiseasytomatchtheXML’sdocumentdescriptionandattributeinrelationshipdatabase,todopreciseinquiry.nledataminingtechnologybasedonXMLisdifferentfromthedataminingtechnologyfortraditionaldatabase.Aprioriarithmeticisaclassicassociationanalysisalgorithm,butthereareseveralma

5、lpracticesuchas:itneedtoscanthewholedatabaserepeatedly,anditwouldgenerateahugenumberof2一frequencyitem.Inthispaper,firstsomeconcepts,technology,methodSandprocessesofdatamining,W曲datamining,XMLareintroduce&ThenakindofmethodthatmaptheXMI,SchemaDocumentintorelationmodelwhichCanbuildaconnectbetweenW.ebda

6、taminingbasedXaViLandtraditionaldataminingaltofithmareintroduced.AtlasttheclassicApriofialgorithmareanalysedandimproved.neexperimentshowedthattheimprovedarithmetichasabetterperformance.KeyWords:XML;WebMining;AssociationIIl獨創(chuàng)性聲明學位論文題目:基王嬰墜煎壁壘數(shù)量控握丞差基篡洼魚盈塞本人提交的學位論文是在導師指導下進行的研究工作及取得的研究成果。論文中引用他人已經發(fā)表或出版過

7、的研究成果,文中已加了特別標注。對本研究及學位論文撰寫曾做出貢獻的老師、朋友、同仁在文中作了明確說明并表示衷心感謝。學位論文版權使用授權書本學位論文作者完全了解西南大學有關保留、使用學位論文的規(guī)定,有權保留并向國家有關部門或機構送交論文的復印件和磁盤,允許論文被查閱和借閱。本人授權西南大學研究生院(籌)可以將學位論文的全部或部分內容編入有關數(shù)據(jù)庫進行檢索,可以采用影印、縮印或掃描等復制手段保存、匯

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內容,確認文檔內容符合您的需求后進行下載,若出現(xiàn)內容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。