基于xml數(shù)據(jù)的模式發(fā)現(xiàn)和存儲研究

基于xml數(shù)據(jù)的模式發(fā)現(xiàn)和存儲研究

ID:33544635

大?。?.49 MB

頁數(shù):56頁

時間:2019-02-27

基于xml數(shù)據(jù)的模式發(fā)現(xiàn)和存儲研究_第1頁
基于xml數(shù)據(jù)的模式發(fā)現(xiàn)和存儲研究_第2頁
基于xml數(shù)據(jù)的模式發(fā)現(xiàn)和存儲研究_第3頁
基于xml數(shù)據(jù)的模式發(fā)現(xiàn)和存儲研究_第4頁
基于xml數(shù)據(jù)的模式發(fā)現(xiàn)和存儲研究_第5頁
資源描述:

《基于xml數(shù)據(jù)的模式發(fā)現(xiàn)和存儲研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、東南大學(xué)碩士學(xué)位論文基于XML數(shù)據(jù)的模式發(fā)現(xiàn)和存儲研究姓名:牛天耘申請學(xué)位級別:碩士專業(yè):計算機應(yīng)用指導(dǎo)教師:孫志揮20040301基于XML數(shù)據(jù)的模式發(fā)現(xiàn)和存儲研究摘要作為一種簡單的、開放的、可擴充的自描述語言,心L不僅成為Interact,上數(shù)據(jù)表示與交換的標(biāo)準(zhǔn),而且被應(yīng)用于搜索引擎、電子商務(wù)、電子數(shù)據(jù)交換蔣很多方面,受到了廣泛的重視。xhIL文檔的模式抽取以及數(shù)據(jù)存儲問題,是XML相關(guān)研究工作中的重要內(nèi)容,直接影響著XML的使用效率和功能發(fā)揮。本文論述了頻繁模式挖掘工作的意義和作用,介紹了若干用于頻繁模式挖掘的算法,并在現(xiàn)有的頻繁樹結(jié)構(gòu)挖掘算法一一wL算法的基礎(chǔ)上,結(jié)合XML數(shù)

2、據(jù)模型XOEM和壓縮結(jié)構(gòu)樹的存儲結(jié)構(gòu).對挖掘過程中候選模式的剪枝策略進行了改進,提出了~種高教的xML頻繁模式發(fā)現(xiàn)算法一--XFPD算法。同時,本文進一步研究了XFPD算法所產(chǎn)生頻繁模式的形式化描述工作,使得XML頻繁模式可以轉(zhuǎn)化為相應(yīng)的DTD格式,并提出了DTD到關(guān)系模式的轉(zhuǎn)換和優(yōu)化策略,用于有效的存儲頻繁模式數(shù)據(jù),對頻繁模式外剩余數(shù)據(jù)的存儲方法也進行了相應(yīng)的討論。利用以上生成的關(guān)系模式,本文還提出了XML數(shù)據(jù)自動導(dǎo)入方法,以實現(xiàn)XML到關(guān)系數(shù)據(jù)庫的有效存儲。本文從理論和實驗兩方面證明了在挖掘XIIIL頻繁模式時。XFPD算法比wL算法具有更加良好的性能,并通過一個原型系統(tǒng)的實現(xiàn),

3、驗證了本文提出的XML數(shù)據(jù)存儲方法的有效性和可行性。關(guān)鍵詞:XML,DTD,頻繁模式挖掘,數(shù)據(jù)存儲,關(guān)系數(shù)據(jù)庫,關(guān)系模式東南大學(xué)碩士學(xué)位論文AbstractAsakindofsimple,openandextensibleself-describinglanguage,XMLisnOtonlyanemergingInternetstandardfordatarepresentationandexchange,butalsoappliedtoIntematsearchengines,electroniccommerce,EDI,etc.Sosuchattentionhasbeenpai

4、dtoXML.HowtoextractschemafromXMLdocumentsandstoreXMLdataisanessentialprobleminXML-relatedresearch,whichdirectlyaffectstheefficiencyandfunctionofXMLdocuments.Inthispaper,wediscussthemeaningoffrequentpaRemminingtasks,andintroduceaseriesoffrequentpattemminingalgorithms.Basedontheexistingfrequenttr

5、eestructureminingalgorithm--WL,wepresenttheXMLdatamodelXOEMandcompressedstructuretree,improvethepruningstrategiesofcandidatesandthenbringforwardaneffectivealgorithmforXMLfrequentpatterndiscovery--XFPD.Afterthat,wefurtherresearchontheformalizationoffrequentpatternsproducedbyXFPD,whichtransformsX

6、MLfrequentpatternstocorrespondingDTDs.ThemappingandoptimizingstrategiesforthegenerationofrelationalschemafromDTDareintroducedtostorefrequentpatterndata.Theproblemofhowtostoreoverflowdataoutoffrequentpatternsisalsodiscussed.Usingtherelationalschemasgeneratedasabove,wepresenttheautomaticimporting

7、methodofXMLdataandimplementefficientstorageofXMLdatainrelationaldatabases.ThispaperprovesthatXFPDhasbetterperformancethanWLintheworkofminingXMLfrequentpatternstheoreticallyandexperimentally,andgivesaproofofthevalidityandfeasibilit

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。