基于schema的xml索引研究與實現(xiàn)

基于schema的xml索引研究與實現(xiàn)

ID:34363042

大小:476.01 KB

頁數(shù):58頁

時間:2019-03-05

基于schema的xml索引研究與實現(xiàn)_第1頁
基于schema的xml索引研究與實現(xiàn)_第2頁
基于schema的xml索引研究與實現(xiàn)_第3頁
基于schema的xml索引研究與實現(xiàn)_第4頁
基于schema的xml索引研究與實現(xiàn)_第5頁
資源描述:

《基于schema的xml索引研究與實現(xiàn)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、分類號學(xué)號642100200672280學(xué)校代碼10487密級碩士學(xué)位論文基于Schema的XML索引研究與實現(xiàn)學(xué)位申請人:陳興學(xué)科專業(yè):計算機軟件與理論指導(dǎo)教師:王元珍教授答辯日期:2008年6月6日AThesisSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringResearchandImplementonXMLIndexBasedonSchemaCandidate:ChenXingMajor

2、:ComputerSoftwareandTheorySupervisor:Prof.WangYuanzhenHuazhongUniversityofScienceandTechnologyWuhan430074,P.R.ChinaJune,2008獨創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是我個人在導(dǎo)師的指導(dǎo)下進行的研究工作及取得的研究成果。近我所知,除文中已標明引用的內(nèi)容外,本論文不包含任何其他人或集體已經(jīng)發(fā)表或撰寫過的研究成果。對本文的研究做出貢獻的個人和集體,均已在文中以明確方式標明。本人完全意識到本聲明的

3、法律結(jié)果由本人承擔(dān)。學(xué)位論文作者簽名:日期:學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,即:學(xué)校有權(quán)保留并向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)華中科技大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。保密□,在______年解密后適用本授權(quán)數(shù)。本論文屬于不保密√。(請在以上方框內(nèi)打“√”)學(xué)位論文作者簽名:日期:指導(dǎo)教師簽名:日期:摘要隨著可擴展標記語言XML應(yīng)用的

4、普及,對XML文檔查詢的要求也就越來越高。如果不在XML文檔上建立索引結(jié)構(gòu),那么針對XML數(shù)據(jù)的任何查詢都很可能導(dǎo)致對整個文檔樹的遍歷,對于海量的XML文檔,這種遍歷所花費的開銷巨大。因此,建立高效索引、提高XML文檔的查詢效率成為近來研究的熱點。通過研究XML數(shù)據(jù)的特點,設(shè)計了一種基于Schema的XML索引方法。主要開展了四個方面的研究工作:節(jié)點編碼方法的設(shè)計、索引結(jié)構(gòu)的設(shè)計和存儲、路徑查詢的實現(xiàn)及索引的維護。節(jié)點的編碼主要以現(xiàn)有的區(qū)間編碼方法為基礎(chǔ),加以適當改進,增加了幾個新的字段,以支持XML文檔節(jié)

5、點的更新,為XML索引模型提供了編碼維護方案。以編碼方案為基礎(chǔ),結(jié)合倒排索引和路徑索引的思想,為該索引設(shè)計了合理的數(shù)據(jù)結(jié)構(gòu),以及在關(guān)系數(shù)據(jù)庫系統(tǒng)中的存儲模式。為有效實現(xiàn)路徑查詢,以所設(shè)計的索引結(jié)構(gòu)為基礎(chǔ),擬定了XML數(shù)據(jù)庫各種查詢操作的步驟,主要包括Schema文檔的預(yù)處理和XML文檔結(jié)構(gòu)匹配兩個階段,并提出了相應(yīng)的結(jié)構(gòu)連接算法。為了支持用戶更新XML文檔,提出的增加文檔的索引維護算法和刪除文檔的索引算法不僅實現(xiàn)了對XML文檔在數(shù)據(jù)庫中存儲的更新,還實現(xiàn)了對XML文檔本身的保持約束更新。在達夢XML系統(tǒng)的基

6、礎(chǔ)上,設(shè)計并實現(xiàn)了基于Schema的XML索引系統(tǒng),實驗結(jié)果表明,該索引方法能夠有效地提高XML的路徑查詢效率。關(guān)鍵詞:可擴展標記語言,編碼方式,索引,查詢IAbstractWiththerapiddevelopmentandwidespreaduseofXML,therequirementofXMLdocumentsQuerybecomehigherandstricter.WithouttheindexforXMLdocuments,anyqueryofXMLdatawillbesearchingthew

7、holeXMLtree,anditwillcostagreatamountoftime,moneyandenergy.Therefore,buildinganefficientindextoimprovetheeffectofXMLsearchingbecomesthekeypointofrecentresearch.WithstudyingthespecificsofXMLdata,theXMLindexismadeonthebasisofSchema.Mainlydividedintofourtasks

8、:designfornodecodingmethods、designandmemoryofindexconstruction、therealizationofpathqueryandthemaintenanceofindex.Nodecoding,mainlybasedontherangecoding,adaptstosomeinstanceandaddsseveralnewnumericfieldstosupp

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。