資源描述:
《基于schema的xml索引研究與實現(xiàn)》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、分類號學(xué)號642100200672280學(xué)校代碼10487密級碩士學(xué)位論文基于Schema的XML索引研究與實現(xiàn)學(xué)位申請人:陳興學(xué)科專業(yè):計算機(jī)軟件與理論指導(dǎo)教師:王元珍教授答辯日期:2008年6月6日AThesisSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringResearchandImplementonXMLIndexBasedonSchemaCandidate:ChenXingMajor
2、:ComputerSoftwareandTheorySupervisor:Prof.WangYuanzhenHuazhongUniversityofScienceandTechnologyWuhan430074,P.R.ChinaJune,2008獨創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是我個人在導(dǎo)師的指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。近我所知,除文中已標(biāo)明引用的內(nèi)容外,本論文不包含任何其他人或集體已經(jīng)發(fā)表或撰寫過的研究成果。對本文的研究做出貢獻(xiàn)的個人和集體,均已在文中以明確方式標(biāo)明。本人完全意識到本聲明的
3、法律結(jié)果由本人承擔(dān)。學(xué)位論文作者簽名:日期:學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,即:學(xué)校有權(quán)保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)華中科技大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。保密□,在______年解密后適用本授權(quán)數(shù)。本論文屬于不保密√。(請在以上方框內(nèi)打“√”)學(xué)位論文作者簽名:日期:指導(dǎo)教師簽名:日期:摘要隨著可擴(kuò)展標(biāo)記語言XML應(yīng)用的
4、普及,對XML文檔查詢的要求也就越來越高。如果不在XML文檔上建立索引結(jié)構(gòu),那么針對XML數(shù)據(jù)的任何查詢都很可能導(dǎo)致對整個文檔樹的遍歷,對于海量的XML文檔,這種遍歷所花費(fèi)的開銷巨大。因此,建立高效索引、提高XML文檔的查詢效率成為近來研究的熱點。通過研究XML數(shù)據(jù)的特點,設(shè)計了一種基于Schema的XML索引方法。主要開展了四個方面的研究工作:節(jié)點編碼方法的設(shè)計、索引結(jié)構(gòu)的設(shè)計和存儲、路徑查詢的實現(xiàn)及索引的維護(hù)。節(jié)點的編碼主要以現(xiàn)有的區(qū)間編碼方法為基礎(chǔ),加以適當(dāng)改進(jìn),增加了幾個新的字段,以支持XML文檔節(jié)
5、點的更新,為XML索引模型提供了編碼維護(hù)方案。以編碼方案為基礎(chǔ),結(jié)合倒排索引和路徑索引的思想,為該索引設(shè)計了合理的數(shù)據(jù)結(jié)構(gòu),以及在關(guān)系數(shù)據(jù)庫系統(tǒng)中的存儲模式。為有效實現(xiàn)路徑查詢,以所設(shè)計的索引結(jié)構(gòu)為基礎(chǔ),擬定了XML數(shù)據(jù)庫各種查詢操作的步驟,主要包括Schema文檔的預(yù)處理和XML文檔結(jié)構(gòu)匹配兩個階段,并提出了相應(yīng)的結(jié)構(gòu)連接算法。為了支持用戶更新XML文檔,提出的增加文檔的索引維護(hù)算法和刪除文檔的索引算法不僅實現(xiàn)了對XML文檔在數(shù)據(jù)庫中存儲的更新,還實現(xiàn)了對XML文檔本身的保持約束更新。在達(dá)夢XML系統(tǒng)的基
6、礎(chǔ)上,設(shè)計并實現(xiàn)了基于Schema的XML索引系統(tǒng),實驗結(jié)果表明,該索引方法能夠有效地提高XML的路徑查詢效率。關(guān)鍵詞:可擴(kuò)展標(biāo)記語言,編碼方式,索引,查詢IAbstractWiththerapiddevelopmentandwidespreaduseofXML,therequirementofXMLdocumentsQuerybecomehigherandstricter.WithouttheindexforXMLdocuments,anyqueryofXMLdatawillbesearchingthew
7、holeXMLtree,anditwillcostagreatamountoftime,moneyandenergy.Therefore,buildinganefficientindextoimprovetheeffectofXMLsearchingbecomesthekeypointofrecentresearch.WithstudyingthespecificsofXMLdata,theXMLindexismadeonthebasisofSchema.Mainlydividedintofourtasks
8、:designfornodecodingmethods、designandmemoryofindexconstruction、therealizationofpathqueryandthemaintenanceofindex.Nodecoding,mainlybasedontherangecoding,adaptstosomeinstanceandaddsseveralnewnumericfieldstosupp