基于關(guān)系數(shù)據(jù)庫XML數(shù)據(jù)存儲方法的研究

基于關(guān)系數(shù)據(jù)庫XML數(shù)據(jù)存儲方法的研究

ID:40643079

大?。?61.00 KB

頁數(shù):4頁

時(shí)間:2019-08-05

基于關(guān)系數(shù)據(jù)庫XML數(shù)據(jù)存儲方法的研究_第1頁
基于關(guān)系數(shù)據(jù)庫XML數(shù)據(jù)存儲方法的研究_第2頁
基于關(guān)系數(shù)據(jù)庫XML數(shù)據(jù)存儲方法的研究_第3頁
基于關(guān)系數(shù)據(jù)庫XML數(shù)據(jù)存儲方法的研究_第4頁
資源描述:

《基于關(guān)系數(shù)據(jù)庫XML數(shù)據(jù)存儲方法的研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫

1、基于關(guān)系數(shù)據(jù)庫的XML數(shù)據(jù)在存儲方法的研究賴世鋒,蔣年德(東華理工大學(xué)撫州344000)摘要:分析和研究了XML數(shù)據(jù)在關(guān)系數(shù)據(jù)庫中的存儲方法,本文提出了全面的存儲方法,此種存儲方法是基于查詢代價(jià)的,首先通過轉(zhuǎn)換接口把XMLDTD轉(zhuǎn)換為XMLSchema,然后通過DOM樹解析工具得到初始模式,接著通過模式轉(zhuǎn)換操作獲取模式空間,之后引入了以哈希連接算法為基礎(chǔ)的代價(jià)模型,用改進(jìn)的算法從模式空間中找出一個(gè)最優(yōu)的模式,提高了存儲方法的性能。最后,通過實(shí)驗(yàn)證明改進(jìn)后的映射方法與經(jīng)典的伯哈農(nóng)存儲方法相比較具有更好的性能。關(guān)鍵詞:XML;數(shù)據(jù)存儲;關(guān)系數(shù)據(jù)庫Resea

2、rchonXMLdatastoragemethodwhichbasedonRelationaldatabaseLAIShi-feng,JIANGNian-de(EastChinaInstituteofTechnology,Fuzhou,344000)Abstract:AnalysisandresearchoftheXMLdatastoredinarelationaldatabaseapproach,inthispaper,acomprehensivestoragemethodisputforward.Thisstoragemethodisbasedon

3、thequerycost.Firstofall,throughtheconversioninterface,theXMLDTDintoXMLSchema,ThenusetheDOMtreeanalysistoolgettheinitialmodeofanalysistools,Thenusethemodeconversiontoobtainpatternspace,aftertheintroductiontohashjoinalgorithmbasedoncostmodel,improvedmethodisusedfromthemodelspaceto

4、findabestmodel,improvetheperformanceofthestoragemethod.Finally,experimentsshowsthatimprovedmappingmethodandtheclassicalBohannonstoragemethodhavebetterperformancecompared.Keywords:XML;DataStorage;Relationaldatabase1引言XML是ExtensibleMarkupLanguage的縮寫,XML數(shù)據(jù)的可擴(kuò)展性和自我描述性使得它成為當(dāng)前網(wǎng)絡(luò)上數(shù)據(jù)傳輸?shù)?/p>

5、主要形式,但是它對數(shù)據(jù)的處理能力卻相當(dāng)?shù)挠邢?,?shí)現(xiàn)XML存儲為關(guān)系數(shù)據(jù)庫以后,就可以利用關(guān)系數(shù)據(jù)庫所帶有的存儲管理等技術(shù)來處理XML數(shù)據(jù),所以把XML轉(zhuǎn)換為關(guān)系數(shù)據(jù)庫存儲方式是很有研究價(jià)值的。通過對XML數(shù)據(jù)在關(guān)系數(shù)據(jù)庫中的存儲方法的研究,發(fā)現(xiàn)基于DTD的存儲方法不能夠適應(yīng)XML文檔以XMLSchema為標(biāo)準(zhǔn)的趨勢[1],伯哈農(nóng)存儲方法的搜索算法不夠高效且轉(zhuǎn)換規(guī)則存在一些漏洞等問題。因此,本文提出了一種全面的存儲方法。2XML數(shù)據(jù)在關(guān)系數(shù)據(jù)庫中的存儲方法2.1存儲方法的主要思想由于關(guān)系數(shù)據(jù)是一種結(jié)構(gòu)化的數(shù)據(jù),它以扁平的二維關(guān)系表存儲在關(guān)系數(shù)據(jù)庫,而XM

6、L數(shù)據(jù)是半結(jié)構(gòu)化的,所以要實(shí)現(xiàn)存儲,必需進(jìn)行模式映射[2]。大多XML文檔是基于DTD(DocumentTypeDefinition)模式,因此這里從DTD開始著手對數(shù)據(jù)的轉(zhuǎn)化。存儲的主要思想如下:(1)由于XMLSchema已成為XML文檔定義的大勢所趨,所以先把DTD轉(zhuǎn)化成XMLSchema,實(shí)現(xiàn)XML文檔定義的標(biāo)準(zhǔn)化。(2)轉(zhuǎn)換XMLSchema為DOM樹模型。(3)利用不同的規(guī)則生成全部的模式空間,再利用哈希連接算法生成的模型來進(jìn)行評估,找出最優(yōu)的查詢代價(jià)模式。(4)利用選擇算法搜索出最優(yōu)的模式,但是這個(gè)模式還不是關(guān)系模式,需要通過規(guī)則并且利用

7、DOM樹把它映射為關(guān)系模式。整個(gè)存儲方法過程如圖2.1所示:圖2.1存儲方法的過程2.2存儲方法的具體步驟2.2.1XMLDTD到XMLSchema的轉(zhuǎn)換過程本文實(shí)現(xiàn)的XMLDTD到XMLschema的轉(zhuǎn)化工具[3]是一個(gè)公開的C#類,類名為FiSchemaOutPutFromDTD,通過此類中的四種方法可以實(shí)現(xiàn)從XMLDTD到XMLSchema的轉(zhuǎn)換。2.2.2生成初始模式利用DOM樹文檔模式的生成算法,產(chǎn)生DOM樹文檔模式,也就是模式空間的初始模式,算法如下:初始化DOM樹文檔模式為空;while(XMLSchema中當(dāng)前訪問元素不為空)do{sw

8、itch(當(dāng)前訪問的元素){case復(fù)雜元素:為該復(fù)雜元素創(chuàng)建新的類型并標(biāo)注為已訪問;brea

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時(shí)可能會顯示錯(cuò)亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。