資源描述:
《XML文檔在關系數據庫中的存儲研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、維普資訊http://www.cqvip.com第30卷第3期黑龍江電力2008年6月XML文檔在關系數據庫中的存儲研究陳樺,張亮(陜西科技大學電氣與信息工程學院,陜西西安710072)摘要:XML目前正在成為各種數據庫特別是文檔的首選格式。由于其具有標記不同字段的能力,使得搜索變得更簡單和動態(tài)化。那么,怎樣管理XML標記的數據呢?基于關系的XML數據處理是一種可行而有前景的方式,受到了廣泛的關注。然而由于數據模型的差異,利用關系數據庫查詢處理XML數據給傳統(tǒng)數據庫技術帶來新的挑戰(zhàn)。介紹一種基于DTD的XML關系數據庫存儲方法,
2、該方法分別針對DTD和XML文檔建立獨立的表結構和索引,從而提高查詢效率。關鍵詞:XML;關系數據庫;DTD中圈分類號:TP311文獻標識碼:A文章編號:1002—1663(2008)03—0185—04MemorizingstudyofXMLfileinrelationaldatabaseCHENHua,ZHANGLiang(SchoolofElectricandInformationEngineering,s瘟UniversityofScience&Technology,Xian710072,China)Abstract:X
3、MLhasbeenapreferredformatforallkindsofdatabase,especiallyforfile.Itmakessearcheasierandmoresimpleduetoitscapacityofmarkupdiferentfields.HowtomanagethedatabasethatXMLmarkedup?dataprocessingwithXMLbasedonrelationisafeasiblemeanwithwideprospect.However,usingrela-tionald
4、atabaseseal"chesandprocessesXMLdatabringsoutdificultiesfortraditionaldatabaseduetodiferentdatamode1.ThepaperdiscussedthememorizingmethodofXMLrelationaldatabasebasedonDTD,whichseparatelysetsupthedependentliststructureandindexfocusingonDTDandXMLfilesandhashi【sheficien-
5、cyinsearch.Keywords:extensiblemarkuplanguage(XML);relationaldatabase;datatypedefinition(DTD)1XML文檔的存儲方式方式在查詢處理方面也存在明顯的弱點,首先該法在每次瀏覽和查詢文檔時都要重復解析文檔。當前,XML文檔的基本存儲方式可分為三其次,整個文檔在查詢處理過程中都要駐留內存。類:文件系統(tǒng)、存儲管理器和數據庫管理系統(tǒng)。盡管可以在內存中為文檔建立索引,通過索引來1.1文件系統(tǒng)定位查詢所需要的部分,維護這種索引的代價將文件系統(tǒng)用來存儲和檢索
6、XML數據,它是管十分昂貴。理XML最原始的方式?;谖募腦ML存儲系1.2存儲管理器統(tǒng)將XML直接存儲為文本文件,由于文件系統(tǒng)本由于XML數據與半結構化數據十分相似,利身不具備查詢處理XML數據的能力,在處理查詢用半結構化數據倉庫來管理XML數據似乎是一時需要將XML文檔解析為內存中的DOM樹結構?;谖募腦ML存儲系統(tǒng)簡單并容易實現(xiàn),種比較自然的方式。在這種方法中,XML數據被無須使用底層的數據庫或對象存儲管理,同時由聚簇存儲為有向圖。Stanford大學的Lore項目在于XML文檔被直接存儲為文本文件,這種存儲方這方面
7、作了初步的嘗試。然而當年的半結構化數式無須存儲轉換和重構查詢結果。但是這種存儲據庫技術尚不成熟,利用半結構化數據倉庫處理收稿日期:2007—09—27作者簡介:陳樺(1962一),男,陜西科技大學教授,博士,碩士研究生導師?!?——185·-——維普資訊http://www.cqvip.comVo1.30,No.3HeilongjiangElectricPowerXML查詢的性能仍然難以讓人滿意。行的辦法是將XML文檔解析成圖結構,然后提供1.3數據庫管理系統(tǒng)相應的關系模式來存儲這些圖結構;第三種方法更有效的存儲方式是使用數據庫
8、管理系統(tǒng)來是把XML文檔結構(如DTD)直接映射到數據庫管理XML數據。根據數據庫管理系統(tǒng)的不同,存關系模式,再將XML文檔數據存放到這些模式對儲方式又可以分為基于關系的XML數據庫系統(tǒng),應的關系表中。面向對象的XML數據庫系統(tǒng)和原生的XML數據XML文檔被作為