資源描述:
《時空xml數(shù)據(jù)庫的存儲和索引技術(shù)研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、南京航空航天大學(xué)碩士學(xué)位論文時空XML數(shù)據(jù)庫的存儲和索引技術(shù)研究姓名:徐海燕申請學(xué)位級別:碩士專業(yè):計算機(jī)應(yīng)用技術(shù)指導(dǎo)教師:蔣夏軍20100101南京航空航天大學(xué)碩士學(xué)位論文摘要隨著空間數(shù)據(jù)庫技術(shù)的不斷發(fā)展和人們應(yīng)用的增長,空間數(shù)據(jù)的時域信息的研究越來越受到關(guān)注。在這種情況下,時空數(shù)據(jù)庫的誕生成為了必然。然而時空數(shù)據(jù)量的龐大和非結(jié)構(gòu)化性給時空數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)存儲、訪問以及分析帶來許多困難,尤其在數(shù)據(jù)訪問具有時間限制的應(yīng)用中。而XML的跨平臺性、自描述性等特點(diǎn)很好地適用了時空數(shù)據(jù)的管理需求,但在XML文檔中同時增加時間、空
2、間屬性后,使得在時空XML文檔的查詢變得更加困難。為了提高時空XML文檔上的查詢效率,需要對時空XML建立有效的索引。當(dāng)前時空XML索引的研究成果缺乏,而且很少的相關(guān)資料幾乎集中在地理信息系統(tǒng)(GIS)領(lǐng)域。本文主要研究時空XML數(shù)據(jù)庫索引技術(shù)。針對時態(tài)XML文檔數(shù)據(jù)冗余大的缺點(diǎn),首先,提出將時間信息作為元素文本值前綴的模型,與屬性時戳模型和元素時戳模型相比,該模型避免了引入新的元素或?qū)傩?,降低了存儲空間;利用祖孫元素時間信息的關(guān)聯(lián)性,對三種模型的時態(tài)XML文檔進(jìn)行時間冗余信息消除,進(jìn)一步降低了數(shù)據(jù)冗余性。其次,為了驗證
3、XML存儲方式下時空查詢的有效性,構(gòu)建了時空XML查詢系統(tǒng),并使用XPath進(jìn)行了時態(tài)、空間和時空查詢的實現(xiàn)。接著,提出一種新的時空XML索引方案——℃B+一仃ee,該索引以時間信息作為索引關(guān)鍵字,且在葉子節(jié)點(diǎn)處添加兩類鏈表,實現(xiàn)查詢關(guān)鍵字的二次排序,同時借助實體在文檔中的地址和信息長度隨機(jī)存取實體信息。實驗結(jié)果表明,CB+-tree索引對某些時態(tài)查詢效率較高。最后,鑒于時空XML數(shù)據(jù)庫數(shù)據(jù)更新在特殊情況下對索引動態(tài)性要求較高,而CB+.tree的動態(tài)更新性不佳的缺陷,進(jìn)一步提出時態(tài)信息索引TCB+.tree和地址信息索
4、引ACB+-tree雙重索引方式及文檔冗余存儲方式。實驗結(jié)果表明,結(jié)合冗余存儲方法和雙重索引方法,動態(tài)更新性明顯提高。關(guān)鍵詞:時空XML,時空XML索引,B+-tree索引,時空查詢,動態(tài)更新時空XML數(shù)據(jù)庫的存儲和索引技術(shù)研究ABSTRACTWiththecontinuousdevelopmentofspatialdatabasetechnologyandtheincreasingapplicationofpeople,theresearchoftimeinformationonspatialdatahasattrac
5、tedmoreandmoreattention.Inthissituation,itisinevitablethatspatio-temporaldatabaseappears.Butitbringsmanydifficultiesinstorage、searchandanalysisofdatainspatio-temporaldatabasesystembecauseofthehugevolumeandunstructuredcharacterofspatio·temporaldata,especiallyforse
6、archingsomedatawithtimeconfmes.Withthecharactersofcross-platformandself-description,XMLisadaptingtothemanagingrequirementsofspatio·temporaldata.ButafteraddingtimeandspatialattributeinXMLatthesametime,itbringsmanydifficultiesinqueryingthespatio—temporalXMLdocument
7、.InordertoimprovethequeryefficiencyintemporalXMLdocument,itisnecessarytoconstructindexfortemporalXMLdocument.However,fewresearcheshavebeenproposedontheissueofindexingspatio-temporalXML,andsomerelativepapersareallaboutGISfields.Thepapermainlyfocusesonindexresearch
8、ofspatio-temporalXMLdatabase.AimingatthedisadvantageofdataredundancyintemporalXMLdocument,fLrstly,anewmodelthatputstimeinformationasprefixofelementtextisgiven.