試析基于xml的異構(gòu)數(shù)據(jù)集成研究

試析基于xml的異構(gòu)數(shù)據(jù)集成研究

ID:35123136

大?。?.11 MB

頁(yè)數(shù):59頁(yè)

時(shí)間:2019-03-19

試析基于xml的異構(gòu)數(shù)據(jù)集成研究_第1頁(yè)
試析基于xml的異構(gòu)數(shù)據(jù)集成研究_第2頁(yè)
試析基于xml的異構(gòu)數(shù)據(jù)集成研究_第3頁(yè)
試析基于xml的異構(gòu)數(shù)據(jù)集成研究_第4頁(yè)
試析基于xml的異構(gòu)數(shù)據(jù)集成研究_第5頁(yè)
資源描述:

《試析基于xml的異構(gòu)數(shù)據(jù)集成研究》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、基于XML的異構(gòu)數(shù)據(jù)集成研究重慶大學(xué)碩士學(xué)位論文學(xué)生姓名:張曉劍指導(dǎo)教師:羅軍副教授專(zhuān)業(yè):計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)學(xué)科門(mén)類(lèi):工學(xué)重慶大學(xué)計(jì)算機(jī)學(xué)院二OO八年四月HeterogeneousDataIntegrationStudyBasedOnXMLAThesisSubmittedtoChongqingUniversityinPartialFulfillmentoftheRequirementfortheDegreeofMasterofComputerbyZhangXiaojianSupervisor:AssociateProf.LuoJunMa

2、jor:ComputerSystemArchitectureCollegeofComputerScienceofChongqingUniversity,Chongqing,ChinaApril,2008重大大學(xué)碩士學(xué)位論文中文摘要摘要隨著計(jì)算機(jī)網(wǎng)絡(luò)的飛速發(fā)展和信息化建設(shè)的大力推進(jìn),各種網(wǎng)絡(luò)中可供利用的信息總量正以驚人的速率增長(zhǎng)。但這些為不同應(yīng)用服務(wù)的信息都存儲(chǔ)在許多不同的數(shù)據(jù)源之中,其數(shù)據(jù)內(nèi)容、數(shù)據(jù)格式和數(shù)據(jù)質(zhì)量千差萬(wàn)別,且其管理系統(tǒng)也各不相同。為更有效地利用這些信息,需要對(duì)多個(gè)分布、異構(gòu)和自治的數(shù)據(jù)源中的信息進(jìn)行集成,向用戶(hù)隱藏這

3、些差異,提供給用戶(hù)一個(gè)統(tǒng)一和透明的數(shù)據(jù)訪(fǎng)問(wèn)接口,同時(shí)還需要保持?jǐn)?shù)據(jù)在不同系統(tǒng)上的完整性和一致性。因此,在信息集成過(guò)程中,如何有效解決這些差異是信息集成研究與應(yīng)用領(lǐng)域所面臨的一大挑戰(zhàn)。近年來(lái),隨著XML這樣一種文檔結(jié)構(gòu)描述語(yǔ)言的不斷發(fā)展和壯大,以XML及其相關(guān)技術(shù)為基礎(chǔ)的半結(jié)構(gòu)化信息表示技術(shù)正在影響著信息技術(shù)領(lǐng)域和計(jì)算機(jī)技術(shù)領(lǐng)域發(fā)生著重大的變化,本文探討了如何運(yùn)用XML技術(shù),集成結(jié)構(gòu)化和非結(jié)構(gòu)化的問(wèn)題。論文從以下幾個(gè)方面的內(nèi)容進(jìn)行了闡述:(1)對(duì)集成的數(shù)據(jù)進(jìn)行了分類(lèi),一類(lèi)是結(jié)構(gòu)化數(shù)據(jù),另一類(lèi)是非結(jié)構(gòu)化的數(shù)據(jù)。在這里我們把半結(jié)構(gòu)化的數(shù)據(jù)

4、看做是非結(jié)構(gòu)化數(shù)據(jù)的特殊情況。本文提出一種對(duì)數(shù)據(jù)進(jìn)行分類(lèi)集成的策略,在Mediator/Wrapper的方式下,單獨(dú)構(gòu)建一個(gè)數(shù)據(jù)集成池,專(zhuān)門(mén)用來(lái)整合集成結(jié)構(gòu)化數(shù)據(jù)。(2)詳細(xì)論述了XHDIS信息集成系統(tǒng)原型的各個(gè)功能模塊和系統(tǒng)構(gòu)架。(3)對(duì)信息集成中的相關(guān)技術(shù)進(jìn)行了深入分析,如模式集成及公共數(shù)據(jù)模型和包裝器(Wrapper)模板生成等。(4)由于采用分類(lèi)集成的策略,因而在非結(jié)構(gòu)化數(shù)據(jù)的處理,本文的重點(diǎn)放在了如何通過(guò)定制非結(jié)構(gòu)化數(shù)據(jù)的提取規(guī)制,通過(guò)轉(zhuǎn)化成XML數(shù)據(jù)的形式來(lái)進(jìn)行集成。重點(diǎn)討論了以HTML/XML的Web頁(yè)面的提取規(guī)則。最

5、后在總結(jié)全文的基礎(chǔ)上,結(jié)合其它與集成系統(tǒng)相關(guān)技術(shù)的發(fā)展趨勢(shì),提出了若干有待進(jìn)一步深入研究和探討的問(wèn)題。關(guān)鍵詞:分類(lèi)集成,公共數(shù)據(jù)模型,模式集成,數(shù)據(jù)池,數(shù)據(jù)顆粒I重大大學(xué)碩士學(xué)位論文英文摘要ABSTRACTWiththerapiddevelopmentofcomputernetworksandthestrongadvanceofinformationconstruction,nowtheamountofinformationavailableon-lineisproliferatingatatremendousrated.Howev

6、er,allthoseinformationformanydifferentapplicationsisindependentlystoredinagreatvarietyofdatasourcesandmanagedbydifferentsystems,andtheircontents,structuresandqualityaredifferentinthousandsways.Inordertoutilizethisinformationmoreeffectively,thereisaneedtointegrateinform

7、ationfrommultipledistributed,heterogeneousandautonomoussources,andmakedifferencesinvisibleandprovideuniformandtransparentaccesstothedataforallusers.Inaddition,itisnecessarytopreservedataintegrityandconsistencyoverdifferentsystems.Thus,howtoresolvethosedifferenceseffici

8、entlyisaseverechallengeinthedomainaboutapplicationandresearchofinformationintegration.Theseyears,withincreasingdevelo

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶(hù)上傳,版權(quán)歸屬用戶(hù),天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶(hù)請(qǐng)聯(lián)系客服處理。