資源描述:
《分布式數(shù)據(jù)庫的查詢優(yōu)化算法研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、分布式數(shù)據(jù)庫的查詢優(yōu)化算法研究摘要本文首先介紹了分布式數(shù)據(jù)庫系統(tǒng)的基本概念,如分布式數(shù)據(jù)庫系統(tǒng)的模式結(jié)構(gòu)及體系結(jié)構(gòu)、數(shù)據(jù)分片的原則及分類、數(shù)據(jù)分布的策略等;然后簡要描述了分布式查詢的處理過程:接著本文重點(diǎn)研究了分布式查詢的一些常用優(yōu)化算法,如基于關(guān)系代數(shù)等價(jià)變換規(guī)則的優(yōu)化算法、基于連接的優(yōu)化算法、基于半連接的優(yōu)化算法、SDD1算法,基于查詢圖的貪婪算法。本文在對分布式查詢的一些常用優(yōu)化算法研究的基礎(chǔ)上,設(shè)計(jì)了一個(gè)新的算法,本文稱之為基于多關(guān)系半連接查詢優(yōu)化算法,以適用于以分布式數(shù)據(jù)庫系統(tǒng)的緩沖區(qū)作為查詢的中間結(jié)果的最后裝配站點(diǎn)這種情況。實(shí)驗(yàn)證明基于多
2、關(guān)系半連接的查詢優(yōu)化算法明顯地減少了中間結(jié)果數(shù)據(jù)量,有效地降低了網(wǎng)絡(luò)通信總代價(jià)。關(guān)鍵字:分布式數(shù)據(jù)庫,查詢優(yōu)化,SDD1,多關(guān)系半連接ResearchonQueryOptimizationAlgorithmofDistributedDataBaseAbstractThispaperintroducesthebasicconceptofdistributeddatabasesystem,suchasthemodearchitectureandsystemarchitectureofDDBS,theprincipleandclassificationof
3、datafragmentation,thestrategyofdatadistribution.Thispaperdescribesthemanagementprocessingofdistributedquery.Thispapergiveemphasistotheresearchontheregularoptimizationalgorithmsofdistributedquery,suchastheoptimizationalgorithmbasedontheregulationofrelationalgebraequivalencetrans
4、formation,theoptimizationalgorithmbasedonjoin,theoptimizationalgorithmbasedonsemijoin,SDD_1algorithm,thegreedyalgorithmbasedonquerygraph.OnthebasisoftheresearchontheSDD_1algorithmandthegreedyalgorithmbasedonquerygraph,thispaperdesignanewalgorithmnamedthequeryoptimizationalgorit
5、hmbasedonmultiplerelationssemijoin,whichintegratethecharacteristicsofSDD_1algorithmandthegreedyalgorithmbasedonquerygraph,thisnewalgorithmcanbeappliedtothecircumstanceinwhichthecacheofDDBSisthefinalassemblysiteoftemporaryqueryresult.Thealgorithmreducethetemporaryresultdatanumer
6、distinctlyandreducethenetworkcommunicationtotalcosteficientlythroughexperiment.Keywords:distributeddatabase,queryoptimization,SDD_l,multiplerelationssemiloin上海師范大學(xué)碩士學(xué)位論文分布式數(shù)據(jù)庫的查詢優(yōu)化算法研究h在--p}己!-1-只7-F‘J.「】1.1論文背景分布式數(shù)據(jù)庫系統(tǒng)是計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)與數(shù)據(jù)庫技術(shù)互相滲透和有機(jī)結(jié)合的產(chǎn)物。具有數(shù)據(jù)獨(dú)立性、集中與自制相結(jié)合的控制機(jī)制、適當(dāng)增加數(shù)據(jù)冗余、事
7、務(wù)管理的分布性等特點(diǎn)。在分布式數(shù)據(jù)庫系統(tǒng)中,數(shù)據(jù)獨(dú)立性除了數(shù)據(jù)的邏輯獨(dú)立性與物理獨(dú)立性外,還有數(shù)據(jù)分布獨(dú)立性亦稱分布透明性。分布透明性指用戶不必關(guān)心數(shù)據(jù)的邏輯分片,不必關(guān)心數(shù)據(jù)物理位置分布的細(xì)節(jié),也不必關(guān)心重復(fù)副本的一致性問題,同時(shí)也不必關(guān)心局部場地上數(shù)據(jù)庫支持哪種數(shù)據(jù)模型。有了分布透明性,用戶的查詢程序書寫起來就如同數(shù)據(jù)沒有分布一樣,使系統(tǒng)使用起來更簡單、有效。在集中式數(shù)據(jù)庫系統(tǒng)中,為減少空間的浪費(fèi)和保證數(shù)據(jù)的一致性,要盡量減少數(shù)據(jù)的冗余。而分布式數(shù)據(jù)庫系統(tǒng)卻希望增加數(shù)據(jù)的冗余來提高系統(tǒng)的可靠性、可用性和改善系統(tǒng)性能。但是由于數(shù)據(jù)的分布和冗余,使得
8、分布式數(shù)據(jù)庫系統(tǒng)查詢處理增加了許多新的內(nèi)容和復(fù)雜性,因此分布式查詢處理的優(yōu)化顯得更為重要。無論是在集中式數(shù)據(jù)