資源描述:
《數(shù)據(jù)倉庫查詢優(yōu)化方法及索引技術(shù)的研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、數(shù)據(jù)倉庫查詢優(yōu)化方法及索引技術(shù)研究摘要商業(yè)智能市場日漸繁榮,作為其三大支撐技術(shù)的數(shù)據(jù)倉庫、聯(lián)機(jī)分析處理和數(shù)據(jù)挖掘也是學(xué)術(shù)領(lǐng)域研究、討論的熱點(diǎn)。數(shù)據(jù)倉庫存儲大量歷史數(shù)據(jù),是決策支持系統(tǒng)和聯(lián)機(jī)分析處理的結(jié)構(gòu)化數(shù)據(jù)環(huán)境,而聯(lián)機(jī)分析處理又涉及到對大面積歷史數(shù)據(jù)的復(fù)雜查詢,因此提升數(shù)據(jù)倉庫查詢效率成為提升數(shù)據(jù)倉庫應(yīng)用和聯(lián)機(jī)分析處理應(yīng)用的關(guān)鍵問題之一。本文首先介紹了數(shù)據(jù)倉庫、聯(lián)機(jī)分析處理技術(shù)的理論基礎(chǔ)和應(yīng)用領(lǐng)域。接著重點(diǎn)分析了數(shù)據(jù)倉庫的查詢性能問題,介紹目前主流解決方案:查詢優(yōu)化、物化視圖和索引技術(shù)。其中詳細(xì)地介紹了數(shù)
2、據(jù)倉庫中常用的索引技術(shù)分類,繼而進(jìn)一步介紹多種索引技術(shù),包括B樹索引及改進(jìn)的B一樹、B+樹和B木樹的基本概念、原理和方法,以及位圖索引、倒排索引、連接索引和散列表的基本內(nèi)容。在此基礎(chǔ)上,本文提出一種新的索引模型一綜合索引,并給出建立和使用該模型的算法,它吸收了多種索引的特點(diǎn)。綜合索引基于數(shù)據(jù)倉庫本身組織和OLAP查詢的特點(diǎn),結(jié)合倒排索引、連接索引和聚集表。該索引在保證對常用查詢性能較高提升的基礎(chǔ)上,也提升了非常用查詢的效率。本文還提出對綜合索引的進(jìn)一步優(yōu)化方法,分析多種情況下綜合索引的時間和空間性能,并設(shè)計(jì)
3、實(shí)驗(yàn)驗(yàn)證綜合索引的性能情況。理論分析和實(shí)驗(yàn)結(jié)果表明綜合索引是有效的。關(guān)鍵詞:數(shù)據(jù)倉庫;聯(lián)機(jī)分析處理;物化視圖;索引技術(shù);綜合索引模型ResearchofQueryOptimizationandIndexofDataWarehouseAbstractBusinessintelligencemarketscaleflourishesunconventionally.ThethreemainsupportingtechnologiesofBI,datawarehousing,onlineanalyticalpro
4、cessinganddatamining,arealsothehottopicofacademicresearchanddiscussion.Datawarehouseswhichstoresvolumesofhistoricaldata,arethestructureddataenvironmentofdecisionsupportsystemandonlineanalyticalprocessing,andonlineanalyticalprocessingalsoinvolvesthecomplexq
5、ueriesinmassdata.Therefore,toenhancetheefficiencyofdatawarehousequeriesbecomesoneofthekeyissuesofimprovingtheefficiencyofdatawarehousingapplicationsandonlineanalyticalprocessingapplications.Thisdissertationintroducesthetheoreticalbasisofdatawarehouseandonl
6、ineanalyticalprocessingtechnologyatfirst,thenthediscussionsfocusontheanalysisofdatawarehouse’Squeryperformance.Therearemainlythreemethodstosolvetheproblematcurrent:materializedview,queryoptimizationandindextechnology.Thispaperintroducestheclassificationofi
7、ndexandgivesadetaileddescriptiononbasicconcepts,principlesandmethodsofcommonlyusedindextechnologiesindatawarehouse,includingtheBtree,B—tree,B+tree,B木tree,bitmap,invertedindex,joinindexandhashtable.Basedontheabove,thispaperproposesanewintegrativeindexmodelw
8、hichiscalledBBIandgivesthemethodstobuildandusethemodel.BasedonthefeatureofDataWarehouseandOLAPqueries,thisindexmodelisbuiltwithinvertedindex,aggregationtable,bitmapindexandb-tree.Itnotonlygreatlypromotestheef