資源描述:
《基于olap的數(shù)據(jù)倉庫索引技術(shù)研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、中南大學(xué)碩士學(xué)位論文基于OLAP的數(shù)據(jù)倉庫索引技術(shù)研究姓名:喻興標(biāo)申請學(xué)位級別:碩士專業(yè):計算機應(yīng)用技術(shù)指導(dǎo)教師:蔣外文20050301摘要數(shù)據(jù)倉庫索引技術(shù)是基于傳統(tǒng)數(shù)據(jù)庫索引技術(shù)發(fā)展起來的數(shù)據(jù)倉庫查詢優(yōu)化方法。數(shù)據(jù)倉庫索引技術(shù)主要有樹形索引和位圖索引兩種方法。本文就這兩種索引結(jié)構(gòu)的主要特點,應(yīng)用范圍和發(fā)展前景作了一些深入的探討和研究,為這兩種數(shù)據(jù)倉庫索引技術(shù)的廣泛應(yīng)用奠定基礎(chǔ)。樹形索引結(jié)構(gòu)是適用于高基數(shù)維屬性的索引技術(shù),R一樹索引基于傳統(tǒng)B一樹索引技術(shù)而發(fā)展成為主流的數(shù)據(jù)倉庫多維索引結(jié)構(gòu),具有結(jié)構(gòu)簡單、易于維護及適用范圍廣等優(yōu)點,缺點是索引子空間重疊數(shù)據(jù)過多,導(dǎo)致查詢
2、路徑失效,影響查詢性能。四叉樹是用超平面的方法來組織索引結(jié)構(gòu)的一類索引機制,具有查詢速度快,插入和刪除操作簡單方便的優(yōu)點。QR一樹索引結(jié)合四叉樹和R一樹的各自優(yōu)點,既可以滿足較高的存儲效率,又避免太多的無效查找,達到較好的查找性能。為此,我們在這里特別討論數(shù)據(jù)倉庫的一種新型多維索引--QR-樹索引,分析其多維索引結(jié)構(gòu)的特點,給出其插入,刪除及查詢操作偽碼算法,并與R一樹索引的操作性能進行比較,實驗證明,QR一樹索引是一種比較理想的多維索引結(jié)構(gòu),將會有良好的發(fā)展應(yīng)用前景。位圖索引是另外一種比較重要的數(shù)據(jù)倉庫索引技術(shù),主要基于二進制邏輯運算的簡化操作來達到查詢優(yōu)化的目的。位
3、圖索引的主要特點是查詢效率比較高,實現(xiàn)起來比較簡單,具有很強的可操作性。主流的位圖索引技術(shù)是分段位圖索引,分段索引降低了索引存儲的空間開銷,但也增加了掃描位圖的個數(shù),為了平衡這兩者之間的矛盾,可以采用二進制邏輯運算的合并簡化操作來實現(xiàn)優(yōu)化查詢的目的。本文就位圖索引的成員查詢合并簡化算法作了一些改進,使得算法的效率得到了一定程度的提高,實驗證明,算法的改進有效地優(yōu)化了查詢過程,取得了預(yù)期的效益??偟膩碚f,數(shù)據(jù)倉庫的索引技術(shù)還是一個比較新的課題,R一樹索引和位圖索引各有所長,綜合這兩種索引的特點而設(shè)計的混合索引也有比較好的查詢性能,是一種適用性很廣,很有發(fā)展前途的索引技術(shù)。
4、關(guān)鍵詞數(shù)據(jù)倉庫,樹形索引,位圖索引,聯(lián)機分析處理ABSTRACTDatawarehouseindextechnologyisadatawarehousequeryoptimizationmethoddevelopingfromthetraditionaldatabaseindextechnology.DatawarehouseindextechnologymainlyincludesTreeIndexandBitmapIndextwomethods.ThisarticlehasdonesomedeepdiscussionandresearchWOrksaboutmain
5、feature,applicationareaanddevelopmentprospectoftwoindexstructurestheoreticallyfoundingthewideapplicationoftwoindextechnologies.TreeIndexstructureissuitableforhigh—cardinalitydimensionattribute,R—Treebecomesmainstreamdatawarehousemulti.dimensionindexstructure,anditsadvantageincludessimple
6、structure,easymaintenance,wide-applicationarea,itsdisadvantagecoversthatindexsubspacedatasuperposesredundancyandleadstoquerypathsinvalidation,influencingthequeryefficiency.Quadtreeorganizesindexstructurebythewayofsuper-plane,andposestheadvantageoffastqueryspeed,convenientinsertionanddele
7、tionexecution.QR-TreeindexcombinestheadvantageofQuadtreeandR-Tree,notonlyservestheneedofhighstoringefficiency,butalsoavoidofmanyinvalidationquery,inordertOachievegoodquerycapability.Hence,hereweespeciallydiscussanewdatawarehousemulti-dimensionQR-Treeindex,andanalyzethefea