資源描述:
《數(shù)據(jù)倉庫中ods基礎(chǔ)學(xué)習(xí)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、數(shù)據(jù)倉庫中ODS基礎(chǔ)學(xué)習(xí)>>教育資源庫 根據(jù)Bill.Inmon的定義,數(shù)據(jù)倉庫是面向主題的、集成的、穩(wěn)定的、隨時間變化的,主要用于決策支持的數(shù)據(jù)庫系統(tǒng) ODS是一個面向主題的、集成的、可變的、當(dāng)前的細節(jié)數(shù)據(jù)集合,用于支持企業(yè)對于即時性的、操作性的、集成的全體信息的需求。常常被作為數(shù)據(jù)倉庫的過渡,也是數(shù)據(jù)倉庫項目的可選項之一?! ≡贙imball的<<數(shù)據(jù)倉庫生命周期工具集TheDataWareHouseLiftcycleToolkit>>,他是這樣定義的: 1.是操作型系統(tǒng)中的集成,用于當(dāng)前,歷史以及其它細節(jié)查詢(業(yè)
2、務(wù)系統(tǒng)的一部分); 2.為決策支持提供當(dāng)前細節(jié)數(shù)據(jù)(數(shù)據(jù)倉庫的一部分)?! ∫虼瞬僮鲾?shù)據(jù)存儲(ODS)是用于支持企業(yè)日常的全局應(yīng)用的數(shù)據(jù)集合,ODS的數(shù)據(jù)具有面向主題、集成的、可變的和數(shù)據(jù)是當(dāng)前的或是接近當(dāng)前的4個基本特征。同樣也可以看出ODS是介于DB和DW之間的一種數(shù)據(jù)存儲技術(shù),和原來面向應(yīng)用的分散的DB相比,ODS中的數(shù)據(jù)組織方式和數(shù)據(jù)倉庫(DW)一樣也是面向主題的和集成的,所以對進入ODS的數(shù)據(jù)也象進入數(shù)據(jù)倉庫的數(shù)據(jù)一樣進行集成處理。另外ODS只是存放當(dāng)前或接近當(dāng)前的數(shù)據(jù),如果需要的話還可以對ODS中的數(shù)據(jù)進行增、刪和更新等操作,雖然DW
3、中的數(shù)據(jù)也是面向主題和集成的,但這些數(shù)據(jù)一般不進行修改,所以O(shè)DS和DW的區(qū)別主要體現(xiàn)數(shù)據(jù)的可變性、當(dāng)前性、穩(wěn)定性、匯總度上?! ∮捎贠DS仍然存儲在普通的關(guān)系數(shù)據(jù)庫中,出于性能、存儲和備份恢復(fù)等數(shù)據(jù)庫的角度以及對源數(shù)據(jù)庫的性能影響角度,個人不建議ODS保存相當(dāng)長周期的數(shù)據(jù),同樣ODS中的數(shù)據(jù)也盡量不做轉(zhuǎn)換,而是原封不動地與業(yè)務(wù)數(shù)據(jù)庫保持一致。即ODS只是業(yè)務(wù)數(shù)據(jù)庫的一個備份或者映像,目的是為了使數(shù)據(jù)倉庫的處理和決策支持要求與OLTP系統(tǒng)相隔離,減少決策支持要求對OLTP系統(tǒng)的影響。 為什么需要有一個ODS系統(tǒng)呢?一般在帶有ODS的系統(tǒng)體系結(jié)構(gòu)中
4、,ODS都具備如下幾個作用: 1.在業(yè)務(wù)系統(tǒng)和數(shù)據(jù)倉庫之間形成一個隔離層 一般的數(shù)據(jù)倉庫應(yīng)用系統(tǒng)都具有非常復(fù)雜的數(shù)據(jù),這些數(shù)據(jù)存放在不同的地理位置、不同的數(shù)據(jù)庫、不同的應(yīng)用之中,從這些業(yè)務(wù)系統(tǒng)對數(shù)據(jù)進行抽取并不是一件容易的事。因此,ODS用于存放從業(yè)務(wù)系統(tǒng)直接抽取出來的數(shù)據(jù),這些數(shù)據(jù)從數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)之間的邏輯關(guān)系上都與業(yè)務(wù)系統(tǒng)基本保持一致,因此在抽取過程中極大降低了數(shù)據(jù)轉(zhuǎn)化的復(fù)雜性,而主要關(guān)注數(shù)據(jù)抽取的接口、數(shù)據(jù)量大小、抽取方式等方面的問題?! ?.轉(zhuǎn)移一部分業(yè)務(wù)系統(tǒng)細節(jié)查詢的功能 在數(shù)據(jù)倉庫建立之前,大量的報表、分析是由業(yè)務(wù)系統(tǒng)直接支持的,
5、在一些比較復(fù)雜的報表生成過程中,對業(yè)務(wù)系統(tǒng)的運行產(chǎn)生相當(dāng)大的壓力。ODS的數(shù)據(jù)從粒度、組織方式等各個方面都保持了與業(yè)務(wù)系統(tǒng)的一致,那么原來由業(yè)務(wù)系統(tǒng)產(chǎn)生的報表、細節(jié)數(shù)據(jù)的查詢自然能夠從ODS中進行,從而降低業(yè)務(wù)系統(tǒng)的查詢壓力。 3.完成數(shù)據(jù)倉庫中不能完成的一些功能 一般來說,帶有ODS的數(shù)據(jù)倉庫體系結(jié)構(gòu)中,DW層所存儲的數(shù)據(jù)都是進行匯總過的數(shù)據(jù)和運營指標(biāo),并不存儲每筆交易產(chǎn)生的細節(jié)數(shù)據(jù),但是在某些特殊的應(yīng)用中,可能需要對交易細節(jié)數(shù)據(jù)進行查詢,這時就需要把細節(jié)數(shù)據(jù)查詢的功能轉(zhuǎn)移到ODS來完成,而且ODS的數(shù)據(jù)模型按照面向主題的方式進行存儲,可以方
6、便地支持多維分析等查詢功能。即數(shù)據(jù)倉庫從宏觀角度滿足企業(yè)的決策支持要求,而ODS層則從微觀角度反映細節(jié)交易數(shù)據(jù)或者低粒度的數(shù)據(jù)查詢要求?! ≡谝粋€沒有ODS層的數(shù)據(jù)倉庫應(yīng)用系統(tǒng)體系結(jié)構(gòu)中,數(shù)據(jù)倉庫中存儲的數(shù)據(jù)粒度是根據(jù)需要而確定的,但一般來說,最為細節(jié)的業(yè)務(wù)數(shù)據(jù)也是需要保留的,實際上也就相當(dāng)于ODS,但與ODS所不同的是,這時的細節(jié)數(shù)據(jù)不是當(dāng)前、不斷變化的數(shù)據(jù),而是歷史的,不再變化的數(shù)據(jù)。這樣的數(shù)據(jù)倉庫的存儲壓力和性能壓力都是比較大的,因此對數(shù)據(jù)倉庫的物理設(shè)計和邏輯設(shè)計提出了更高的要求。>>>>這篇文章來自..,。