資源描述:
《數(shù)據(jù)倉庫中ods基礎學習》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、數(shù)據(jù)倉庫中ODS基礎學習>>教育資源庫 根據(jù)Bill.Inmon的定義,數(shù)據(jù)倉庫是面向主題的、集成的、穩(wěn)定的、隨時間變化的,主要用于決策支持的數(shù)據(jù)庫系統(tǒng) ODS是一個面向主題的、集成的、可變的、當前的細節(jié)數(shù)據(jù)集合,用于支持企業(yè)對于即時性的、操作性的、集成的全體信息的需求。常常被作為數(shù)據(jù)倉庫的過渡,也是數(shù)據(jù)倉庫項目的可選項之一?! ≡贙imball的<<數(shù)據(jù)倉庫生命周期工具集TheDataWareHouseLiftcycleToolkit>>,他是這樣定義的: 1.是操作型系統(tǒng)中的集成,用于當前,歷史以及其它細節(jié)查詢(業(yè)
2、務系統(tǒng)的一部分); 2.為決策支持提供當前細節(jié)數(shù)據(jù)(數(shù)據(jù)倉庫的一部分)。 因此操作數(shù)據(jù)存儲(ODS)是用于支持企業(yè)日常的全局應用的數(shù)據(jù)集合,ODS的數(shù)據(jù)具有面向主題、集成的、可變的和數(shù)據(jù)是當前的或是接近當前的4個基本特征。同樣也可以看出ODS是介于DB和DW之間的一種數(shù)據(jù)存儲技術,和原來面向應用的分散的DB相比,ODS中的數(shù)據(jù)組織方式和數(shù)據(jù)倉庫(DW)一樣也是面向主題的和集成的,所以對進入ODS的數(shù)據(jù)也象進入數(shù)據(jù)倉庫的數(shù)據(jù)一樣進行集成處理。另外ODS只是存放當前或接近當前的數(shù)據(jù),如果需要的話還可以對ODS中的數(shù)據(jù)進行增、刪和更新等操作,雖然DW
3、中的數(shù)據(jù)也是面向主題和集成的,但這些數(shù)據(jù)一般不進行修改,所以ODS和DW的區(qū)別主要體現(xiàn)數(shù)據(jù)的可變性、當前性、穩(wěn)定性、匯總度上。 由于ODS仍然存儲在普通的關系數(shù)據(jù)庫中,出于性能、存儲和備份恢復等數(shù)據(jù)庫的角度以及對源數(shù)據(jù)庫的性能影響角度,個人不建議ODS保存相當長周期的數(shù)據(jù),同樣ODS中的數(shù)據(jù)也盡量不做轉換,而是原封不動地與業(yè)務數(shù)據(jù)庫保持一致。即ODS只是業(yè)務數(shù)據(jù)庫的一個備份或者映像,目的是為了使數(shù)據(jù)倉庫的處理和決策支持要求與OLTP系統(tǒng)相隔離,減少決策支持要求對OLTP系統(tǒng)的影響?! 槭裁葱枰幸粋€ODS系統(tǒng)呢?一般在帶有ODS的系統(tǒng)體系結構中
4、,ODS都具備如下幾個作用: 1.在業(yè)務系統(tǒng)和數(shù)據(jù)倉庫之間形成一個隔離層 一般的數(shù)據(jù)倉庫應用系統(tǒng)都具有非常復雜的數(shù)據(jù),這些數(shù)據(jù)存放在不同的地理位置、不同的數(shù)據(jù)庫、不同的應用之中,從這些業(yè)務系統(tǒng)對數(shù)據(jù)進行抽取并不是一件容易的事。因此,ODS用于存放從業(yè)務系統(tǒng)直接抽取出來的數(shù)據(jù),這些數(shù)據(jù)從數(shù)據(jù)結構、數(shù)據(jù)之間的邏輯關系上都與業(yè)務系統(tǒng)基本保持一致,因此在抽取過程中極大降低了數(shù)據(jù)轉化的復雜性,而主要關注數(shù)據(jù)抽取的接口、數(shù)據(jù)量大小、抽取方式等方面的問題?! ?.轉移一部分業(yè)務系統(tǒng)細節(jié)查詢的功能 在數(shù)據(jù)倉庫建立之前,大量的報表、分析是由業(yè)務系統(tǒng)直接支持的,
5、在一些比較復雜的報表生成過程中,對業(yè)務系統(tǒng)的運行產(chǎn)生相當大的壓力。ODS的數(shù)據(jù)從粒度、組織方式等各個方面都保持了與業(yè)務系統(tǒng)的一致,那么原來由業(yè)務系統(tǒng)產(chǎn)生的報表、細節(jié)數(shù)據(jù)的查詢自然能夠從ODS中進行,從而降低業(yè)務系統(tǒng)的查詢壓力。 3.完成數(shù)據(jù)倉庫中不能完成的一些功能 一般來說,帶有ODS的數(shù)據(jù)倉庫體系結構中,DW層所存儲的數(shù)據(jù)都是進行匯總過的數(shù)據(jù)和運營指標,并不存儲每筆交易產(chǎn)生的細節(jié)數(shù)據(jù),但是在某些特殊的應用中,可能需要對交易細節(jié)數(shù)據(jù)進行查詢,這時就需要把細節(jié)數(shù)據(jù)查詢的功能轉移到ODS來完成,而且ODS的數(shù)據(jù)模型按照面向主題的方式進行存儲,可以方
6、便地支持多維分析等查詢功能。即數(shù)據(jù)倉庫從宏觀角度滿足企業(yè)的決策支持要求,而ODS層則從微觀角度反映細節(jié)交易數(shù)據(jù)或者低粒度的數(shù)據(jù)查詢要求?! ≡谝粋€沒有ODS層的數(shù)據(jù)倉庫應用系統(tǒng)體系結構中,數(shù)據(jù)倉庫中存儲的數(shù)據(jù)粒度是根據(jù)需要而確定的,但一般來說,最為細節(jié)的業(yè)務數(shù)據(jù)也是需要保留的,實際上也就相當于ODS,但與ODS所不同的是,這時的細節(jié)數(shù)據(jù)不是當前、不斷變化的數(shù)據(jù),而是歷史的,不再變化的數(shù)據(jù)。這樣的數(shù)據(jù)倉庫的存儲壓力和性能壓力都是比較大的,因此對數(shù)據(jù)倉庫的物理設計和邏輯設計提出了更高的要求。>>>>這篇文章來自..,。