資源描述:
《《數(shù)據(jù)倉庫》PPT課件》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在教育資源-天天文庫。
1、數(shù)據(jù)倉庫(DataWarehouse)演講人:沈國峰SQ10058253010制作人:黃健SQ10058253011傅承陽SQ100582530082010年12月14日農(nóng)歷十一月初九從數(shù)據(jù)庫到數(shù)據(jù)倉庫數(shù)據(jù)倉庫的概念數(shù)據(jù)倉庫的特征數(shù)據(jù)倉庫的商業(yè)價值數(shù)據(jù)倉庫的發(fā)展現(xiàn)狀及發(fā)展方向內(nèi)容提要從數(shù)據(jù)庫到數(shù)據(jù)倉庫由數(shù)據(jù)庫(DB)發(fā)展到數(shù)據(jù)倉庫(DW)主要有以下幾點原因:數(shù)據(jù)太多,信息貧乏(datarich,informationpoor):隨著數(shù)據(jù)庫技術的發(fā)展,企事業(yè)單位建立了大量的數(shù)據(jù)庫,數(shù)據(jù)越來越多,而輔助決策信息卻很貧乏,如
2、何將大量的數(shù)據(jù)轉(zhuǎn)化為輔助決策信息成為了研究的熱點。異構(gòu)環(huán)境數(shù)據(jù)的轉(zhuǎn)換與共享:由于各類數(shù)據(jù)庫產(chǎn)品的增加,異構(gòu)環(huán)境的數(shù)據(jù)隨之增加,如何實現(xiàn)這些異構(gòu)環(huán)境數(shù)據(jù)的轉(zhuǎn)換和共享也成了研究的熱點。利用數(shù)據(jù)進行事務處理轉(zhuǎn)變?yōu)槔脭?shù)據(jù)支持決策:數(shù)據(jù)庫用于事務處理,若要達到輔助決策,則需要更多的數(shù)據(jù),例如:如何利用歷史數(shù)據(jù)的分析來進行預測。對大量數(shù)據(jù)的綜合得到宏觀信息等均需要大量的數(shù)據(jù)。就在數(shù)據(jù)倉庫的概念提出后的幾年時間內(nèi)就得到了迅速的發(fā)展,各種各樣的數(shù)據(jù)倉庫產(chǎn)品也不斷出現(xiàn)并陸續(xù)進入市場。目前市場上主流的數(shù)據(jù)倉庫產(chǎn)品有以下幾種:(Busines
3、sObjects、Oracle、IBM、Sybase、Informix、NCR、Microsoft、SAS、CA)。數(shù)據(jù)倉庫與數(shù)據(jù)庫的區(qū)別1、數(shù)據(jù)庫用于事務處理,而數(shù)據(jù)倉庫則用于決策分析2、數(shù)據(jù)庫保持事務處理的當前狀態(tài),而數(shù)據(jù)倉庫既保存過去的數(shù)據(jù)也保存當前的數(shù)據(jù)。3、數(shù)據(jù)倉庫的數(shù)據(jù)是大量數(shù)據(jù)庫的集成4、對數(shù)據(jù)庫的操作比較明確,操作數(shù)據(jù)量少;而對數(shù)據(jù)倉庫的操作不明確,操作數(shù)據(jù)量大。數(shù)據(jù)庫與數(shù)據(jù)倉庫的詳細對比數(shù)據(jù)庫數(shù)據(jù)倉庫數(shù)據(jù)庫數(shù)據(jù)倉庫面向應用面向主題一個操作存取一個記錄一個操作存取一個集合數(shù)據(jù)是詳細的數(shù)據(jù)是綜合或提煉的數(shù)據(jù)非
4、冗余數(shù)據(jù)時常冗余保存當前數(shù)據(jù)保存過去和現(xiàn)在的數(shù)據(jù)操作頻繁相對不頻繁數(shù)據(jù)可更新數(shù)據(jù)幾乎不更新事務處理需要當前數(shù)據(jù)決策分析需要過去和現(xiàn)在的數(shù)據(jù)重復地操作數(shù)據(jù)啟發(fā)式地操作數(shù)據(jù)很少有復雜計算很多復雜的計算操作需求事先可知操作需求臨時決定支持事務處理支持決策分析從OLTP到OLAPOn-LineTransactionProcessing聯(lián)機事務處理系統(tǒng)(OLTP)也稱為面向交易的處理系統(tǒng),其基本特征是顧客的原始數(shù)據(jù)可以立即傳送到計算中心進行處理,并在很短的時間內(nèi)給出處理結(jié)果。這樣做的最大優(yōu)點是可以即時地處理輸入的數(shù)據(jù),及時地回答。也
5、稱為實時系統(tǒng)(RealtimeSystem)。衡量聯(lián)機事務處理系統(tǒng)的一個重要性能指標是系統(tǒng)性能,具體體現(xiàn)為實時響應時間(ResponseTime),即用戶在終端上送入數(shù)據(jù)之后,到計算機對這個請求給出答復所需要的時間。OLTP數(shù)據(jù)庫旨在使事務應用程序僅寫入所需的數(shù)據(jù),以便盡快處理單個事務。定義On-LineAnalysisProcessing聯(lián)機分析處理系統(tǒng)(OLTP)聯(lián)機分析處理(OLAP)的概念最早是由關系數(shù)據(jù)庫之父E.F.Codd于1993年提出的。當時,Codd認為聯(lián)機事務處理(OLTP)已不能滿足終端用戶對數(shù)據(jù)庫復
6、雜查詢分析的需要,SQL對大數(shù)據(jù)庫進行的簡單查詢也不能滿足用戶分析的需求。用戶的決策分析需要對關系數(shù)據(jù)庫進行大量計算才能得到結(jié)果,而查詢的結(jié)果并不能滿足決策者提出的需求,因此Codd提出了多維數(shù)據(jù)庫和多維分析的概念即OLAP。OLAP是數(shù)據(jù)倉庫系統(tǒng)的主要應用,支持復雜的分析操作,側(cè)重決策支持,并且提供直觀易懂的查詢結(jié)果,OLAP的技術核心就是“維度”這個概念。定義ROLAP各個軟件開發(fā)廠家見仁見智,其中一個流派,認為可以沿用關系型數(shù)據(jù)庫來存儲多維數(shù)據(jù),于是,基于稀疏矩陣表示方法的星型結(jié)構(gòu)(starschema)就出現(xiàn)了。后
7、來又演化出雪花結(jié)構(gòu)。為了與多維數(shù)據(jù)庫相區(qū)別,則把基于關系型數(shù)據(jù)庫的OLAP稱為RelationalOLAP,簡稱ROLAP。MOLAPMuiltDimensionOLAP,簡稱MOLAP,代表產(chǎn)品有Hyperion(原Arborsoftware)Essbase、MsOlap、oracleexpress等。立方體,頁,片的數(shù)據(jù)維=主鍵只存放一次,重復使用強制性保證數(shù)據(jù)完整性節(jié)省磁盤空間極容易地結(jié)合數(shù)據(jù)和公式支持共享的商業(yè)邏輯保證數(shù)據(jù)的一致性每一個單元都被索引因此有很高的存取效率1月2月3月芬達可樂雪碧北京上海南京ROLAP和
8、MOLAP的功能區(qū)別Legacy/Operational/ExternalSystemsTransactionSystemsDecisionSupportSystemsKnowledgeWorkersStrategicTacticalWhat-IfAnalysisCustomizedApplicatio