數(shù)據(jù)倉庫的概念與體系結(jié)構(gòu)

數(shù)據(jù)倉庫的概念與體系結(jié)構(gòu)

ID:39267867

大?。?.35 MB

頁數(shù):42頁

時(shí)間:2019-06-29

數(shù)據(jù)倉庫的概念與體系結(jié)構(gòu)_第1頁
數(shù)據(jù)倉庫的概念與體系結(jié)構(gòu)_第2頁
數(shù)據(jù)倉庫的概念與體系結(jié)構(gòu)_第3頁
數(shù)據(jù)倉庫的概念與體系結(jié)構(gòu)_第4頁
數(shù)據(jù)倉庫的概念與體系結(jié)構(gòu)_第5頁
資源描述:

《數(shù)據(jù)倉庫的概念與體系結(jié)構(gòu)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫

1、2021/10/7數(shù)據(jù)倉庫與數(shù)據(jù)挖掘1第1章數(shù)據(jù)倉庫的概念與體系結(jié)構(gòu)主講:張莉Email:zhangliml@suda.edu.cn歷史數(shù)據(jù)的處理方法刪除已經(jīng)失效的歷史數(shù)據(jù)介質(zhì)備份后刪除建立數(shù)據(jù)倉庫系統(tǒng)2021/10/7數(shù)據(jù)倉庫與數(shù)據(jù)挖掘22021/10/7數(shù)據(jù)倉庫與數(shù)據(jù)挖掘31.1數(shù)據(jù)倉庫的概念、特點(diǎn)與組成數(shù)據(jù)倉庫的概念數(shù)據(jù)倉庫就是一個(gè)面向主題的(SubjectOriented)、集成的(Integrate)、相對(duì)穩(wěn)定的(Non-Volatile)、反映歷史變化(TimeVariant)的數(shù)據(jù)集合,通常用于輔助決策支持(DDS)2021/10/7數(shù)據(jù)倉庫與數(shù)據(jù)挖掘41.1數(shù)據(jù)倉庫的概念、特點(diǎn)

2、與組成數(shù)據(jù)倉庫的特點(diǎn):面向主題數(shù)據(jù)倉庫中的數(shù)據(jù)是按照一定的主題域進(jìn)行組織的集成數(shù)據(jù)倉庫中的數(shù)據(jù)是在對(duì)原有分散的數(shù)據(jù)庫數(shù)據(jù)作抽取、清理的基礎(chǔ)上經(jīng)過系統(tǒng)加工、匯總和整理得到的2021/10/7數(shù)據(jù)倉庫與數(shù)據(jù)挖掘51.1數(shù)據(jù)倉庫的概念、特點(diǎn)與組成數(shù)據(jù)倉庫的特點(diǎn):相對(duì)穩(wěn)定數(shù)據(jù)操作主要是數(shù)據(jù)查詢和定期更新數(shù)據(jù)加載后,將作為數(shù)據(jù)檔案長(zhǎng)期保存反映歷史變化數(shù)據(jù)倉庫中的數(shù)據(jù)通常包含較久遠(yuǎn)的歷史數(shù)據(jù)2021/10/7數(shù)據(jù)倉庫與數(shù)據(jù)挖掘61.1數(shù)據(jù)倉庫的概念、特點(diǎn)與組成數(shù)據(jù)倉庫的組成:數(shù)據(jù)倉庫數(shù)據(jù)庫;數(shù)據(jù)抽取工具;元數(shù)據(jù):技術(shù)元數(shù)據(jù)與業(yè)務(wù)元數(shù)據(jù);訪問工具;數(shù)據(jù)集市(DataMarts);數(shù)據(jù)倉庫管理;信息發(fā)布系統(tǒng)。

3、2021/10/7數(shù)據(jù)倉庫與數(shù)據(jù)挖掘7數(shù)據(jù)倉庫的組成數(shù)據(jù)倉庫數(shù)據(jù)庫核心是數(shù)據(jù)信息存放的地方對(duì)數(shù)據(jù)提供存取和檢索支持?jǐn)?shù)據(jù)抽取工具提取數(shù)據(jù),進(jìn)行轉(zhuǎn)換、整理,再存放轉(zhuǎn)換的內(nèi)容:刪除對(duì)決策分析沒有意義的數(shù)據(jù)轉(zhuǎn)換到統(tǒng)一的數(shù)據(jù)名稱和定義計(jì)算統(tǒng)計(jì)和衍生數(shù)據(jù)填補(bǔ)缺失數(shù)據(jù)統(tǒng)計(jì)不同的數(shù)據(jù)定義方式2021/10/7數(shù)據(jù)倉庫與數(shù)據(jù)挖掘8數(shù)據(jù)倉庫的組成元數(shù)據(jù)描述數(shù)據(jù)倉庫數(shù)據(jù)的結(jié)構(gòu)和建立方法的數(shù)據(jù)技術(shù)元數(shù)據(jù)設(shè)計(jì)和管理人員用于開發(fā)和管理數(shù)據(jù)倉庫時(shí)使用的元數(shù)據(jù)業(yè)務(wù)元數(shù)據(jù)從單位業(yè)務(wù)的角度描述數(shù)據(jù)倉庫的元數(shù)據(jù)2021/10/7數(shù)據(jù)倉庫與數(shù)據(jù)挖掘9數(shù)據(jù)倉庫的組成訪問工具為用戶訪問數(shù)據(jù)倉庫提供的手段數(shù)據(jù)集市(DataMarts)為特

4、定的應(yīng)用目的,從數(shù)據(jù)倉庫中獨(dú)立出來的一部分?jǐn)?shù)據(jù),也稱為部門數(shù)據(jù)或者主題數(shù)據(jù)2021/10/7數(shù)據(jù)倉庫與數(shù)據(jù)挖掘10數(shù)據(jù)倉庫的組成數(shù)據(jù)倉庫管理安全與權(quán)限的管理數(shù)據(jù)更新的跟蹤數(shù)據(jù)質(zhì)量的檢查元數(shù)據(jù)的管理與更新?信息發(fā)布系統(tǒng)把數(shù)據(jù)倉庫中的數(shù)據(jù)或其他相關(guān)數(shù)據(jù)發(fā)給不同的地點(diǎn)或用戶2021/10/7數(shù)據(jù)倉庫與數(shù)據(jù)挖掘111.2數(shù)據(jù)挖掘的概念與方法數(shù)據(jù)挖掘的概念數(shù)據(jù)挖掘(DataMining),就是從大量數(shù)據(jù)中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程。簡(jiǎn)單的說,數(shù)據(jù)挖掘就是從大量數(shù)據(jù)中提取或“挖掘”知識(shí),又被稱為數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase,

5、KDD)2021/10/7數(shù)據(jù)倉庫與數(shù)據(jù)挖掘121.2數(shù)據(jù)挖掘的概念與方法數(shù)據(jù)挖掘的方法:直接數(shù)據(jù)挖掘?qū)δ硞€(gè)變量建立一個(gè)模型包括分類、估值和預(yù)測(cè)間接數(shù)據(jù)挖掘在所有的變量中建立起某種關(guān)系如相關(guān)性分組或關(guān)聯(lián)規(guī)則,聚集聚類,描述和可視化,及復(fù)雜數(shù)據(jù)挖掘2021/10/7數(shù)據(jù)倉庫與數(shù)據(jù)挖掘131.2數(shù)據(jù)挖掘的概念與方法數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的關(guān)系若將數(shù)據(jù)倉庫(DataWarehouse)比作礦井,那么數(shù)據(jù)挖掘(DataMining)就是深入礦井采礦的工作數(shù)據(jù)挖掘是從數(shù)據(jù)倉庫中找出有用信息的一種過程與技術(shù)2021/10/7數(shù)據(jù)倉庫與數(shù)據(jù)挖掘141.3數(shù)據(jù)倉庫的技術(shù)、方法與產(chǎn)品聯(lián)機(jī)事務(wù)處理(OLTP)與聯(lián)機(jī)分

6、析處理(OLAP)的比較2021/10/7數(shù)據(jù)倉庫與數(shù)據(jù)挖掘151.3數(shù)據(jù)倉庫的技術(shù)、方法與產(chǎn)品OLAP技術(shù)的有關(guān)概念多維數(shù)據(jù)集:一個(gè)數(shù)據(jù)集合維度:一個(gè)實(shí)體的一些重要屬性定義為維dimension度量值:度量指標(biāo),是多維數(shù)據(jù)集中的一組數(shù)值多維分析:對(duì)以“維”形式組織起來的數(shù)據(jù)采取切片,切塊,鉆取和旋轉(zhuǎn)等各種分析動(dòng)作,以求分析數(shù)據(jù)2021/10/7數(shù)據(jù)倉庫與數(shù)據(jù)挖掘161.3數(shù)據(jù)倉庫的技術(shù)、方法與產(chǎn)品OLAP根據(jù)其存儲(chǔ)數(shù)據(jù)的方式可分為三類:ROLAP,relationalOLAP事實(shí)表、維表MOLAP,multidimensionalOLAPHOLAP,hybridOLAPOLAP工具針對(duì)特定問

7、題的聯(lián)機(jī)數(shù)據(jù)訪問與分析,通過多維的方式對(duì)數(shù)據(jù)進(jìn)行分析、查詢和報(bào)表2021/10/7數(shù)據(jù)倉庫與數(shù)據(jù)挖掘171.3數(shù)據(jù)倉庫的技術(shù)、方法與產(chǎn)品數(shù)據(jù)倉庫實(shí)施中的三個(gè)關(guān)鍵環(huán)節(jié)數(shù)據(jù)抽??;數(shù)據(jù)存儲(chǔ)與管理數(shù)據(jù)表現(xiàn)2021/10/7數(shù)據(jù)倉庫與數(shù)據(jù)挖掘18數(shù)據(jù)倉庫實(shí)施中的三個(gè)關(guān)鍵環(huán)節(jié)數(shù)據(jù)抽取數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫的入口抽取技術(shù)包括:互連、復(fù)制、增量、轉(zhuǎn)換、調(diào)度和監(jiān)控實(shí)現(xiàn)抽取專業(yè)的數(shù)據(jù)抽取工具直接開發(fā)抽取接口程序2021/1

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。