資源描述:
《bi數(shù)據(jù)倉庫基礎(chǔ)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、BIBusinessIntelligence,即商業(yè)智能,商務(wù)智能綜合企業(yè)所有沉淀下來的信息,用科學(xué)的分析方法,為企業(yè)領(lǐng)導(dǎo)提供科學(xué)決策信息的過程。BOSS業(yè)務(wù)運(yùn)營支撐系BPM企業(yè)績效管理BPR業(yè)務(wù)流程重整CRM客戶關(guān)系管理CUBE立方體DM(Datamart)數(shù)據(jù)集市數(shù)據(jù)倉庫的子集,它含有較少的主題域且歷史時(shí)間更短數(shù)據(jù)量更少,一般只能為某個(gè)局部范圍內(nèi)的管理人員服務(wù),因此也稱之為部門級(jí)數(shù)據(jù)倉庫。DM(DataMine)數(shù)據(jù)挖掘DSS決策支持系統(tǒng)EDM企業(yè)數(shù)據(jù)模型3ERPEnterpriseResoursePlanning企業(yè)資源規(guī)劃。它是一個(gè)以管理
2、會(huì)計(jì)為核心的信息系統(tǒng),識(shí)別和規(guī)劃企業(yè)資源,從而獲取客戶訂單,完成加工和交付,最后得到客戶付款。換言之,ERP將企業(yè)內(nèi)部所有資源整合在一起,對(duì)八個(gè)采購、生產(chǎn)、成本、庫存、分銷、運(yùn)輸、財(cái)務(wù)、人力資源進(jìn)行規(guī)劃,從而達(dá)到最佳資源組合,取得最佳效益。4ETL數(shù)據(jù)抽取(Extract)、轉(zhuǎn)換(Transform)、清洗(Cleansing)、裝載(Load)的過程。構(gòu)建數(shù)據(jù)倉庫的重要一環(huán),用戶從數(shù)據(jù)源抽取出所需的數(shù)據(jù),經(jīng)過數(shù)據(jù)清洗,最終按照預(yù)先定義好的數(shù)據(jù)倉庫模型,將數(shù)據(jù)加載到數(shù)據(jù)倉庫中去。KDD數(shù)據(jù)庫中知識(shí)發(fā)現(xiàn)5KPI企業(yè)關(guān)鍵業(yè)績指標(biāo)(KPI:KeyPro
3、cessIndication)是通過對(duì)組織內(nèi)部流程的輸人端、輸出端的關(guān)鍵參數(shù)進(jìn)行設(shè)置、取樣、計(jì)算、分析,衡量流程績效的一種目標(biāo)式量化管理指標(biāo),是把企業(yè)的戰(zhàn)略目標(biāo)分解為可操作的工作目標(biāo)的工具,是企業(yè)績效管理的基礎(chǔ)。LDM邏輯數(shù)據(jù)模型6MDD多維數(shù)據(jù)庫(MultiDimesionalDatabase,MDD)可以簡單地理解為:將數(shù)據(jù)存放在一個(gè)n維數(shù)組中,而不是像關(guān)系數(shù)據(jù)庫那樣以記錄的形式存放。因此它存在大量稀疏矩陣,人們可以通過多維視圖來觀察數(shù)據(jù)。多維數(shù)據(jù)庫增加了一個(gè)時(shí)間維,與關(guān)系數(shù)據(jù)庫相比,它的優(yōu)勢(shì)在于可以提高數(shù)據(jù)處理速度,加快反應(yīng)時(shí)間,提高查詢效
4、率。Metadata(元數(shù)據(jù)),它是“關(guān)于數(shù)據(jù)的數(shù)據(jù),其內(nèi)容主要包括數(shù)據(jù)倉庫的數(shù)據(jù)字典、數(shù)據(jù)的定義、數(shù)據(jù)的抽取規(guī)則、數(shù)據(jù)的轉(zhuǎn)換規(guī)則、數(shù)據(jù)加載頻率等信息。MOLAP自行建立了多維數(shù)據(jù)庫,來存放聯(lián)機(jī)分析系統(tǒng)數(shù)據(jù)7ODS(四個(gè)特點(diǎn))(OprationalDataStore)操作型數(shù)據(jù)存儲(chǔ),是建立在數(shù)據(jù)準(zhǔn)備區(qū)和數(shù)據(jù)倉庫之間的一個(gè)部件。用來滿足企業(yè)集成的、綜合的操作型處理需要,操作數(shù)據(jù)存儲(chǔ)是個(gè)可選的部件。對(duì)于一些準(zhǔn)實(shí)時(shí)的業(yè)務(wù)數(shù)據(jù)庫當(dāng)中的數(shù)據(jù)的暫時(shí)存儲(chǔ),支持一些同時(shí)關(guān)連到歷史數(shù)據(jù)與實(shí)時(shí)數(shù)據(jù)分析的數(shù)據(jù)暫時(shí)存儲(chǔ)區(qū)域。8什么是數(shù)據(jù)集市DM數(shù)據(jù)集市可以看作是數(shù)據(jù)倉庫
5、的一個(gè)子集,它含有較少的主題域且歷史時(shí)間更短數(shù)據(jù)量更少,一般只能為某個(gè)局部范圍內(nèi)的管理人員服務(wù),因此也稱之為部門級(jí)數(shù)據(jù)倉庫。二數(shù)據(jù)倉庫DWDotaworehouse,數(shù)據(jù)倉庫是一個(gè)集合或過程,4要素面向主題,集成,時(shí)間相關(guān)(反映歷史變化),(穩(wěn)定)不可修改的數(shù)據(jù)集合。數(shù)據(jù)倉庫是在企業(yè)管理和決策中面向主題的、集成的、與時(shí)間相關(guān)的、不可修改的數(shù)據(jù)集合。與其他數(shù)據(jù)庫應(yīng)用不同的是,數(shù)據(jù)倉庫更像一種過程,對(duì)分布在企業(yè)內(nèi)部各處的業(yè)務(wù)數(shù)據(jù)的整合、加工和分析的過程。特點(diǎn)傳統(tǒng)操作型數(shù)據(jù)庫數(shù)據(jù)倉庫面向主題菜市場按功能來分類每一個(gè)模塊就如一個(gè)小攤位,蘿卜,青菜都有超市
6、按類型分類如都為利潤的分為一個(gè)事實(shí)表事實(shí)表和維表的分類集成的與特定的應(yīng)用相關(guān),數(shù)據(jù)庫之間獨(dú)立的有聯(lián)系,ETL的過程已經(jīng)是將多個(gè)數(shù)據(jù)庫聯(lián)系統(tǒng)一,去除之間的不一致性。相對(duì)穩(wěn)定通常實(shí)時(shí)更新,數(shù)據(jù)根據(jù)需要及時(shí)發(fā)生變化供企業(yè)決策分析之用,數(shù)據(jù)操作主要是數(shù)據(jù)查詢,一旦某個(gè)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫以后,一般情況下將被長期保留,也就是數(shù)據(jù)倉庫中一般有大量的查詢操作,但修改和刪除操作很少,通常定期的加載、刷新。反映歷史變化主要關(guān)心當(dāng)前某一個(gè)時(shí)間段內(nèi)的數(shù)據(jù)包含歷史信息,系統(tǒng)記錄了企業(yè)從過去某一時(shí)點(diǎn)下圖是一個(gè)典型的企業(yè)數(shù)據(jù)倉庫系統(tǒng),通常包含數(shù)據(jù)源、數(shù)據(jù)存儲(chǔ)與管理、數(shù)據(jù)的訪問三
7、個(gè)部分:文檔資料'i數(shù)據(jù)挖掘數(shù)椐報(bào)表OLAP即席S詢數(shù)拋源—*數(shù)椐存儲(chǔ)與管押_>k數(shù)損訪問這張圖可以看出四個(gè)特點(diǎn)中,面向?qū)ο?,集成,?shù)據(jù)源:是指企業(yè)操作型數(shù)據(jù)庫中的各種生產(chǎn)運(yùn)營數(shù)據(jù)即OLIP數(shù)據(jù)的存儲(chǔ)與管理:數(shù)據(jù)倉庫的存儲(chǔ)主要由元數(shù)據(jù)的存儲(chǔ)及數(shù)據(jù)的存儲(chǔ)兩部分組成。元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),其內(nèi)容主要包括數(shù)據(jù)倉庫的數(shù)據(jù)字典、數(shù)據(jù)的定義、數(shù)據(jù)的抽取規(guī)則、數(shù)據(jù)的轉(zhuǎn)換規(guī)則、數(shù)據(jù)加載頻率等信息。各操作數(shù)據(jù)庫中的數(shù)據(jù)按照元數(shù)據(jù)庫中定義的規(guī)則,經(jīng)過抽取、清理、轉(zhuǎn)換、集成,按照主題重新組織,依照相應(yīng)的存儲(chǔ)結(jié)構(gòu)進(jìn)行存儲(chǔ)數(shù)據(jù)的訪問
8、:由OLAP(聯(lián)機(jī)分析處理)、數(shù)據(jù)挖
9、掘、統(tǒng)計(jì)報(bào)表、即席查詢等幾部分組成。例如OLAP:針對(duì)特定的分析主題,設(shè)計(jì)多種可能的觀察形式,設(shè)計(jì)相應(yīng)的分析主題結(jié)構(gòu)(即進(jìn)行事實(shí)表和維表