資源描述:
《商業(yè)智能BI介紹》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、BI介紹內(nèi)容?為什么需要BI?什么是BI?BI的體系結(jié)構(gòu)?如何實施BI?BI與大數(shù)據(jù)為什么需要BIBI的意義?BI是把運營數(shù)據(jù)轉(zhuǎn)化成為高價值的可以獲取的信息(或知識),并且在恰當(dāng)?shù)臅r候通過恰當(dāng)?shù)姆绞桨亚‘?dāng)?shù)男畔鬟f給恰當(dāng)?shù)娜藬?shù)據(jù)信息知識決策BI的價值責(zé)任分析??用于經(jīng)理、主管的精確及時的?從收入、可贏利性、滿意度的角度報告來講,哪些是您最好的客戶??公司數(shù)以萬計的以及其他的公?哪些客戶會對促銷作出響應(yīng)?開內(nèi)容銷售市場營銷計劃和模型開發(fā)采購執(zhí)行生產(chǎn)服務(wù)報告和財務(wù)/HR項目管理分析響應(yīng)能力計劃?監(jiān)視事件和計量標(biāo)準(zhǔn)?預(yù)測和趨勢分析?將最近事件和歷史數(shù)據(jù)相關(guān)聯(lián)?實施之前預(yù)估策略中的潛在變化學(xué)術(shù)界的觀點
2、BI實際上是幫助企業(yè)提高決策能力和運營能力的概念、方法、過程以及軟件的集合,其主要目標(biāo)是將企業(yè)所掌握的信息轉(zhuǎn)換成競爭優(yōu)勢,提高企業(yè)決策能力、決策效率、決策準(zhǔn)確性。什么是BI與BI相關(guān)的重要概念?BI(BusinessIntelligence,商務(wù)智能)?DW(DataWarehouse,數(shù)據(jù)倉庫)?ETL(抽取轉(zhuǎn)化)?OLAP(OnlineAnalysisProcess)?DM(DataMining,數(shù)據(jù)挖掘)BI(BusinessIntelligence)商務(wù)智能簡稱BI,指通過對數(shù)據(jù)的收集、管理、分析以及轉(zhuǎn)化,使數(shù)據(jù)成為可用的信息,從而獲得必要的洞察力和理解力,更好地輔助決策和指導(dǎo)行動。數(shù)
3、據(jù)倉庫(DataWarehouse)數(shù)據(jù)倉庫(DataWarehouse簡稱DW)是一個面向主題的(SubjectOriented)、集成的(Integrate)、相對穩(wěn)定的(Non-Volatile)、反映歷史變化(TimeVariant)的數(shù)據(jù)集合。數(shù)據(jù)倉庫是實現(xiàn)商務(wù)智能的基礎(chǔ)平臺數(shù)據(jù)倉庫VS數(shù)據(jù)庫數(shù)據(jù)庫系統(tǒng)(生產(chǎn)系統(tǒng)):以銀行為例●面向應(yīng)用、事務(wù)驅(qū)動的儲蓄對公信用卡其他●實時性高●數(shù)據(jù)檢索量少●只存當(dāng)前數(shù)據(jù)?數(shù)據(jù)倉庫系統(tǒng)(決策系統(tǒng)):●面向主題、分析和決策數(shù)據(jù)倉庫●實時性要求不是特別高客產(chǎn)渠交機戶品道易構(gòu)●數(shù)據(jù)檢索量大●存儲大量的歷史數(shù)據(jù)和當(dāng)前數(shù)據(jù)ETLETL是數(shù)據(jù)抽?。‥xtracti
4、ng)、轉(zhuǎn)換(Transforming)、清洗(Cleaning)、裝載(Loading)幾個過程的簡稱。ETL是構(gòu)建數(shù)據(jù)倉庫的重要一環(huán),用戶從數(shù)據(jù)源抽取出所需的數(shù)據(jù),經(jīng)過ETL最終按照預(yù)先定義好的數(shù)據(jù)倉庫模型,將數(shù)據(jù)加載到數(shù)據(jù)倉庫中去。ETL數(shù)據(jù)抽取:從源數(shù)據(jù)源系統(tǒng)抽取目的數(shù)據(jù)源系統(tǒng)需要的數(shù)據(jù)數(shù)據(jù)清洗:重復(fù)行數(shù)據(jù)的清理,無用字段的清理,空值的處理等,正則表達式的使用。數(shù)據(jù)轉(zhuǎn)換:數(shù)據(jù)類型的轉(zhuǎn)換,比如int轉(zhuǎn)varchar,字符型轉(zhuǎn)日期型(如20090801轉(zhuǎn)2009-08-01)等等。類似用1標(biāo)識男,2表示女。ETL分層ODSMIDDW-DMETL流程ETL工具?開源kettle工具?DI?O
5、racleODI?IBMdatastage?informaticaOLTP&OLAP?OLTP(OnlineTransactionProcess)聯(lián)機事務(wù)處理,是公司日常運營的基礎(chǔ),是業(yè)務(wù)流程信息化的關(guān)鍵,基于生產(chǎn)數(shù)據(jù)庫。?OLAP(OnlineAnalysisProcess)聯(lián)機分析處理,基于數(shù)據(jù)倉庫的數(shù)據(jù)分析,以供決策所需,面向管理層,面向未來。OLAP的目標(biāo)?滿足決策支持或多維環(huán)境特定的查詢和報表需求,它的技術(shù)核心是“維”這個概念,因此OLAP也可以說是多維資料分析工具的集合。?通常所說的BI分析就是指OLAP,更為準(zhǔn)確是指OLAP分析及結(jié)果展示。OLTP數(shù)據(jù)OLAP數(shù)據(jù)原始數(shù)據(jù)導(dǎo)出數(shù)據(jù)
6、細節(jié)性數(shù)據(jù)綜合性和提煉性數(shù)據(jù)當(dāng)前值數(shù)據(jù)歷史數(shù)據(jù)可更新可更新,但周期性刷新一次處理的數(shù)據(jù)量小一次處理的數(shù)據(jù)量大面向應(yīng)用,事務(wù)驅(qū)動面向分析,分析驅(qū)動面向操作人員,支持日常操作面向決策人員支持管理需要OLAP分類ROLAPMOLAPHOLAPROLAP的優(yōu)點?沒有大小限制,現(xiàn)有的關(guān)系數(shù)據(jù)庫的技術(shù)可以沿用,可以通過SQL實現(xiàn)詳細數(shù)據(jù)與概要數(shù)據(jù)的存儲?,F(xiàn)有關(guān)系型數(shù)據(jù)庫已經(jīng)對OLAP做了很多優(yōu)化,包括并行存儲、并行查詢、并行數(shù)據(jù)管理、基于成本的查詢優(yōu)化、位圖索引、SQL的OLAP擴展(cube,rollup)等大大提高ROALP的速度ROLAP的缺點一般響應(yīng)速度慢不支持有關(guān)預(yù)計算的讀寫操作無法完成維之間的
7、計算MOLAP的優(yōu)點性能好、響應(yīng)速度快專為OLAP所設(shè)計,支持高性能的決策支持計算復(fù)雜的跨維計算多用戶的讀寫操作行級的計算MOLAP的缺點增加系統(tǒng)復(fù)雜度,增加系統(tǒng)培訓(xùn)與維護費用受操作系統(tǒng)平臺中文件大小的限制需要進行預(yù)計算,可能導(dǎo)致數(shù)據(jù)爆炸無法支持維的動態(tài)變化缺乏數(shù)據(jù)訪問的標(biāo)準(zhǔn)HOLAP的優(yōu)點混合數(shù)據(jù)組織的OLAP實現(xiàn)低層是關(guān)系型的高層是多維矩陣型ROLAP和MOLAP的有機結(jié)合度量值度量值是決策者