基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘技術

基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘技術

ID:14598415

大?。?5.20 KB

頁數(shù):9頁

時間:2018-07-29

基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘技術_第1頁
基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘技術_第2頁
基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘技術_第3頁
基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘技術_第4頁
基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘技術_第5頁
資源描述:

《基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘技術》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在教育資源-天天文庫

1、數(shù)據(jù)倉庫技術在超市中的應用[摘要]本文主要介紹數(shù)據(jù)倉庫的技術,以某超市銷售決策支持系統(tǒng)為例,敘述了面向超市的數(shù)據(jù)倉庫的建模過程。通過聯(lián)機分析技術和數(shù)據(jù)挖掘技術對數(shù)據(jù)倉庫中的數(shù)據(jù)進行處理得到需要的信息,然后應用到超市中以滿足各種潛在的個性化的需求。[關鍵詞]:數(shù)據(jù)倉庫,超市,數(shù)據(jù)挖掘,數(shù)據(jù)處理,潛在需求,OLAP,決策支持ApplicationofDataWarehouseintheSuppermarket[Abstract]ThethesismainlyintroducesthetechniqueofDataWarehouseand

2、narratehowtobuildDataWarehouseinsupermarket.WecandodataprocessingbythetechniqueofOLAPandDataMininginthesupermarkettogetsomepotentialinformationtomeetconsumers’potentialdiverserequirements.[Keywords]DataMining,Datawarehouse,Dataprocessing,OLAP,Supermarket;1.引言隨著計算方法和信息技

3、術的不斷發(fā)展,大量數(shù)據(jù)的產(chǎn)生和收集導致信息爆炸?,F(xiàn)代社會的競爭趨勢要求對這些數(shù)據(jù)進行實時的和深層次的分析。雖然現(xiàn)在很多超市都有很大的存儲系統(tǒng)和很強的存儲系統(tǒng),但是使用者發(fā)現(xiàn)在分析所擁有的信息方面變得越來越困難。數(shù)據(jù)倉庫提供了容納大量信息的場所,用戶可以使用聯(lián)機分析技術和數(shù)據(jù)挖掘技術從繁雜的數(shù)據(jù)中找出真正有價值的信息和知識。數(shù)據(jù)倉庫可以加強企業(yè)對信息的管理能力,數(shù)據(jù)挖掘可以改善企業(yè)的經(jīng)營狀況,為超市的管理和決策提供科學的依據(jù),為超市帶來巨大的收益,增強企業(yè)的競爭優(yōu)勢。超市在經(jīng)營中積累了海量的歷史數(shù)據(jù),使用數(shù)據(jù)倉庫對這些數(shù)據(jù)進行管理和分

4、析,比人工數(shù)據(jù)管理更有效,更科學。針對不同類型的客戶,商家推出不同的策略,以迎合不同客戶的購物習慣,這樣的策略才具有針對性。針對以上問題,以某個超市的應用數(shù)據(jù)庫為基礎,該數(shù)據(jù)庫中存儲了大量的客戶信息,購買時得交易數(shù)據(jù),產(chǎn)品信息等數(shù)據(jù),討論如何構建該數(shù)據(jù)倉庫和進行數(shù)據(jù)挖掘。1.數(shù)據(jù)倉庫及相關概念2.1數(shù)據(jù)倉庫的概念1993年,WilliamH.Inmon在發(fā)表的著作BuildingtheDataWarehouse中首先給出了數(shù)據(jù)倉庫的定義:“數(shù)據(jù)倉庫是一個面向主題的,集成的,非易失的且隨時間變化的,用來支持管理人員做出決策的數(shù)據(jù)集合。

5、”數(shù)據(jù)倉庫的特征:數(shù)據(jù)倉庫是面向主題的數(shù)據(jù)倉庫中的數(shù)據(jù)是綜合或提煉的數(shù)據(jù)倉庫中保存的是過去的和現(xiàn)在的數(shù)據(jù)數(shù)據(jù)倉庫中數(shù)據(jù)不可更新操作需求是臨時決定的數(shù)據(jù)常冗余所查詢的是經(jīng)過公的數(shù)據(jù)支持決策分析綜上所述,數(shù)據(jù)倉庫是把企業(yè)中異構的歷史數(shù)據(jù)進行抽取,轉(zhuǎn)換,合并和統(tǒng)一管理,從而用來對數(shù)據(jù)進行進一步的加工以輔助決策分析,數(shù)據(jù)挖掘,產(chǎn)生報表的應用。因此數(shù)據(jù)倉庫是一個集中式得,集成式的數(shù)據(jù)存儲。2.1數(shù)據(jù)進入數(shù)據(jù)庫的過程數(shù)據(jù)進入數(shù)據(jù)倉庫要經(jīng)過數(shù)據(jù)提取,數(shù)據(jù)交換,數(shù)據(jù)凈化,數(shù)據(jù)加載和數(shù)據(jù)匯總五個五階段。交換提取凈化加載匯總2.2聯(lián)機分析處理OLAP用

6、中,對數(shù)據(jù)庫的簡單查詢已滿足不了用戶分析和決策者提出的要求,于是我們需要多角度的觀察數(shù)據(jù),并分析其之間的關系。由于傳統(tǒng)的數(shù)據(jù)庫及查詢工具對于管理和應用這樣復雜的數(shù)據(jù)已滿足不了要求,于是出現(xiàn)了多維數(shù)據(jù)庫和多維分析的OLAP技術。OLAP是一種軟件技術,它使分析人員能夠迅速,一致,交互地從各個方面觀察信息,已達到深入理解數(shù)據(jù)的目的。OLAP是多維數(shù)據(jù)分析工具的集合,其目標是滿足決策支持和多維環(huán)境下特定的查詢和報表需求。OLAP分析主要通過對多維數(shù)據(jù)進行切片,切塊,聚合,鉆取,旋轉(zhuǎn)等分析操作以求剖析數(shù)據(jù),使用戶能夠從多種維度,多個側面,多

7、種數(shù)據(jù)綜合度查看數(shù)據(jù),從而了解數(shù)據(jù)背后蘊涵的規(guī)律。2.3數(shù)據(jù)挖掘數(shù)據(jù)挖掘就是從大量的,不完全的,有噪聲的,模糊的,隨機的實際應用數(shù)據(jù)中提取隱含其中的,事先未知的,但又具有潛在價值的信息和知識的過程。從數(shù)據(jù)分析的角度出發(fā),數(shù)據(jù)挖掘可以分為兩種類型:描述性數(shù)據(jù)挖掘和預測性數(shù)據(jù)挖掘。描述性數(shù)據(jù)挖掘包含關聯(lián)分析,序列分析,聚類分析等方法。預測性數(shù)據(jù)挖掘包含分類和統(tǒng)計回歸等方法,常用的預測模型有決策樹,神經(jīng)網(wǎng)絡,線性回歸等。數(shù)據(jù)挖掘為經(jīng)營決策,市場策劃,金融預測等提供依據(jù),使大型數(shù)據(jù)庫作為一個豐富可靠的資源為知識歸納服務。3數(shù)據(jù)倉庫在超市中的

8、應用根據(jù)某超市的需求,建立一個基于數(shù)據(jù)倉庫的決策支持系統(tǒng)。主要分為三個階段:(1)數(shù)據(jù)倉庫建模,根據(jù)超市的經(jīng)營數(shù)據(jù)確定分析主題,維度,粒度,事實表,維表等。(2)使用數(shù)據(jù)倉庫提取,轉(zhuǎn)換,加載(ETL)工具中的調(diào)度器,抽取轉(zhuǎn)換器,加載器

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。