資源描述:
《構(gòu)建基于數(shù)據(jù)倉庫的dss》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、構(gòu)建基于數(shù)據(jù)倉庫的DSS
2、第1(2)數(shù)據(jù)抽取模塊該模塊是根據(jù)元數(shù)據(jù)庫中的主題表定義、數(shù)據(jù)源定義、數(shù)據(jù)抽取規(guī)則定義對異地異構(gòu)數(shù)據(jù)源(包括各平臺的數(shù)據(jù)庫、文本文件、HTML文件、知識庫等)進(jìn)行清理、轉(zhuǎn)換,對數(shù)據(jù)進(jìn)行重新組織和加工,裝載到數(shù)據(jù)倉庫的目標(biāo)庫中。在組織不同的數(shù)據(jù)過程中,先將數(shù)據(jù)轉(zhuǎn)換成一種中間模式,再把它移至臨時工作區(qū)。加工數(shù)據(jù)是保證目標(biāo)數(shù)據(jù)庫中數(shù)據(jù)的完整性、一致性。例如,有兩個數(shù)據(jù)源存儲與人員有關(guān)的信息,在定義數(shù)據(jù)組成的人員編碼類型時,可能一個是字符型,一個是整型;在定義人員性別這一屬性的類型時,一個可能是char(2),存儲的數(shù)據(jù)值為“
3、男”和“女”,而另一個屬性類型為char(1),數(shù)據(jù)值為“F”和“M”。這兩個數(shù)據(jù)源的值都是正確的,但對于目標(biāo)數(shù)據(jù)來說,必須加工為一種統(tǒng)一的方法來表示該屬性值,然后交由最終用戶進(jìn)行驗(yàn)證,這樣才能保證數(shù)據(jù)的質(zhì)量。在數(shù)據(jù)抽取過程中,必須在最終用戶的密切配合下,才能實(shí)現(xiàn)數(shù)據(jù)的真正統(tǒng)一。早期數(shù)據(jù)抽取是依靠手工編程和程序生成器實(shí)現(xiàn),現(xiàn)在則通過高效的工具來實(shí)現(xiàn),如Ardent公司的Infomoter產(chǎn)品、SAS的數(shù)據(jù)倉庫產(chǎn)品SAS/ining),在DDS環(huán)境中數(shù)據(jù)倉庫直接為聯(lián)機(jī)分析處理和數(shù)據(jù)挖掘提供數(shù)據(jù)能力。1.聯(lián)機(jī)分析處理(OLAP)OLAP是針對特定問
4、題的聯(lián)機(jī)數(shù)據(jù)訪問和數(shù)據(jù)分析而產(chǎn)生的一種技術(shù),它滿足DDS從多種角度對數(shù)據(jù)進(jìn)行快速、一致、交互地分析,克服傳統(tǒng)DDS交互能力差的弊病,使決策者能夠?qū)?shù)據(jù)進(jìn)行深入觀察。OLAP服務(wù)器使用為用戶預(yù)定義的多維數(shù)據(jù)視圖對數(shù)據(jù)倉庫的信息進(jìn)行統(tǒng)計(jì)分析處理,為具有明確分析范圍和分析要求的用戶提供高性能的決策支持。OLAP將分析結(jié)果存儲在信息庫中,便于決策者通過對比多種分析結(jié)果作出更好的決策。此外,信息庫中還存放決策準(zhǔn)則、管理經(jīng)驗(yàn)、常識。OLAP工具目前以多維分析/ROLAP為主,如InformixMetacube分析工具軟件。2.?dāng)?shù)據(jù)挖掘數(shù)據(jù)挖掘是指從大量數(shù)據(jù)
5、中發(fā)現(xiàn)潛在的、有價值的及未知的關(guān)系、模式和趨勢,并以易被理解的方式表示出來。在DDS中通過進(jìn)行數(shù)據(jù)挖掘用以發(fā)現(xiàn)數(shù)據(jù)之間的復(fù)雜聯(lián)系以及這種聯(lián)系對決策的影響。在數(shù)據(jù)倉庫基礎(chǔ)上挖掘的知識通常以圖表、可視化、類自然語言等形式表示出來,但所挖掘的知識并不都是有意義的,必須進(jìn)行評價、篩選和驗(yàn)證,把有意義的知識放到知識庫中,隨著時間的推移將積累更多的知識。知識庫根據(jù)挖掘的知識類型包括總結(jié)性知識、關(guān)聯(lián)性知識、分類模型知識、聚類模型知識,這些知識通過相應(yīng)挖掘算法得到。五.基于數(shù)據(jù)倉庫的DDS決策可以解決哪些類型的問題DDS可以解決4個類型的問題:(1)查詢一組數(shù)
6、據(jù),可回答的問題如產(chǎn)品A的價格是多少?(2)采用數(shù)理統(tǒng)計(jì)模型、運(yùn)籌模型進(jìn)行定量分析,預(yù)測趨勢,可回答的問題如:某產(chǎn)品明年銷售形勢如何?(3)采用OLAP方法,通過代數(shù)運(yùn)算將有關(guān)信息抽取出來作為問題的答案,如:某月某公司的銷售怎樣?(4)采用數(shù)據(jù)挖掘技術(shù),通過對數(shù)據(jù)進(jìn)行邏輯運(yùn)算,找出它們之間內(nèi)在聯(lián)系,可回答的問題如:在某地影響某產(chǎn)品銷售的因素是什么?第1類和第2類問題在過去傳統(tǒng)DDS中得到一定解決,現(xiàn)在的DDS重點(diǎn)解決第3類和第4類問題。這些問題的提出與回答通過可視化工具在問題綜合與交互系統(tǒng)中實(shí)現(xiàn),可視化工具提高人機(jī)接口開發(fā)質(zhì)量和效率,使人機(jī)界面
7、更加簡潔、標(biāo)準(zhǔn)化。另外,可選用手寫輸入和聲音輸入工具軟件,便于決策者提出問題。該系統(tǒng)根據(jù)對決策問題的判斷,在知識庫和信息庫中查找解決方案,如查找到以直觀易理解的形式呈現(xiàn)給決策者,如查找不到再根據(jù)問題的性質(zhì)向下調(diào)用相應(yīng)的決策工具。