資源描述:
《基于約束的多維數(shù)據(jù)挖掘技術(shù).pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、第8卷第6期光學(xué)精密工程V0l.89N0.6Z000年1Z月0PTICSANDPRECISI0NENGINEERINGDeC.9Z000文章編號1004-9Z4X(Z000D06-0555-04基于約束的多維數(shù)據(jù)挖掘技術(shù)王曉升(長春工程學(xué)院計算機(jī)系9吉林長春100Z1D摘要:從特定查詢驅(qū)動的系統(tǒng)功能出發(fā)9討論了面向多維數(shù)據(jù)挖掘的重點}}五種約束9通過一個數(shù)據(jù)挖掘查詢實例9進(jìn)一步闡述了這些約束及所產(chǎn)生的關(guān)聯(lián)規(guī)則9并用數(shù)據(jù)挖掘查詢語言(DMOLD進(jìn)行表達(dá)G介紹和討論了關(guān)聯(lián)規(guī)則的處理9在挖掘關(guān)聯(lián)規(guī)則中9聯(lián)合使用維/層約束
2、和規(guī)則約束9能夠帶來高效的挖掘過程9一個規(guī)則約束如果能被較深地推入到分層結(jié)構(gòu)里9進(jìn)一步在當(dāng)前提取層和較深層上挖掘9是非常有價值的G最后給出了運(yùn)用本文思想的一種聯(lián)機(jī)分析挖掘系統(tǒng)的結(jié)構(gòu)9并對其組成~功能及特點進(jìn)行了描述G關(guān)鍵詞:約束G多維數(shù)據(jù)G數(shù)據(jù)倉庫G數(shù)據(jù)挖掘G0LAM中圖分類號:TP11文獻(xiàn)標(biāo)識碼:A這些圖表應(yīng)當(dāng)不僅包含關(guān)于統(tǒng)計屬性(象支1引言持度~可信度和相關(guān)性D的數(shù)字約束9而且包含基于屬性領(lǐng)域~種類和聚集上的約束9如HI.type=當(dāng)前的數(shù)據(jù)挖掘模型比較孤立9即缺少人的SHaCkSaHdaVg(I.priCeD
3、<100HG第二9數(shù)據(jù)挖導(dǎo)向與控制機(jī)制9從而挖掘性能及效率低下G而基掘系統(tǒng)能夠通過提供一個精致的挖掘查詢優(yōu)化于約束的挖掘(用戶提供一種指導(dǎo)查找的約束D9器9來支持有效處理和挖掘查詢的優(yōu)化9在查詢中能夠最佳實現(xiàn)人}}機(jī)勞動的劃分9極大地提高該優(yōu)化器利用用戶指明的各種約束及其屬性9產(chǎn)挖掘性能G當(dāng)前數(shù)據(jù)倉庫系統(tǒng)已為多維數(shù)據(jù)挖掘生與約束條件相匹配的訪問圖表G系統(tǒng)開發(fā)提供了豐富的土壤9基于約束的和多維的挖掘技術(shù)能夠?qū)崿F(xiàn)特定查詢驅(qū)動的系統(tǒng)9它比3約束:特定數(shù)據(jù)挖掘的重點當(dāng)前孤立的數(shù)據(jù)挖掘系統(tǒng)能更加有效地開發(fā)語義G通常把約束分成
4、五類:知識約束:指定要挖掘的知識類型9例如:2特定查詢驅(qū)動的數(shù)據(jù)挖掘系統(tǒng)概念描述~聯(lián)合~分類~預(yù)測~聚簇或異態(tài)9這些約束不同于其他約束9通常在查詢開始被指定G特定查詢驅(qū)動的數(shù)據(jù)挖掘系統(tǒng)比較適合用戶數(shù)據(jù)約束:指定與挖掘任務(wù)相關(guān)聯(lián)的數(shù)據(jù)查詢意圖9使知識推理過程更加高效G該挖掘系統(tǒng)集9在查詢過程中我們經(jīng)常用一種類似于SOL的具有兩個能力9第一9它能提供一種與SOL語言查詢和處理方式指定這種約束G相媲美的~面向挖掘的查詢語言(DMOLD9這種維/層約束:限定數(shù)據(jù)庫或數(shù)據(jù)倉庫中要檢語言能使用戶表達(dá):查的數(shù)據(jù)維/層9這種約束遵
5、循多維數(shù)據(jù)庫模型9要挖掘的部分?jǐn)?shù)據(jù)庫(叫做可挖掘的視并且體現(xiàn)了多維挖掘的實質(zhì)G這樣9多維挖掘能被圖D9平滑地與基于約束的挖掘結(jié)構(gòu)溶合為一體G要挖掘的圖表/規(guī)則的類型9規(guī)則約束:指定對要挖掘的規(guī)則的具體約令人滿意的圖表屬性G束G收稿日期:Z000-05-ZG修訂日期:Z000-06-15558光學(xué)精密工程8卷-趣性(Interestingness)約束,指定所發(fā)現(xiàn)的groupbyC,I.category有關(guān)圖表度量范圍,從統(tǒng)計學(xué)的觀點看,什么范圍havingsum(I.price)<1OOandmin(J.是有用的或
6、有趣的,price)}5OO用實例說明這五種約束,假定存在一個具有Withmin-support=O.O1andmin-confi-4個相互關(guān)聯(lián)的銷售多維數(shù)據(jù)庫dence=O.5-sales(customer-name,item-name,程序2transaction-id),lives(C,-,"Vancouver")andsales(C,"-lives(customer-name,district,city),Census-CD",)and-item(item-name,category,price),和sal
7、es(C,"MS/office97",-)=>sales-transaction(transaction-id,day,month,(C,"MS/S@LServer",-)[O.O15;O.68]year),知識類型約束和數(shù)據(jù)約束應(yīng)用于數(shù)據(jù)挖掘之這里lives,item,和transaction是三維表,前,不與挖掘過程捆綁在一起,運(yùn)用這兩種約束這些表通過三個關(guān)鍵字段customer-name~item-后,挖掘程序可首先挖掘所有可能的規(guī)則,然后利name和transaction-id與sales表相關(guān)聯(lián),用其它三
8、種約束篩選出不滿足這些約束的規(guī)則,對1998年Vancouver(溫哥華市)顧客,查但是這樣產(chǎn)生的挖掘?qū)⑹菬o效或有時極昂貴的,找在同類產(chǎn)品中什么便宜物品(總價格在$1OO因此,分析這些約束和挖掘有價值的屬性是非常以下)可能促使什么貴重物品(最低價格為$5OO)必要的,這就要求把約束推到較深的挖掘過程內(nèi)的銷售,這是一種關(guān)聯(lián)挖掘查詢,用數(shù)據(jù)挖掘查部排除早先的無關(guān)