數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘?qū)嶒?yàn)三(數(shù)據(jù)挖掘)

數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘?qū)嶒?yàn)三(數(shù)據(jù)挖掘)

ID:30892924

大?。?42.57 KB

頁(yè)數(shù):9頁(yè)

時(shí)間:2019-01-03

數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘?qū)嶒?yàn)三(數(shù)據(jù)挖掘)_第1頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘?qū)嶒?yàn)三(數(shù)據(jù)挖掘)_第2頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘?qū)嶒?yàn)三(數(shù)據(jù)挖掘)_第3頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘?qū)嶒?yàn)三(數(shù)據(jù)挖掘)_第4頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘?qū)嶒?yàn)三(數(shù)據(jù)挖掘)_第5頁(yè)
資源描述:

《數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘?qū)嶒?yàn)三(數(shù)據(jù)挖掘)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。

1、一、實(shí)驗(yàn)內(nèi)容和目的目的:1.理解數(shù)據(jù)挖掘的基本概念及其過(guò)程;2.理解數(shù)據(jù)挖掘與數(shù)據(jù)倉(cāng)庫(kù)、OLAP之間的關(guān)系3.理解基本的數(shù)據(jù)挖掘技術(shù)與方法的工作原理與過(guò)程,掌握數(shù)據(jù)挖掘相關(guān)工具的使用。內(nèi)容:將創(chuàng)建一個(gè)數(shù)據(jù)挖掘模型以訓(xùn)練銷(xiāo)售數(shù)據(jù),并使用“Microsoft決策樹(shù)”算法在客戶群中找岀會(huì)員卡選擇模式。請(qǐng)將要挖掘的維度(事例維度)設(shè)置為客戶,再將Member_Card成員的屬性設(shè)置為數(shù)據(jù)挖掘算法識(shí)別模式時(shí)要使用的信息。然后選擇人口統(tǒng)讓特征列表,算法將從屮確定模式:婚姻狀況、年收入、在家子女?dāng)?shù)和教育程度。下一步需要訓(xùn)練模型,以便能夠?yàn)g覽樹(shù)視圖并從中讀取模式。市場(chǎng)部

2、將根據(jù)這些模式設(shè)計(jì)新的會(huì)員卡,使其適應(yīng)巾請(qǐng)各類(lèi)會(huì)員卡的客戶類(lèi)型。二、所用儀器、材料(設(shè)備名稱(chēng)、型號(hào)、規(guī)格等)操作系統(tǒng)平臺(tái):Windows7數(shù)據(jù)庫(kù)平臺(tái):SQLServer2008SP2三、實(shí)驗(yàn)原理知識(shí)發(fā)現(xiàn)被認(rèn)為是從數(shù)據(jù)中發(fā)現(xiàn)有用知識(shí)的整個(gè)過(guò)程。數(shù)據(jù)挖掘被認(rèn)為是KDD過(guò)程中的一個(gè)特定步驟,它用專(zhuān)門(mén)算法從數(shù)據(jù)中抽取模式。KDD過(guò)程定義為:KDD是從數(shù)據(jù)集屮識(shí)別出有效出、新穎的、潛在有用的,以及最終可理解的模式的高級(jí)處理過(guò)程。KDD過(guò)程可以概括為3部分:數(shù)據(jù)準(zhǔn)備(datapreparation),數(shù)據(jù)挖掘及結(jié)呆的解釋和評(píng)估(inteipretation&eval

3、uation)□數(shù)據(jù)挖掘的對(duì)象主要是關(guān)系數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù),這是典型的結(jié)構(gòu)化數(shù)據(jù)。隨著技術(shù)的發(fā)展,數(shù)據(jù)挖掘?qū)ο笾鸩綌U(kuò)大到半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù),這主要是文本數(shù)據(jù)、圖像與視頻數(shù)據(jù)以及Web數(shù)據(jù)等。數(shù)據(jù)挖掘任務(wù)有6項(xiàng):關(guān)聯(lián)分析、時(shí)序模式、聚類(lèi)、分類(lèi)、偏差檢測(cè)、預(yù)測(cè)。數(shù)據(jù)挖掘方法是由人工智能、機(jī)器學(xué)習(xí)的方法發(fā)展而來(lái),結(jié)合傳統(tǒng)的統(tǒng)計(jì)分析方法、模糊數(shù)學(xué)方法以及科學(xué)計(jì)算可視化技術(shù),以數(shù)據(jù)庫(kù)為研究對(duì)象,形成了數(shù)據(jù)挖掘方法和技術(shù)。數(shù)據(jù)挖掘方法和技術(shù)可以分為6大類(lèi):1.歸納學(xué)習(xí)的信息論方法:ID3等方法(決策樹(shù)方法)、IBLE方法(決策規(guī)則樹(shù)方法)2.歸納學(xué)習(xí)的集合論方法:

4、粗糙集(roughset)方法、關(guān)聯(lián)規(guī)則挖掘、覆蓋正例排斥反例方法、概念樹(shù)方法。3.仿生物技術(shù)的神經(jīng)網(wǎng)絡(luò)方法:前饋式網(wǎng)絡(luò)、反饋式網(wǎng)絡(luò)、自組織網(wǎng)絡(luò)4.仿生物技術(shù)的遺傳算法:繁殖(選擇)、交叉(重組)、變異(突變)5.數(shù)據(jù)數(shù)據(jù)的公式發(fā)現(xiàn):物理定律發(fā)現(xiàn)系統(tǒng)BACON、經(jīng)驗(yàn)公式發(fā)現(xiàn)系統(tǒng)FDD6.可視化技術(shù):提取兒何圖元、繪制、顯示和演放四、實(shí)驗(yàn)方法、步驟耍求:利用實(shí)驗(yàn)室和指導(dǎo)教師捉供的實(shí)驗(yàn)軟件,認(rèn)真完成規(guī)定的實(shí)驗(yàn)內(nèi)容,真實(shí)地記錄實(shí)驗(yàn)屮遇到的各種問(wèn)題和解決的方法與過(guò)程,并根據(jù)實(shí)驗(yàn)案例繪出多維數(shù)據(jù)組織模型及其OLAP操作過(guò)程。實(shí)驗(yàn)完成后,應(yīng)根據(jù)實(shí)驗(yàn)情況寫(xiě)出實(shí)驗(yàn)報(bào)告。

5、五、實(shí)驗(yàn)過(guò)程原始記錄(數(shù)據(jù)、圖表、計(jì)算等)本實(shí)驗(yàn)使用MicrosoftSQLServer的數(shù)據(jù)挖掘工具,對(duì)一組電信運(yùn)營(yíng)商的客戶數(shù)據(jù)進(jìn)行挖掘,分析客戶流失特征,以此來(lái)預(yù)測(cè)當(dāng)前可能流失的客戶,為企業(yè)營(yíng)銷(xiāo)捉供支持。?首先將待挖掘數(shù)據(jù)(存放于文木文件屮)導(dǎo)入數(shù)據(jù)庫(kù)先在數(shù)據(jù)庫(kù)中建立數(shù)據(jù)表(若直接導(dǎo)入,相應(yīng)字段的數(shù)據(jù)類(lèi)型不匹配,會(huì)影響挖掘效果)USE[DW]GOSETANSI_NULLSONGOSETQUOTED_IDENTIFIERONGOCREATETABLE[dbo]?[丿〈理PAS流失訓(xùn)I幼訂([SERV_ID][float]NULL,--服務(wù):ED[CUS

6、T_ID][float]NULL,[ZWSC][float]NULL,--在網(wǎng)時(shí)長(zhǎng)[BILLING_MODE_ID][float]NULL,[PAYMENT_METHOD][float]NULL,--付費(fèi)方式[ORG_ID][float]NULL,—地區(qū)ID[NEW_YXSX][float]NULL,[ZWSC_DSC][nvarchar](255)NULL,[KB][nvarchar](255)NULL,--捆綁其他業(yè)務(wù)[AGE][nvarchar](255)NULL,--年齡[LX][nvarchar](255)NULL,-一來(lái)電顯示[CL][nva

7、rchar](255)NULL,一一彩鈴[FEE_ALL][nvarchar](255)NULL,[YC][nvarchar](255)NULL,-一于頁(yè)存[IS_LS][float]NULL--是否流失,0表示未流失,1表示流失)ON[PRIMARY]GO導(dǎo)入待挖掘數(shù)據(jù)?和《Wt8??ttaa^wsrT*.QAC9CM9■J.?実*?KUkWFMM3MC■"MLXS?nira^u??t?r?u?w?o.“■和y'dAllCXtw?MnttltJM(4】W]■助QPI■為SQLQuery4.sqHYANG-PC.DW(sa(52))*select*fro

8、m大理PAS流失訓(xùn)練總結(jié)果tj消息SERVJDCUSTJDZWSCBILLING

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。