資源描述:
《客戶關(guān)系管理5數(shù)據(jù)挖掘與客戶關(guān)系管理》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、5.數(shù)據(jù)挖掘與客戶關(guān)系管理hongxj@njupt.edu.cn數(shù)據(jù)挖掘概述數(shù)據(jù)挖掘的任務(wù)、技術(shù)與實施過程數(shù)據(jù)挖掘在CRM中的應(yīng)用CRM數(shù)據(jù)挖掘案例數(shù)據(jù)挖掘的出現(xiàn)數(shù)據(jù)挖掘數(shù)據(jù)庫越來越大有價值的知識可怕的數(shù)據(jù)數(shù)據(jù)挖掘的出現(xiàn)數(shù)據(jù)爆炸,知識貧乏苦惱:淹沒在數(shù)據(jù)中;不能制定合適的決策!數(shù)據(jù)知識決策模式趨勢事實關(guān)系模型關(guān)聯(lián)規(guī)則序列目標市場資金分配貿(mào)易選擇在哪兒做廣告銷售的地理位置金融經(jīng)濟政府POS.人口統(tǒng)計生命周期數(shù)據(jù)挖掘的定義數(shù)據(jù)挖掘(DataMining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不
2、知道的、但又是潛在有用的信息和知識的過程。描述性模型:描述數(shù)據(jù)中的模式,用以創(chuàng)建有意義的群或子群?預(yù)測性模型:在從已知條件中確定的模式基礎(chǔ)上,預(yù)測一些現(xiàn)象或數(shù)值數(shù)據(jù)挖掘模型的分類數(shù)據(jù)挖掘描述預(yù)測統(tǒng)計回歸關(guān)聯(lián)規(guī)則決策樹可視化聚類順序關(guān)聯(lián)匯總神經(jīng)網(wǎng)絡(luò)分類數(shù)據(jù)挖掘的分類數(shù)據(jù)挖掘應(yīng)用英國電信需要發(fā)布一種新的產(chǎn)品,需要通過直郵的方式向客戶推薦這種產(chǎn)品……使直郵的回應(yīng)率提高了100%數(shù)據(jù)挖掘應(yīng)用GUS日用品零售商店需要準確的預(yù)測未來的商品銷售量,降低庫存成本……通過數(shù)據(jù)挖掘的方法使庫存成本比原來減少了3.8%匯豐銀行需要對不斷增長的客戶群進行分類,對每
3、種產(chǎn)品找出最有價值的客戶……營銷費用減少了30%數(shù)據(jù)挖掘應(yīng)用美國國防財務(wù)部需要從每年上百萬筆的軍火交易中發(fā)現(xiàn)可能存在的欺詐現(xiàn)象……發(fā)現(xiàn)可能存在欺詐的交易,進行深入調(diào)查,節(jié)約了大量的調(diào)查成本數(shù)據(jù)挖掘應(yīng)用美國國內(nèi)稅務(wù)局需要提高對納稅人的服務(wù)水平……合理安排稅務(wù)官的工作,為納稅人提供更迅捷、更準確的服務(wù)數(shù)據(jù)挖掘應(yīng)用電信:流失銀行:聚類(細分),交叉銷售百貨公司/超市:購物籃分析(關(guān)聯(lián)規(guī)則)保險:細分,交叉銷售,流失(原因分析)信用卡:欺詐探測,細分電子商務(wù):網(wǎng)站日志分析稅務(wù)部門:偷漏稅行為探測警察機關(guān):犯罪行為分析醫(yī)學:醫(yī)療保健數(shù)據(jù)挖掘應(yīng)用領(lǐng)域數(shù)
4、據(jù)挖掘效益分析(直郵)(BigBank&CreditCardCompany)目標:發(fā)現(xiàn)新客戶數(shù)據(jù)挖掘以前數(shù)據(jù)挖掘以后差別發(fā)信的數(shù)量1,000,000750,000(250,000)成本$1,000,000$750,000($250,000)響應(yīng)的數(shù)量10,0009,000(1,000)每個響應(yīng)的毛利$125$125$0總毛利$1,250,000$1,125,000($125,000)凈利潤$250,000$375,000$125,000建模的費用040,000$40,000最終的利潤$250,000$335,000$85,000數(shù)據(jù)挖掘技術(shù)
5、數(shù)據(jù)挖掘的方法很多,大致可分為:統(tǒng)計方法、機器學習方法、神經(jīng)網(wǎng)絡(luò)方法和數(shù)據(jù)庫方法。其中,統(tǒng)計方法可細分為:回歸分析(多元回歸、自回歸等)、判別分析(貝葉斯判別、費歇爾判別、非參數(shù)判別等)、聚類分析(系統(tǒng)聚類、動態(tài)聚類等)、探索性分析(主元分析法、相關(guān)分析法等)、以及模糊集、粗糙集、支持向量機等。機器學習中,可細分為:歸納學習方法(決策樹、規(guī)則歸納等)、基于范例的推理CBR、遺傳算法、貝葉斯信念網(wǎng)絡(luò)等。神經(jīng)網(wǎng)絡(luò)方法,可細分為:前向神經(jīng)網(wǎng)絡(luò)(BP算法等)、自組織神經(jīng)網(wǎng)絡(luò)(自組織特征映射、競爭學習等)等。數(shù)據(jù)庫方法主要是基于可視化的多維數(shù)據(jù)分析或
6、OLAP方法,另外還有面向?qū)傩缘臍w納方法。決策樹決策樹把數(shù)據(jù)歸入可能對一個目標變量有不同效果的規(guī)則組。例如,我們希望發(fā)現(xiàn)可能會對直郵有反應(yīng)的個人特點。這些特點可以解釋為一組規(guī)則。決策樹假設(shè)您是一個銷售一種新的銀行服務(wù)的直郵計劃研究的負責人。為最大程度地獲益,您希望確定基于前次促銷活動的家庭細分最有可能響應(yīng)相似的促銷活動。通常這可以通過查找最能把響應(yīng)前次促銷的家庭和沒有響應(yīng)的家庭區(qū)分開的人口統(tǒng)計信息變量的組合來實現(xiàn)。決策樹為您提供諸如誰會最好地響應(yīng)新的促銷等重要線索,并通過只郵寄給最有可能響應(yīng)的人來最大程度地獲得直郵效益,提高整體響應(yīng)率,并極
7、有希望同時增加銷售。決策樹圖決策樹應(yīng)用決策樹也是分析消耗(流線性生產(chǎn))、發(fā)現(xiàn)交叉銷售機會、進行促銷、信用風險或破產(chǎn)分析和發(fā)覺欺詐行為的得力工具。決策樹算法常用的算法有CHAID、CART、Quest和C5.0。決策樹的優(yōu)缺點:優(yōu)點:1)可以生成可以理解的規(guī)則。2)計算量相對來說不是很大。3)可以處理連續(xù)和種類字段。4)決策樹可以清晰的顯示哪些字段比較重要缺點:1)對連續(xù)性的字段比較難預(yù)測。2)對有時間順序的數(shù)據(jù),需要很多預(yù)處理的工作。3)當類別太多時,錯誤可能就會增加的比較快。4)一般的算法分類的時候,只是根據(jù)一個字段來分類。聚類分析聚類如
8、同通常所說的“物以類聚”,是把一組個體按照相似性歸成若干類別。它的目的是使屬于同一類別的個體之間的距離盡可能的小,而不同類別上的個體間的距離盡可能的大。它反映同類事物共同性質(zhì)的特