資源描述:
《決策樹方法在煤炭物流客戶分析中的應(yīng)用.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、co唧啪r西畫船e矗昭覦dApp腸m如船計算機工程與應(yīng)用2010,46(10)245決策樹方法在煤炭物流客戶分析中的應(yīng)用段富,曾祥東,牛保寧DUANFu,ZENGXiang-dong,NIUBao—ning太原理工大學計算機與軟件學院,太原030024CouegeofComputer鋤dScience,rI'aiy咖UniVers畸ofTechnolog)r,Tai”粕030024,ChimE.mail:xian酣ongzeng@163.comDUANFu,zENG】
2、【iang—do贍。NIUBao一血gIAppIi姐ti伽o
3、fd∞isi明缸讎in鋤d燦ofc砌logis觚customer.ComputerEng.m∞r(nóng)ingandAl'Imcatio璐。20lO。46(10):245—248.Abstract:Thereare10tsofhistoricalcustofnerdatainlo舀sticsenterprises.Tbu石lizetIlesedatae丘_ectively,customercl鷦s訪cationusingdataminingisver)rimportantinCRM.Decisionh_ieeiso∞ofthemostp
4、叩lll盯toolst0class訪cation衄ddatalIlining.Thi8thesismailllydiscusseshowtobuildadecisiontreeofcoallogisticscustomerallalysisbyu8ingC4.5algorithm蛐dthe印plica-ti徹ofmlestocustomercl鷦smcationinlogisticsente叩rise.Theexperimentre8uhshow$tIIatthemethodh聃greatvaluein印一plication.K
5、eywords:deci8iontree;c4.5algorithm;pmne;customeranaly8is摘要:目前物流企業(yè)中積累了大量的客戶歷史數(shù)據(jù),為了有效利用這些數(shù)據(jù),使用數(shù)據(jù)挖掘方法對客戶進行分類管理和服務(wù)是CRM中非常重要的一方面。而決策樹是進行分類分析與數(shù)據(jù)挖掘的常用方法。研究了運用C4.5算法對煤炭物流客戶信息構(gòu)造決策樹,并把提取到的規(guī)則應(yīng)用到公路煤炭物流公司的客戶關(guān)系管理中,結(jié)果證明具有較好的應(yīng)用價值。關(guān)鍵詞:決策樹;C4.5算法;剪枝;客戶分析DoI:lO.3778/j.issn.1002—8331.20
6、10.10.076文章編導:1002—8331(2010)10-0245—04文獻標i只碼:A中圖分類號:7I鸛111引言?!?shù)據(jù)挖掘(DataMiniIlg)是從大量數(shù)據(jù)中提取或“挖掘”知識【ll。決策樹作為數(shù)據(jù)挖掘中的一種重要分類方法,已在很多領(lǐng)域得到成功應(yīng)用,但在煤炭物流業(yè)中的應(yīng)用研究卻比較少。隨著地區(qū)經(jīng)濟的快速發(fā)展,煤炭需求量日益增加,并且呈現(xiàn)出行業(yè)需求的明顯差異性。根據(jù)經(jīng)濟學中“20%的客戶創(chuàng)造80%的利潤”的原則,煤炭物流公司要實現(xiàn)經(jīng)濟利潤最大化,就有必要對其客戶進行分類管理和服務(wù),利用數(shù)據(jù)挖掘技術(shù)挖掘出20%的大客
7、戶群體所隱含的固有特征。將決策樹C4.5算法應(yīng)用到山西省煤炭運銷總公司公路公司CRM系統(tǒng)中。幫助企業(yè)深入了解客戶行為,制定恰當?shù)臓I銷策略。2決策樹決策樹是以實例為基礎(chǔ)的歸納算法,著眼于從一組無次序、無規(guī)則的事例中推理出決策樹表示形式的分類規(guī)則。構(gòu)造決策樹,需要由訓練樣本數(shù)據(jù)集作為輸入。訓練集由一組數(shù)據(jù)記錄(元組)組成,每條記錄由多個特征屬性和一個類別屬性構(gòu)成?!獋€樣本可以形式化地表示為(A,,A2,?,A。,c),其中,A;表示特征屬性;c表示類別屬性。常見的決策樹算法有ID3,c4.5,CART,suQ等,其中,c4.5算法是
8、J.R.QtlirIl鋤于1993年提出的一種對ID3的改進算法,利用信息增益率來尋找樹節(jié)點上具有最大信息量的屬性,它彌補了ID3在應(yīng)用中只能處理離散型的描述性屬性的不足,加進了對連續(xù)型屬性和屬性值空缺情況的處理。在煤炭物流客戶分析中應(yīng)用c4.5算法生成決策樹的過程如圖l所示。圖l決策樹生成的過程模型基金項目:山西省自然科學基金(theNaturalscienceFoundationofshan】£iPr嘶n∞0fcIli艇underG啪tNo.2008011039);山西省科技攻關(guān)計劃(theKey1k}IIlol曬e8R&D
9、Pmg阻mofSIlanxjPm“nce,ChinaunderGrantNo.2007031129)。作者簡介:段富(1958一),男,博士,教授,主要研究方向:軟件開發(fā)環(huán)境與工具、軟件理論與算法等;曾祥東,男,碩士研究生。主要研究方向:數(shù)據(jù)挖掘;牛保寧,男,博