資源描述:
《數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用研究.doc》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用研究[摘要]電子商務(wù)在現(xiàn)代商務(wù)活動中的正變得日趨重要,而商務(wù)數(shù)據(jù)的處理則凸顯出數(shù)據(jù)挖掘的重要。本文討論了數(shù)據(jù)挖掘的主要方法,具體闡述了數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的作用及應(yīng)用?! 關(guān)鍵詞]數(shù)據(jù)挖掘電子商務(wù)數(shù)據(jù)庫 一、概述 數(shù)據(jù)挖掘(DataMining)起源于數(shù)據(jù)庫中的知識發(fā)現(xiàn)(KnowledgeDiscoverinDatabase,KDD),是指從大型數(shù)據(jù)庫或數(shù)據(jù)倉庫中提取隱含的、未知的、非平凡且最終可理解的及有潛在應(yīng)用價值的信息或模式。數(shù)據(jù)挖掘技術(shù)是計算機(jī)技術(shù)發(fā)展的熱點之一。通過對歷史積累的大量數(shù)據(jù)的有效挖掘,可以發(fā)現(xiàn)隱藏的規(guī)律或模式,為決策提供支持
2、,而這些規(guī)律或模式是不能夠依靠簡單的數(shù)據(jù)查詢得到,或者是不能在可接受的時間內(nèi)得到。這些規(guī)律或模式可以進(jìn)一步在專業(yè)人員的識別下成為知識,并可以應(yīng)用到以客戶為中心的企業(yè)決策分析和管理的各個不同領(lǐng)域和階段?! ‰娮由虅?wù)(E-Commerce)是以指利用電子數(shù)據(jù)交換(ElectronicDataInterchange,EDI)、電子郵件(E-mail)、電子資金轉(zhuǎn)賬(ElectronicFundsTransfer,EFT)和Internet等主要技術(shù)在個人、企業(yè)和國家之間進(jìn)行無紙化的信息交換,包括商品信息及其訂購信息、資金信息及其支付信息、安全及其認(rèn)證信息等,即以現(xiàn)代信息技術(shù)為手段,以經(jīng)濟(jì)效益為中
3、心的現(xiàn)代化商業(yè)運轉(zhuǎn)模式。其最終目標(biāo)是實現(xiàn)商務(wù)活動的網(wǎng)絡(luò)化、自動化與智能化?! ‰S著Internet的迅速發(fā)展,電子商務(wù)的應(yīng)用不斷深入。在電子商務(wù)應(yīng)用系統(tǒng)中,相關(guān)的用戶數(shù)據(jù)日益增多,數(shù)據(jù)挖掘技術(shù)具有從大量復(fù)雜數(shù)據(jù)中發(fā)現(xiàn)特定規(guī)律的能力。商業(yè)電子化的趨勢不僅為客戶提供了便利的交易方式和廣泛的選擇,同時也為商家提供了更加深入了解客戶需求信息和購物行為特征的可能性?! 《?、數(shù)據(jù)挖掘的主要方法 數(shù)據(jù)挖掘融合了數(shù)據(jù)庫、人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計學(xué)等多個領(lǐng)域的理論和技術(shù)。比較典型的數(shù)據(jù)挖掘方法有分類、關(guān)聯(lián)規(guī)則分析、聚類分析和孤立點分析等?! ?.分類。分類是找出一個類別的概念描述,它代表了這類數(shù)據(jù)的整體信
4、息,即該類的內(nèi)涵描述,一般用規(guī)則或決策樹模式表示。實際上就是通過分析示例數(shù)據(jù)庫中的數(shù)據(jù),為每個類別做出準(zhǔn)確的描述或建立分析模型或挖掘出分類規(guī)則,然后用這個分類規(guī)則對其他數(shù)據(jù)庫中的記錄進(jìn)行分類?! ?.關(guān)聯(lián)規(guī)則分析。關(guān)聯(lián)規(guī)則分析用于發(fā)現(xiàn)關(guān)聯(lián)規(guī)則。若兩個或多個數(shù)據(jù)項的取值重復(fù)出現(xiàn)且概率很高時,它就存在著某種關(guān)聯(lián),可以建立起這些數(shù)據(jù)項的關(guān)聯(lián)規(guī)則,一般用“支持度”和“置信度”兩個閩值來淘汰那些無用的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則分析能發(fā)現(xiàn)數(shù)據(jù)庫中諸如“90%的顧客在一次購買活動中購買商品A的同時購買商品B”之類的特征?! ?.聚類分析。聚類分析的對象是一組未分類記錄,并且這些記錄應(yīng)分成幾類事先也不知道。聚類就
5、是通過分析數(shù)據(jù)庫中的記錄數(shù)據(jù),根據(jù)一定的分類規(guī)則,合理地劃分記錄集合,確定每個記錄所在類別。它所采用的分類規(guī)則是由聚類分析工具決定的。采用不同的聚類方法,對于相同的記錄集合可能有不同的劃分結(jié)果?! ?.孤立點分析。數(shù)據(jù)庫中的數(shù)據(jù)常有一些異常記錄,這些記錄稱為孤立點,常常包括很多潛在的知識,如分類中的反常實例、不滿足規(guī)則的特例、觀測結(jié)果與模型預(yù)測值的偏差、量值隨時間的變化等。孤立點分析基本方法是尋找觀測結(jié)果與參照之間的差別?! ∪?、據(jù)據(jù)挖掘在的應(yīng)用 數(shù)據(jù)挖掘的應(yīng)用十分廣泛,如銀行、電信、保險、交通、零售(如超級市場)等領(lǐng)域。數(shù)據(jù)挖掘所能解決的典型商業(yè)問題包括數(shù)據(jù)庫營銷(DatabaseMa
6、rketing)、客戶群體劃分(CustomerSegmentation&Classification)、背景分析(ProfileAnalysis)、交叉銷售(Cross-selling)等市場分析行為,以及客戶流失性分析(ChurnAnalysis)、客戶信用記分(CreditScoring)和欺詐發(fā)現(xiàn)(FraudDetection)等?! 》诸惖哪康氖菢?gòu)造一個分類函數(shù)或分類模型,通常稱作分類器。分類器的構(gòu)造方法通常由統(tǒng)計方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法等。在金融領(lǐng)域,管理者可以通過對客戶償還能力以及信用的分析,進(jìn)行分類,評出等級,減少放貸的盲目性,提高資金的使用效率?! ≡诹闶蹣I(yè),數(shù)據(jù)
7、挖掘可有助于識別顧客購買行為,發(fā)現(xiàn)顧客購買模式和趨勢,改進(jìn)服務(wù)質(zhì)量,取得更好的顧客保持力和滿意程度,提高貨品銷量比率,設(shè)計更好的貨品運輸與分銷策略,減少商業(yè)成本。 電信、計算機(jī)網(wǎng)絡(luò)、因特網(wǎng)和各種其它方式的通信和計算的融合是目前的大勢所趨。利用數(shù)據(jù)挖掘技術(shù)來幫助理解商業(yè)行為、確定電信模式、捕捉盜用行為、更好的利用資源和提高服務(wù)質(zhì)量是非常有必要的,通過挖掘進(jìn)行盜用模式分析和異常模式識別,從而可盡早發(fā)現(xiàn)盜用,為公司減少損失。