資源描述:
《數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用研究[摘要]電子商務(wù)在現(xiàn)代商務(wù)活動中的正變得日趨重要,而商務(wù)數(shù)據(jù)的處理則凸顯出數(shù)據(jù)挖掘的重要。本文討論了數(shù)據(jù)挖掘的主要方法,具體闡述了數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的作用及應(yīng)用?! 關(guān)鍵詞]數(shù)據(jù)挖掘電子商務(wù)數(shù)據(jù)庫 一、概述 數(shù)據(jù)挖掘(DataMining)起源于數(shù)據(jù)庫中的知識發(fā)現(xiàn)(Knoerce)是以指利用電子數(shù)據(jù)交換(ElectronicDataInterchange,EDI)、電子郵件(E-mail)、電子資金轉(zhuǎn)賬(ElectronicFundsTransfer,EFT)和Inter等主要技術(shù)在個人、企業(yè)和國家之間進(jìn)行無紙化的信息交
2、換,包括商品信息及其訂購信息、資金信息及其支付信息、安全及其認(rèn)證信息等,即以現(xiàn)代信息技術(shù)為手段,以經(jīng)濟(jì)效益為中心的現(xiàn)代化商業(yè)運(yùn)轉(zhuǎn)模式。其最終目標(biāo)是實(shí)現(xiàn)商務(wù)活動的網(wǎng)絡(luò)化、自動化與智能化?! ‰S著Inter的迅速發(fā)展,電子商務(wù)的應(yīng)用不斷深入。在電子商務(wù)應(yīng)用系統(tǒng)中,相關(guān)的用戶數(shù)據(jù)日益增多,數(shù)據(jù)挖掘技術(shù)具有從大量復(fù)雜數(shù)據(jù)中發(fā)現(xiàn)特定規(guī)律的能力。商業(yè)電子化的趨勢不僅為客戶提供了便利的交易方式和廣泛的選擇,同時也為商家提供了更加深入了解客戶需求信息和購物行為特征的可能性?! 《?shù)據(jù)挖掘的主要方法 數(shù)據(jù)挖掘融合了數(shù)據(jù)庫、人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計學(xué)等多個領(lǐng)域的理論和技術(shù)。比較典型的數(shù)
3、據(jù)挖掘方法有分類、關(guān)聯(lián)規(guī)則分析、聚類分析和孤立點(diǎn)分析等。 1.分類。分類是找出一個類別的概念描述,它代表了這類數(shù)據(jù)的整體信息,即該類的內(nèi)涵描述,一般用規(guī)則或決策樹模式表示。實(shí)際上就是通過分析示例數(shù)據(jù)庫中的數(shù)據(jù),為每個類別做出準(zhǔn)確的描述或建立分析模型或挖掘出分類規(guī)則,然后用這個分類規(guī)則對其他數(shù)據(jù)庫中的記錄進(jìn)行分類?! ?.關(guān)聯(lián)規(guī)則分析。關(guān)聯(lián)規(guī)則分析用于發(fā)現(xiàn)關(guān)聯(lián)規(guī)則。若兩個或多個數(shù)據(jù)項的取值重復(fù)出現(xiàn)且概率很高時,它就存在著某種關(guān)聯(lián),可以建立起這些數(shù)據(jù)項的關(guān)聯(lián)規(guī)則,一般用“支持度”和“置信度”兩個閩值來淘汰那些無用的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則分析能發(fā)現(xiàn)數(shù)據(jù)庫中諸如“90%的顧客在一
4、次購買活動中購買商品A的同時購買商品B”之類的特征?! ?.聚類分析。聚類分析的對象是一組未分類記錄,并且這些記錄應(yīng)分成幾類事先也不知道。聚類就是通過分析數(shù)據(jù)庫中的記錄數(shù)據(jù),根據(jù)一定的分類規(guī)則,合理地劃分記錄集合,確定每個記錄所在類別。它所采用的分類規(guī)則是由聚類分析工具決定的。采用不同的聚類方法,對于相同的記錄集合可能有不同的劃分結(jié)果?! ?.孤立點(diǎn)分析。數(shù)據(jù)庫中的數(shù)據(jù)常有一些異常記錄,這些記錄稱為孤立點(diǎn),常常包括很多潛在的知識,如分類中的反常實(shí)例、不滿足規(guī)則的特例、觀測結(jié)果與模型預(yù)測值的偏差、量值隨時間的變化等。孤立點(diǎn)分析基本方法是尋找觀測結(jié)果與參照之間的差別?! ∪?/p>
5、、據(jù)據(jù)挖掘在的應(yīng)用 數(shù)據(jù)挖掘的應(yīng)用十分廣泛,如銀行、電信、保險、交通、零售(如超級市場)等領(lǐng)域。數(shù)據(jù)挖掘所能解決的典型商業(yè)問題包括數(shù)據(jù)庫營銷(DatabaseMarketing)、客戶群體劃分(CustomerSegmentationClassification)、背景分析(ProfileAnalysis)、交叉銷售(Cross-selling)等市場分析行為,以及客戶流失性分析(ChurnAnalysis)、客戶信用記分(CreditScoring)和欺詐發(fā)現(xiàn)(FraudDetection)等?! 》诸惖哪康氖菢?gòu)造一個分類函數(shù)或分類模型,通常稱作分類器。分類器的構(gòu)造
6、方法通常由統(tǒng)計方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法等。在金融領(lǐng)域,管理者可以通過對客戶償還能力以及信用的分析,進(jìn)行分類,評出等級,減少放貸的盲目性,提高資金的使用效率?! ≡诹闶蹣I(yè),數(shù)據(jù)挖掘可有助于識別顧客購買行為,發(fā)現(xiàn)顧客購買模式和趨勢,改進(jìn)服務(wù)質(zhì)量,取得更好的顧客保持力和滿意程度,提高貨品銷量比率,設(shè)計更好的貨品運(yùn)輸與分銷策略,減少商業(yè)成本。 電信、計算機(jī)網(wǎng)絡(luò)、因特網(wǎng)和各種其它方式的通信和計算的融合是目前的大勢所趨。利用數(shù)據(jù)挖掘技術(shù)來幫助理解商業(yè)行為、確定電信模式、捕捉盜用行為、更好的利用資源和提高服務(wù)質(zhì)量是非常有必要的,通過挖掘進(jìn)行盜用模式分析和異常模式識別,從而可
7、盡早發(fā)現(xiàn)盜用,為公司減少損失?! ?shù)據(jù)挖掘是一個非常復(fù)雜的過程。每一種數(shù)據(jù)挖掘技術(shù)方法都有其自身的特點(diǎn)和實(shí)現(xiàn)步驟。每種數(shù)據(jù)挖掘的技術(shù)方法對輸入/輸出數(shù)據(jù)形式的要求、結(jié)構(gòu)、參數(shù)設(shè)置、訓(xùn)練、測試和模型評價方式各自有不同的要求,算法應(yīng)用領(lǐng)域的含義和能力也存在差異。數(shù)據(jù)挖掘過程一般分為定義問題、準(zhǔn)備數(shù)據(jù)、實(shí)施挖掘、評價與表示等幾個階段。數(shù)據(jù)挖掘過程的這幾個階段都需要人的參與指導(dǎo)?! ∷?、結(jié)束語 數(shù)據(jù)挖掘是指按企業(yè)既定業(yè)務(wù)目標(biāo),對大量的企業(yè)數(shù)據(jù)進(jìn)行探索和分析,揭示隱藏的、未知的或驗證已知的規(guī)律性,并進(jìn)一步將其模型化的先進(jìn)有效的方法。電子商務(wù)是現(xiàn)代