資源描述:
《數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用研究的論文》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用研究的論文[摘要]電子商務(wù)在現(xiàn)代商務(wù)活動(dòng)中的正變得日趨重要,而商務(wù)數(shù)據(jù)的處理則凸顯出數(shù)據(jù)挖掘的重要。本文討論了數(shù)據(jù)挖掘的主要方法,具體闡述了數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的作用及應(yīng)用。 [關(guān)鍵詞]數(shù)據(jù)挖掘電子商務(wù)數(shù)據(jù)庫 一、概述 數(shù)據(jù)挖掘(datamining)起源于數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)(knoerce)是以指利用電子數(shù)據(jù)交換(electronicdatainterchange,edi)、電子郵件(e-mail)、電子資金轉(zhuǎn)賬(electronicfundstransfer,eft)和inter等主要技術(shù)在個(gè)人、企業(yè)和國家之間進(jìn)
2、行無紙化的信息交換,包括商品信息及其訂購信息、資金信息及其支付信息、安全及其認(rèn)證信息等,即以現(xiàn)代信息技術(shù)為手段,以經(jīng)濟(jì)效益為中心的現(xiàn)代化商業(yè)運(yùn)轉(zhuǎn)模式。其最終目標(biāo)是實(shí)現(xiàn)商務(wù)活動(dòng)的網(wǎng)絡(luò)化、自動(dòng)化與智能化。 隨著inter的迅速發(fā)展,電子商務(wù)的應(yīng)用不斷深入。.cOm在電子商務(wù)應(yīng)用系統(tǒng)中,相關(guān)的用戶數(shù)據(jù)日益增多,數(shù)據(jù)挖掘技術(shù)具有從大量復(fù)雜數(shù)據(jù)中發(fā)現(xiàn)特定規(guī)律的能力。商業(yè)電子化的趨勢(shì)不僅為客戶提供了便利的交易方式和廣泛的選擇,同時(shí)也為商家提供了更加深入了解客戶需求信息和購物行為特征的可能性?! 《?shù)據(jù)挖掘的主要方法 數(shù)據(jù)挖掘融合了數(shù)據(jù)庫、人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等
3、多個(gè)領(lǐng)域的理論和技術(shù)。比較典型的數(shù)據(jù)挖掘方法有分類、關(guān)聯(lián)規(guī)則分析、聚類分析和孤立點(diǎn)分析等?! ?.分類。分類是找出一個(gè)類別的概念描述,它代表了這類數(shù)據(jù)的整體信息,即該類的內(nèi)涵描述,一般用規(guī)則或決策樹模式表示。實(shí)際上就是通過分析示例數(shù)據(jù)庫中的數(shù)據(jù),為每個(gè)類別做出準(zhǔn)確的描述或建立分析模型或挖掘出分類規(guī)則,然后用這個(gè)分類規(guī)則對(duì)其他數(shù)據(jù)庫中的記錄進(jìn)行分類?! ?.關(guān)聯(lián)規(guī)則分析。關(guān)聯(lián)規(guī)則分析用于發(fā)現(xiàn)關(guān)聯(lián)規(guī)則。若兩個(gè)或多個(gè)數(shù)據(jù)項(xiàng)的取值重復(fù)出現(xiàn)且概率很高時(shí),它就存在著某種關(guān)聯(lián),可以建立起這些數(shù)據(jù)項(xiàng)的關(guān)聯(lián)規(guī)則,一般用“支持度”和“置信度”兩個(gè)閩值來淘汰那些無用的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)
4、規(guī)則分析能發(fā)現(xiàn)數(shù)據(jù)庫中諸如“90%的顧客在一次購買活動(dòng)中購買商品a的同時(shí)購買商品b”之類的特征?! ?.聚類分析。聚類分析的對(duì)象是一組未分類記錄,并且這些記錄應(yīng)分成幾類事先也不知道。聚類就是通過分析數(shù)據(jù)庫中的記錄數(shù)據(jù),根據(jù)一定的分類規(guī)則,合理地劃分記錄集合,確定每個(gè)記錄所在類別。它所采用的分類規(guī)則是由聚類分析工具決定的。采用不同的聚類方法,對(duì)于相同的記錄集合可能有不同的劃分結(jié)果?! ?.孤立點(diǎn)分析。數(shù)據(jù)庫中的數(shù)據(jù)常有一些異常記錄,這些記錄稱為孤立點(diǎn),常常包括很多潛在的知識(shí),如分類中的反常實(shí)例、不滿足規(guī)則的特例、觀測(cè)結(jié)果與模型預(yù)測(cè)值的偏差、量值隨時(shí)間的變化等。孤
5、立點(diǎn)分析基本方法是尋找觀測(cè)結(jié)果與參照之間的差別?! ∪?jù)據(jù)挖掘在的應(yīng)用 數(shù)據(jù)挖掘的應(yīng)用十分廣泛,如銀行、電信、保險(xiǎn)、交通、零售(如超級(jí)市場(chǎng))等領(lǐng)域。數(shù)據(jù)挖掘所能解決的典型商業(yè)問題包括數(shù)據(jù)庫營銷(databasemarketing)、客戶群體劃分(customersegmentationclassification)、背景分析(profileanalysis)、交叉銷售(cross-selling)等市場(chǎng)分析行為,以及客戶流失性分析(churnanalysis)、客戶信用記分(creditscoring)和欺詐發(fā)現(xiàn)(frauddetection)等?! 》诸?/p>
6、的目的是構(gòu)造一個(gè)分類函數(shù)或分類模型,通常稱作分類器。分類器的構(gòu)造方法通常由統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法等。在金融領(lǐng)域,管理者可以通過對(duì)客戶償還能力以及信用的分析,進(jìn)行分類,評(píng)出等級(jí),減少放貸的盲目性,提高資金的使用效率。 在零售業(yè),數(shù)據(jù)挖掘可有助于識(shí)別顧客購買行為,發(fā)現(xiàn)顧客購買模式和趨勢(shì),改進(jìn)服務(wù)質(zhì)量,取得更好的顧客保持力和滿意程度,提高貨品銷量比率,設(shè)計(jì)更好的貨品運(yùn)輸與分銷策略,減少商業(yè)成本。 電信、計(jì)算機(jī)網(wǎng)絡(luò)、因特網(wǎng)和各種其它方式的通信和計(jì)算的融合是目前的大勢(shì)所趨。利用數(shù)據(jù)挖掘技術(shù)來幫助理解商業(yè)行為、確定電信模式、捕捉盜用行為、更好的利用資源和
7、提高服務(wù)質(zhì)量是非常有必要的,通過挖掘進(jìn)行盜用模式分析和異常模式識(shí)別,從而可盡早發(fā)現(xiàn)盜用,為公司減少損失。 數(shù)據(jù)挖掘是一個(gè)非常復(fù)雜的過程。每一種數(shù)據(jù)挖掘技術(shù)方法都有其自身的特點(diǎn)和實(shí)現(xiàn)步驟。每種數(shù)據(jù)挖掘的技術(shù)方法對(duì)輸入/輸出數(shù)據(jù)形式的要求、結(jié)構(gòu)、參數(shù)設(shè)置、訓(xùn)練、測(cè)試和模型評(píng)價(jià)方式各自有不同的要求,算法應(yīng)用領(lǐng)域的含義和能力也存在差異。數(shù)據(jù)挖掘過程一般分為定義問題、準(zhǔn)備數(shù)據(jù)、實(shí)施挖掘、評(píng)價(jià)與表示等幾個(gè)階段。數(shù)據(jù)挖掘過程的這幾個(gè)階段都需要人的參與指導(dǎo)?! ∷摹⒔Y(jié)束語 數(shù)據(jù)挖掘是指按企業(yè)既定業(yè)務(wù)目標(biāo),對(duì)大量的企業(yè)數(shù)據(jù)進(jìn)行探索和分析,揭示隱藏的、未知的或驗(yàn)證已知的規(guī)律性
8、,并進(jìn)一步將其模型化的先進(jìn)有效的方法。