資源描述:
《數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用研究摘要:本文主要介紹數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用,文章從數(shù)據(jù)挖掘的定義、數(shù)據(jù)挖掘的常用方法出發(fā),闡述了數(shù)據(jù)挖掘在海量信息中提取有效信息的作用,特別是數(shù)據(jù)挖掘與電子商務(wù)的結(jié)合可以給人們生活帶來便利,給企業(yè)帶來新的利潤空間以及為企業(yè)提供決策支持。常用的數(shù)據(jù)挖掘技術(shù)主要包括支持向量機(jī)、樸素貝葉斯、聚類、決策樹、神經(jīng)網(wǎng)絡(luò)和關(guān)聯(lián)規(guī)則等,最后介紹了數(shù)據(jù)挖掘在電子商務(wù)的4個主要應(yīng)用方面,說明了數(shù)據(jù)挖掘存在的必要性。關(guān)鍵詞:數(shù)據(jù)挖掘;電子商務(wù);決策支持theapplicationsstudyofdataminingine-commer
2、celiuqifei,huhongtao(xi’anuniversityofpetroleum,schoolofcomputerscience,xi’an710065,china)abstract:thispaperintroducesdataminingine-commerceapplications,thearticlethedefinitionofdatamining,dataminingcommonlyusedmethodofdeparture,describedtheroleofdataminingtoextractusefulinf
3、ormationinthemassofinformation,especiallydataminingande-commercecombinationcanbringconveniencetopeople’slives,tobringnewbusinessprofitmargins,andprovidedecisionsupportfortheenterprise.commonlyuseddataminingtechniquesincludingsupportvectormachine,naivebayes,clustering,decisio
4、ntrees,neuralnetworksandassociationrules,etc.finally,dataminingine-commerce,thefourmajorapplications,indicatingthepresenceofdataminingnecessity.keywords:datamining;e-commerce;decisionsupport一、引言21世紀(jì)是電子商務(wù)的時代、電子商務(wù)以其低成本、便利、高回報等優(yōu)點逐漸流行,被全球人們所接受。電子商務(wù)給人們生活帶來了越來越多的便利。各行各行都在抓住電子商務(wù)這個潮
5、流為企業(yè)創(chuàng)造更多的商機(jī)。web數(shù)據(jù)挖掘是數(shù)據(jù)挖掘的一個重要分支,是隨著數(shù)據(jù)庫技術(shù)、人工智能技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展而提出的。尤其是隨著電子商務(wù)的不斷運作,信息總量不斷增加,更迫切需要有效的信息分析工具。在解決這些海量數(shù)據(jù)提取信息的問題過程中,科學(xué)家們于1989年提出了知識發(fā)現(xiàn)及數(shù)據(jù)挖掘。數(shù)據(jù)挖掘的核心技術(shù)歷經(jīng)了十幾年的發(fā)展,已經(jīng)取得了很大的成就,其中包括數(shù)理統(tǒng)計、人工智能、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、模式識別、數(shù)據(jù)庫技術(shù)、知識獲取和信息檢索等。二、數(shù)據(jù)挖掘簡介(一)數(shù)據(jù)挖掘定義數(shù)據(jù)挖掘是近年出現(xiàn)的一種全新信息技術(shù),同時也是基于計算機(jī)科學(xué)與技術(shù),尤其是網(wǎng)絡(luò)技
6、術(shù)的發(fā)展及普遍應(yīng)用而提出的一個重要課題。數(shù)據(jù)挖掘(datemining)就是從大量的、不完全的、有噪聲的、模糊的隨機(jī)的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道但又是潛在有用的并最終可理解的信息和知識的非平凡過程[1,2]。數(shù)據(jù)挖掘的知識表示為概念(concepts),規(guī)則(rules)、規(guī)律(regularities)、模式(patterns)等形式。使用數(shù)據(jù)挖掘的優(yōu)勢是它能幫助企業(yè)從海量的數(shù)據(jù)庫中挖掘出對企業(yè)有用的信息,對企業(yè)的決策提供支持,幫助企業(yè)取得市場競爭的優(yōu)勢。(二)數(shù)據(jù)挖掘流程圖1數(shù)據(jù)挖掘過程數(shù)據(jù)挖掘整個過程分為定義業(yè)務(wù)問題
7、、數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、模型評估。這五個步驟是數(shù)據(jù)挖掘所必須的過程。1.定義業(yè)務(wù)問題。數(shù)據(jù)挖掘是從海量的數(shù)據(jù)中挖掘出對使用者有用的數(shù)據(jù)信息,它在數(shù)據(jù)挖掘中是第一個步驟,它也是比較重要的階段。數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用例如,要做電信客戶的流失分析,也就是找到哪些客戶即將流失哪些不會流失,所以應(yīng)該明確其任務(wù)主要是構(gòu)建一個分類模型后對客戶分類。2.數(shù)據(jù)理解。數(shù)據(jù)理解是對數(shù)據(jù)挖掘的業(yè)務(wù)問題的一個業(yè)務(wù)數(shù)據(jù)的抽象,是現(xiàn)實模型世界在計算機(jī)上的數(shù)據(jù)映像。數(shù)據(jù)理解包括明確模型的目標(biāo)變量和輸入變量。3.數(shù)據(jù)準(zhǔn)備。數(shù)據(jù)準(zhǔn)備是數(shù)據(jù)挖掘的必要環(huán)節(jié),也是挖掘結(jié)果是
8、否科學(xué)可用的關(guān)鍵一環(huán)。因為收集階段得到的數(shù)據(jù)有些可能不準(zhǔn)確。表現(xiàn)為數(shù)據(jù)可能存在不一致性,或有“臟”數(shù)據(jù)或者數(shù)據(jù)有缺失等,所以首先需要清洗數(shù)據(jù);再根據(jù)業(yè)