電子商務(wù)與數(shù)據(jù)挖掘

電子商務(wù)與數(shù)據(jù)挖掘

ID:37458580

大?。?67.41 KB

頁(yè)數(shù):29頁(yè)

時(shí)間:2019-05-12

電子商務(wù)與數(shù)據(jù)挖掘_第1頁(yè)
電子商務(wù)與數(shù)據(jù)挖掘_第2頁(yè)
電子商務(wù)與數(shù)據(jù)挖掘_第3頁(yè)
電子商務(wù)與數(shù)據(jù)挖掘_第4頁(yè)
電子商務(wù)與數(shù)據(jù)挖掘_第5頁(yè)
資源描述:

《電子商務(wù)與數(shù)據(jù)挖掘》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。

1、電子商務(wù)與數(shù)據(jù)挖掘基于WEB日志的用戶訪問(wèn)模式挖掘電子商務(wù)與數(shù)據(jù)挖掘——完美結(jié)合在電子商務(wù)中進(jìn)行成功的數(shù)據(jù)挖掘得益于:電子商務(wù)提供海量的數(shù)據(jù)如果一個(gè)電子商務(wù)網(wǎng)站平均每個(gè)小時(shí)賣出五件物品,那么它一個(gè)月的平均點(diǎn)擊量是160萬(wàn)次。豐富的記錄信息良好的WEB站點(diǎn)設(shè)計(jì)將有助于獲得豐富的信息干凈的數(shù)據(jù)從電子商務(wù)站點(diǎn)收集的都是電子數(shù)據(jù),無(wú)需人工輸入或者是從歷史系統(tǒng)進(jìn)行整合研究成果容易轉(zhuǎn)化在電子商務(wù)中,很多知識(shí)發(fā)現(xiàn)都可以進(jìn)行直接應(yīng)用投資收益容易衡量電子商務(wù)為數(shù)據(jù)挖掘提供海量數(shù)據(jù)“點(diǎn)擊流”(Clickstreams)將會(huì)產(chǎn)生電子商務(wù)挖掘的大量數(shù)據(jù)Yahoo!在2000年每

2、天被訪問(wèn)的頁(yè)面數(shù)是10億,如此大的訪問(wèn)量將會(huì)產(chǎn)生巨大的Web日志(記載頁(yè)面訪問(wèn)的情況),每個(gè)小時(shí)產(chǎn)生的Web日志量就達(dá)到10GB!即便是一個(gè)小的電子商務(wù)站點(diǎn),也會(huì)在斷時(shí)間內(nèi)產(chǎn)生進(jìn)行數(shù)據(jù)挖掘所需的大量數(shù)據(jù)計(jì)算一下,如果你的站點(diǎn)一個(gè)小時(shí)賣出5件物品,一個(gè)月會(huì)有多少頁(yè)面訪問(wèn):5件×24小時(shí)×30天/%2(轉(zhuǎn)化率,表示訪問(wèn)的人中買東西的人的比率)×9頁(yè)面(平均買一件物品要訪問(wèn)9個(gè)頁(yè)面)=1,600,000頁(yè)面豐富的記錄信息如果你的電子商務(wù)站點(diǎn)設(shè)計(jì)的好,你將可以獲得各種商務(wù)的或者是用戶訪問(wèn)的信息:商品和商品的屬性商品的歸類信息(當(dāng)同時(shí)展示多種商品是,歸類信息是非常

3、有用的)促銷信息關(guān)于訪問(wèn)的信息(比如:訪問(wèn)計(jì)數(shù))關(guān)于客戶額信息(可以通過(guò)登陸/注冊(cè)來(lái)獲得)“干凈的數(shù)據(jù)”信息直接從網(wǎng)站上提取無(wú)需從歷史系統(tǒng)中集成,避免很多錯(cuò)誤可以通過(guò)良好的站點(diǎn)設(shè)計(jì),直接獲得跟數(shù)據(jù)挖掘有關(guān)的數(shù)據(jù)而不是再來(lái)分析、計(jì)算、預(yù)處理要用的數(shù)據(jù)直接收集的電子數(shù)據(jù)——可靠無(wú)需人工數(shù)據(jù)輸入,避免了很多錯(cuò)誤可以通過(guò)良好的站點(diǎn)設(shè)計(jì),良好的控制數(shù)據(jù)采樣的顆粒度顆粒度控制在客戶級(jí)別或者是session級(jí)別,而不是頁(yè)面級(jí)別有趣的“生日現(xiàn)象”一個(gè)銀行通過(guò)對(duì)客戶數(shù)據(jù)統(tǒng)計(jì)發(fā)現(xiàn),它的5%的客戶都是在同一天出生的(同年同月同日)!為什么?如何解釋?研究成果容易轉(zhuǎn)化歷史上的數(shù)

4、據(jù)挖掘研究有過(guò)許多的知識(shí)發(fā)現(xiàn),但是這些知識(shí)發(fā)現(xiàn)卻很少在實(shí)際的商業(yè)應(yīng)用中產(chǎn)生什么效果要應(yīng)用這些發(fā)現(xiàn)的知識(shí)可能意味著要進(jìn)行復(fù)雜的系統(tǒng)更改、流程更改或是改變?nèi)藗兊霓k事習(xí)慣,這在現(xiàn)實(shí)中是非常困難的。在電子商務(wù)中,很多知識(shí)發(fā)現(xiàn)都可以進(jìn)行直接應(yīng)用改變站點(diǎn)的設(shè)計(jì)(改變布局,進(jìn)行個(gè)性化設(shè)計(jì)等)開始有目標(biāo)的促銷根據(jù)對(duì)廣告效果的統(tǒng)計(jì)數(shù)據(jù)改變廣告策略可以很容易的提供捆綁銷售投資收益容易衡量使用數(shù)據(jù)挖掘成果的革新帶來(lái)的收益如何衡量?在傳統(tǒng)的商業(yè)中衡量投資收益需要長(zhǎng)期的測(cè)量和觀察,PacoUnderhill在《購(gòu)物的科學(xué)》一書中提及,一個(gè)超市為了衡量他們的促銷策略帶來(lái)的投資收益,

5、每年要花14,000個(gè)小時(shí)查看錄像帶。在電子商務(wù)中,衡量革新的投資收益是非常容易的銷售變化的報(bào)表可以自動(dòng)產(chǎn)生客戶對(duì)電子郵件和電子調(diào)查的反饋都可以在幾天內(nèi)得到,而不必等個(gè)幾個(gè)月電子商務(wù)乃至整個(gè)互聯(lián)網(wǎng)都是傳統(tǒng)商業(yè)的理想試驗(yàn)室。對(duì)電子商務(wù)網(wǎng)站的Web數(shù)據(jù)挖掘通常在一個(gè)電子商務(wù)網(wǎng)站上應(yīng)用的數(shù)據(jù)挖掘技術(shù)是Web數(shù)據(jù)挖掘。我們可以在一個(gè)電子商務(wù)網(wǎng)站挖掘些什么東西??jī)?nèi)容挖掘(WebContentMining)結(jié)構(gòu)挖掘(WebStructureMining)使用挖掘(WebUsageMining)WebContentMining對(duì)Web頁(yè)面內(nèi)容進(jìn)行挖掘,從Web數(shù)據(jù)中發(fā)

6、現(xiàn)信息。自動(dòng)地從數(shù)以百萬(wàn)計(jì)的Web站點(diǎn)和在線數(shù)據(jù)庫(kù)中搜索和獲取信息和資料;盡管人們可以直接從網(wǎng)上通過(guò)抓取建立索引,實(shí)現(xiàn)檢索服務(wù)來(lái)獲得資源,但是大量的“隱藏”信息只能通過(guò)內(nèi)容挖掘來(lái)自動(dòng)挖掘。WebStructureMiningWebStructureMining是對(duì)Web頁(yè)面之間的結(jié)構(gòu)進(jìn)行挖掘。在整個(gè)Web空間,有用的知識(shí)不僅包含在頁(yè)面的內(nèi)容中,而且也包含在頁(yè)面的結(jié)構(gòu)中。Web結(jié)構(gòu)挖掘主要針對(duì)的就是頁(yè)面的超鏈接結(jié)構(gòu),如果有較多的超鏈接指向它,那么該頁(yè)面就是重要的,發(fā)現(xiàn)的這種知識(shí)可用來(lái)改進(jìn)搜索路徑等。WebUsageMining與WebContentMini

7、ng和WebStructureMining不同的是,WebUsageMining的挖掘?qū)ο笫怯脩艉途W(wǎng)絡(luò)交互過(guò)程中抽取出來(lái)的二手?jǐn)?shù)據(jù),這些數(shù)據(jù)主要是用戶在訪問(wèn)Web時(shí)在Web日志里留下的信息,以及其它一些交互信息,日志信息包括訪問(wèn)日期、時(shí)間、用戶IP地址、服務(wù)器IP地址、方法、所請(qǐng)求URL資源、服務(wù)器響應(yīng)狀態(tài)、用戶代理、發(fā)送字節(jié)等。WebUsageMining就是對(duì)系統(tǒng)日志信息,以及用戶的注冊(cè)數(shù)據(jù)等進(jìn)行挖掘,以發(fā)現(xiàn)有用的模式和知識(shí)。WebUsageMining的作用通過(guò)對(duì)電子商務(wù)網(wǎng)站應(yīng)用WebUsageMining數(shù)據(jù)挖掘技術(shù),可以提高站點(diǎn)的質(zhì)量改善WEB

8、緩存,緩解網(wǎng)絡(luò)交通,提高性能在電子商務(wù)中還可捕捉到大量的采購(gòu)過(guò)程的細(xì)節(jié),為更加深

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。