電子商務(wù)與數(shù)據(jù)挖掘

電子商務(wù)與數(shù)據(jù)挖掘

ID:37458580

大?。?67.41 KB

頁數(shù):29頁

時間:2019-05-12

電子商務(wù)與數(shù)據(jù)挖掘_第1頁
電子商務(wù)與數(shù)據(jù)挖掘_第2頁
電子商務(wù)與數(shù)據(jù)挖掘_第3頁
電子商務(wù)與數(shù)據(jù)挖掘_第4頁
電子商務(wù)與數(shù)據(jù)挖掘_第5頁
資源描述:

《電子商務(wù)與數(shù)據(jù)挖掘》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、電子商務(wù)與數(shù)據(jù)挖掘基于WEB日志的用戶訪問模式挖掘電子商務(wù)與數(shù)據(jù)挖掘——完美結(jié)合在電子商務(wù)中進(jìn)行成功的數(shù)據(jù)挖掘得益于:電子商務(wù)提供海量的數(shù)據(jù)如果一個電子商務(wù)網(wǎng)站平均每個小時賣出五件物品,那么它一個月的平均點(diǎn)擊量是160萬次。豐富的記錄信息良好的WEB站點(diǎn)設(shè)計(jì)將有助于獲得豐富的信息干凈的數(shù)據(jù)從電子商務(wù)站點(diǎn)收集的都是電子數(shù)據(jù),無需人工輸入或者是從歷史系統(tǒng)進(jìn)行整合研究成果容易轉(zhuǎn)化在電子商務(wù)中,很多知識發(fā)現(xiàn)都可以進(jìn)行直接應(yīng)用投資收益容易衡量電子商務(wù)為數(shù)據(jù)挖掘提供海量數(shù)據(jù)“點(diǎn)擊流”(Clickstreams)將會產(chǎn)生電子商務(wù)挖掘的大量數(shù)據(jù)Yahoo!在2000年每

2、天被訪問的頁面數(shù)是10億,如此大的訪問量將會產(chǎn)生巨大的Web日志(記載頁面訪問的情況),每個小時產(chǎn)生的Web日志量就達(dá)到10GB!即便是一個小的電子商務(wù)站點(diǎn),也會在斷時間內(nèi)產(chǎn)生進(jìn)行數(shù)據(jù)挖掘所需的大量數(shù)據(jù)計(jì)算一下,如果你的站點(diǎn)一個小時賣出5件物品,一個月會有多少頁面訪問:5件×24小時×30天/%2(轉(zhuǎn)化率,表示訪問的人中買東西的人的比率)×9頁面(平均買一件物品要訪問9個頁面)=1,600,000頁面豐富的記錄信息如果你的電子商務(wù)站點(diǎn)設(shè)計(jì)的好,你將可以獲得各種商務(wù)的或者是用戶訪問的信息:商品和商品的屬性商品的歸類信息(當(dāng)同時展示多種商品是,歸類信息是非常

3、有用的)促銷信息關(guān)于訪問的信息(比如:訪問計(jì)數(shù))關(guān)于客戶額信息(可以通過登陸/注冊來獲得)“干凈的數(shù)據(jù)”信息直接從網(wǎng)站上提取無需從歷史系統(tǒng)中集成,避免很多錯誤可以通過良好的站點(diǎn)設(shè)計(jì),直接獲得跟數(shù)據(jù)挖掘有關(guān)的數(shù)據(jù)而不是再來分析、計(jì)算、預(yù)處理要用的數(shù)據(jù)直接收集的電子數(shù)據(jù)——可靠無需人工數(shù)據(jù)輸入,避免了很多錯誤可以通過良好的站點(diǎn)設(shè)計(jì),良好的控制數(shù)據(jù)采樣的顆粒度顆粒度控制在客戶級別或者是session級別,而不是頁面級別有趣的“生日現(xiàn)象”一個銀行通過對客戶數(shù)據(jù)統(tǒng)計(jì)發(fā)現(xiàn),它的5%的客戶都是在同一天出生的(同年同月同日)!為什么?如何解釋?研究成果容易轉(zhuǎn)化歷史上的數(shù)

4、據(jù)挖掘研究有過許多的知識發(fā)現(xiàn),但是這些知識發(fā)現(xiàn)卻很少在實(shí)際的商業(yè)應(yīng)用中產(chǎn)生什么效果要應(yīng)用這些發(fā)現(xiàn)的知識可能意味著要進(jìn)行復(fù)雜的系統(tǒng)更改、流程更改或是改變?nèi)藗兊霓k事習(xí)慣,這在現(xiàn)實(shí)中是非常困難的。在電子商務(wù)中,很多知識發(fā)現(xiàn)都可以進(jìn)行直接應(yīng)用改變站點(diǎn)的設(shè)計(jì)(改變布局,進(jìn)行個性化設(shè)計(jì)等)開始有目標(biāo)的促銷根據(jù)對廣告效果的統(tǒng)計(jì)數(shù)據(jù)改變廣告策略可以很容易的提供捆綁銷售投資收益容易衡量使用數(shù)據(jù)挖掘成果的革新帶來的收益如何衡量?在傳統(tǒng)的商業(yè)中衡量投資收益需要長期的測量和觀察,PacoUnderhill在《購物的科學(xué)》一書中提及,一個超市為了衡量他們的促銷策略帶來的投資收益,

5、每年要花14,000個小時查看錄像帶。在電子商務(wù)中,衡量革新的投資收益是非常容易的銷售變化的報(bào)表可以自動產(chǎn)生客戶對電子郵件和電子調(diào)查的反饋都可以在幾天內(nèi)得到,而不必等個幾個月電子商務(wù)乃至整個互聯(lián)網(wǎng)都是傳統(tǒng)商業(yè)的理想試驗(yàn)室。對電子商務(wù)網(wǎng)站的Web數(shù)據(jù)挖掘通常在一個電子商務(wù)網(wǎng)站上應(yīng)用的數(shù)據(jù)挖掘技術(shù)是Web數(shù)據(jù)挖掘。我們可以在一個電子商務(wù)網(wǎng)站挖掘些什么東西?內(nèi)容挖掘(WebContentMining)結(jié)構(gòu)挖掘(WebStructureMining)使用挖掘(WebUsageMining)WebContentMining對Web頁面內(nèi)容進(jìn)行挖掘,從Web數(shù)據(jù)中發(fā)

6、現(xiàn)信息。自動地從數(shù)以百萬計(jì)的Web站點(diǎn)和在線數(shù)據(jù)庫中搜索和獲取信息和資料;盡管人們可以直接從網(wǎng)上通過抓取建立索引,實(shí)現(xiàn)檢索服務(wù)來獲得資源,但是大量的“隱藏”信息只能通過內(nèi)容挖掘來自動挖掘。WebStructureMiningWebStructureMining是對Web頁面之間的結(jié)構(gòu)進(jìn)行挖掘。在整個Web空間,有用的知識不僅包含在頁面的內(nèi)容中,而且也包含在頁面的結(jié)構(gòu)中。Web結(jié)構(gòu)挖掘主要針對的就是頁面的超鏈接結(jié)構(gòu),如果有較多的超鏈接指向它,那么該頁面就是重要的,發(fā)現(xiàn)的這種知識可用來改進(jìn)搜索路徑等。WebUsageMining與WebContentMini

7、ng和WebStructureMining不同的是,WebUsageMining的挖掘?qū)ο笫怯脩艉途W(wǎng)絡(luò)交互過程中抽取出來的二手?jǐn)?shù)據(jù),這些數(shù)據(jù)主要是用戶在訪問Web時在Web日志里留下的信息,以及其它一些交互信息,日志信息包括訪問日期、時間、用戶IP地址、服務(wù)器IP地址、方法、所請求URL資源、服務(wù)器響應(yīng)狀態(tài)、用戶代理、發(fā)送字節(jié)等。WebUsageMining就是對系統(tǒng)日志信息,以及用戶的注冊數(shù)據(jù)等進(jìn)行挖掘,以發(fā)現(xiàn)有用的模式和知識。WebUsageMining的作用通過對電子商務(wù)網(wǎng)站應(yīng)用WebUsageMining數(shù)據(jù)挖掘技術(shù),可以提高站點(diǎn)的質(zhì)量改善WEB

8、緩存,緩解網(wǎng)絡(luò)交通,提高性能在電子商務(wù)中還可捕捉到大量的采購過程的細(xì)節(jié),為更加深

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。