基于xml的電子商務(wù)web數(shù)據(jù)采掘技術(shù)的應(yīng)用

基于xml的電子商務(wù)web數(shù)據(jù)采掘技術(shù)的應(yīng)用

ID:26485378

大?。?2.50 KB

頁數(shù):5頁

時間:2018-11-27

基于xml的電子商務(wù)web數(shù)據(jù)采掘技術(shù)的應(yīng)用  _第1頁
基于xml的電子商務(wù)web數(shù)據(jù)采掘技術(shù)的應(yīng)用  _第2頁
基于xml的電子商務(wù)web數(shù)據(jù)采掘技術(shù)的應(yīng)用  _第3頁
基于xml的電子商務(wù)web數(shù)據(jù)采掘技術(shù)的應(yīng)用  _第4頁
基于xml的電子商務(wù)web數(shù)據(jù)采掘技術(shù)的應(yīng)用  _第5頁
資源描述:

《基于xml的電子商務(wù)web數(shù)據(jù)采掘技術(shù)的應(yīng)用 》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、基于XML的電子商務(wù)Web數(shù)據(jù)采掘技術(shù)的應(yīng)用[摘要]本文簡述了XML語言的特點,并對電子商務(wù)L的電子商務(wù)L電子商務(wù)數(shù)據(jù)采掘    一、引言  家用計算機(jī)的普及、互聯(lián)網(wǎng)及網(wǎng)絡(luò)通信的迅猛發(fā)展已經(jīng)將人類社會帶入了網(wǎng)絡(luò)經(jīng)濟(jì)時代。電子商務(wù)以其具有的成本、效率和創(chuàng)新優(yōu)勢,在商務(wù)活動中占據(jù)了一席之地,并不斷地為越來越多的企業(yè)及個人所接受和采用?! ≡陔娮由虅?wù)活動中,每個客戶都會有自己的消費習(xí)慣,并對信得過的商品有一定的忠誠度,分析客戶的需求信息和購物行為特征就成了商家必做的功課?;诰W(wǎng)絡(luò)技術(shù)的電子商務(wù)的發(fā)展,使

2、得商家L與數(shù)據(jù)采掘  XML是TheExtensibleMarkupLanguage(可擴(kuò)展標(biāo)識語言)的簡寫。XML是一套用來標(biāo)記文檔的語法,它是由SGML發(fā)展而來,由L成為下一代L是一種跨平臺的語言,因規(guī)范簡單、良好的可擴(kuò)展性、傳輸內(nèi)容與傳輸方式相隔離、具有自我描述能力等優(yōu)異特性而在全世界范圍內(nèi)得到了越來越多的認(rèn)可,成為眾多商家與用戶爭相開發(fā)及采用的技術(shù)?! ?shù)據(jù)采掘又稱數(shù)據(jù)挖掘,就是從大量的、不完全的未知數(shù)據(jù)中提取隱含在其中的對使用者的分析有用的信息和規(guī)律。數(shù)據(jù)采掘的主要任務(wù)是對數(shù)據(jù)進(jìn)行描述和

3、預(yù)測,描述數(shù)據(jù)的特性,對數(shù)據(jù)進(jìn)行合并分組,并進(jìn)行推斷預(yù)測?! ?shù)據(jù)采掘應(yīng)用于商業(yè)中,它是一種新的商業(yè)信息處理技術(shù),主要特點是對商業(yè)數(shù)據(jù)庫中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其它模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)?! ∪㈦娮由虅?wù)ining),是數(shù)據(jù)采掘技術(shù)在ining)是對用戶訪問Web時在服務(wù)器方留下的訪問記錄進(jìn)行采掘,通過采掘Web日志記錄,分析和探究Web日志記錄中的規(guī)律,可以識別電子商務(wù)的潛在客戶,增強(qiáng)對最終用戶的網(wǎng)上信息服務(wù)的質(zhì)量和交付,改進(jìn)Web服務(wù)器系統(tǒng)的性能。其主要特點

4、是對用戶信息數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)?! ?shù)據(jù)采掘通過數(shù)據(jù)采掘器進(jìn)行,其主要功能是進(jìn)行實際的采掘操作,從經(jīng)過預(yù)處理的數(shù)據(jù)中發(fā)現(xiàn)模式和規(guī)則,借助OLAP引擎和相關(guān)算法實現(xiàn)動態(tài)更新。  在Web日志記錄上可以進(jìn)行數(shù)據(jù)采掘,用于找出關(guān)聯(lián)模式,序列模式,和Web訪問趨勢等。  3.Web數(shù)據(jù)采掘的主要技術(shù)  適用于電子商務(wù)數(shù)據(jù)采掘的主要技術(shù)有關(guān)聯(lián)分析、序列模式分析、分類分析和聚類分析等。數(shù)據(jù)采掘器按照數(shù)據(jù)采掘的技術(shù)方法進(jìn)行設(shè)計,每種采掘技術(shù)包含一些不同的具

5、體實現(xiàn)算法,構(gòu)成在功能上相互獨立的子模塊,存放在采掘算法庫中。采掘算法庫包括:  關(guān)聯(lián)分析:應(yīng)用已有關(guān)聯(lián)規(guī)則算法側(cè)重進(jìn)行興趣關(guān)聯(lián)規(guī)則分析,找出或判斷出客戶對網(wǎng)站進(jìn)行訪問的相關(guān)關(guān)系,揭示數(shù)據(jù)間的內(nèi)在聯(lián)系,可據(jù)此調(diào)整站點的結(jié)構(gòu)?! ⌒蛄心J椒治觯翰删虺鰯?shù)據(jù)的前后時間順序關(guān)系,分析其是否存在一定的趨勢,以預(yù)測未來的行為(訪問,瀏覽等)?! 》诸惙治觯和ㄟ^對數(shù)據(jù)的分析,給出數(shù)據(jù)間類的公共屬性描述,為每個類別做出準(zhǔn)確的描述或建立分析模型或采掘出分類規(guī)則,然后用這個分類規(guī)則對其它數(shù)據(jù)庫中的記錄進(jìn)行分類?! 【?/p>

6、類分析:分類分析的逆過程,按照“類內(nèi)相似性最大,類間相似性最小”的原則,對數(shù)據(jù)進(jìn)行類的聚集。通過分組聚類找出具有相似行為的客戶,分析其共同特點,據(jù)此可向客戶提供更為合適的服務(wù)。  路徑分析:通過對日志文件中的數(shù)據(jù)進(jìn)行分析,尋找到被訪問最頻繁的路徑?! 〗柚鷪D形學(xué)和圖像處理技術(shù),將通過數(shù)據(jù)采掘獲得的數(shù)據(jù)模式,以圖表或可視性文本的形式呈現(xiàn)給使用者,以利于具有不同知識背景的使用者能夠快速地從采掘結(jié)果中得到有效信息,從而盡快做出決策。4.數(shù)據(jù)采掘面臨的問題  利用數(shù)據(jù)采掘技術(shù)可以幫助獲得決策所需的多種知識

7、。但是隨著數(shù)據(jù)采掘研究的深入,需要解決面臨的問題:(1)數(shù)據(jù)預(yù)處理是一個比較煩瑣的過程,每個數(shù)據(jù)庫描述數(shù)據(jù)的格式幾乎都是不同的;(2)不同來源數(shù)據(jù)的集成問題的存在,搜索多樣的不兼容的數(shù)據(jù)庫實際上也是不可能的;(3)客戶端采用不同的應(yīng)用程序,不同的系統(tǒng)間在編程語言、操作系統(tǒng)、網(wǎng)絡(luò)協(xié)議等方面存在異構(gòu)性,使系統(tǒng)的可移植性、可重用性和互操作性受到限制?! ‰S著結(jié)構(gòu)化標(biāo)記語言XML越來越被人們接受和采納,將會有大量的L書寫,可以促進(jìn)不同L語言的優(yōu)異特性來解決數(shù)據(jù)采掘中面臨的困難。  四、基于XML的電子商務(wù)

8、L是一種非常適于應(yīng)用程序之間數(shù)據(jù)交換的格式,特別是松耦合的應(yīng)用程序。XML能夠使不同來源的結(jié)構(gòu)化的數(shù)據(jù)很容易地結(jié)合在一起,可以促進(jìn)應(yīng)用程序代碼的重用,提高應(yīng)用系統(tǒng)在面對需求和程序變化時的適應(yīng)能力?! ?.XML格式轉(zhuǎn)換器  在源數(shù)據(jù)端,數(shù)據(jù)可以是多種格式的,XML僅僅起到中間數(shù)據(jù)表示和消息傳輸?shù)淖饔?。在?shù)據(jù)預(yù)處理前,將源數(shù)據(jù)直接進(jìn)入一個XML格式轉(zhuǎn)換器,轉(zhuǎn)換器是由XML格式分析模塊、XML格式轉(zhuǎn)換模塊、XML格式生成模塊構(gòu)成,其中XML格式分析模塊對進(jìn)入的數(shù)據(jù)進(jìn)行分析,判斷進(jìn)入的數(shù)

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。