資源描述:
《數(shù)據(jù)挖掘相關(guān)論文 數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用.doc》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、數(shù)據(jù)挖掘論文題目:數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用系別:計(jì)算機(jī)學(xué)院專業(yè):11網(wǎng)絡(luò)工程1班學(xué)生姓名:黃坤學(xué)號:1110322111指導(dǎo)教師:江南2014年11月06日數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用一、研究原因電子商務(wù)在現(xiàn)代商務(wù)活動中的正變得日趨重要,隨著大數(shù)據(jù)時代的到來,商務(wù)信息顯得尤為重要,在電子商務(wù)中誰掌握了有利的市場信息,誰就能在這個競爭激烈電商行業(yè)中占據(jù)絕對的優(yōu)勢。而數(shù)據(jù)挖掘技術(shù)是獲取信息的最有效的技術(shù)工具。本文討論了數(shù)據(jù)挖掘的主要方法,具體闡述了數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的作用及應(yīng)用。?在信息經(jīng)濟(jì)時代,對企業(yè)來說,誰對市場變化反應(yīng)速度快,誰將在激烈的市場競
2、爭中占據(jù)有利的地位,競爭的結(jié)果最終將促使企業(yè)價(jià)值從市場競爭輸家轉(zhuǎn)移到贏家,這樣就使企業(yè)面臨一個問題:如何才能把大量的數(shù)據(jù)資源,轉(zhuǎn)化成自身價(jià)值呢?要想使數(shù)據(jù)真正成為一個公司的資源,只有充分利用它為公司自身的業(yè)務(wù)決策和戰(zhàn)略發(fā)展服務(wù)才行,否則大量的數(shù)據(jù)可能成為包袱,甚至成為垃圾。因此,面對“人們被數(shù)據(jù)淹沒,人們卻饑餓于知識”的挑戰(zhàn),數(shù)據(jù)挖掘和知識發(fā)現(xiàn)(DMKD)技術(shù)應(yīng)運(yùn)而生,并得以蓬勃發(fā)展,越來越顯示出其強(qiáng)大的生命力。二、2.1國內(nèi)研究現(xiàn)狀KDD(從數(shù)據(jù)庫中發(fā)現(xiàn)知識)一詞首次出現(xiàn)在1989年8月舉行的第11屆國際聯(lián)合人工智能學(xué)術(shù)會議上。迄今為止,由美國人工智能協(xié)會主
3、辦的KDD已經(jīng)召開了7次,規(guī)模由原來的專題討論會發(fā)展到國際學(xué)術(shù)大會,人數(shù)由二三十人到七八百人,論文收錄比例從2X1到6X1,研究重點(diǎn)也逐漸從發(fā)現(xiàn)方法轉(zhuǎn)向系統(tǒng)應(yīng)用,并且注重多種發(fā)現(xiàn)策略和技術(shù)的集成,以及多種學(xué)科之間的相互滲透。其他內(nèi)容的專題會議也把數(shù)據(jù)挖掘和知識發(fā)現(xiàn)列為議題之一,成為當(dāng)前計(jì)算機(jī)科學(xué)界的一大熱點(diǎn)。此外,數(shù)據(jù)庫、人工智能、信息處理、知識工程等領(lǐng)域的國際學(xué)術(shù)刊物也紛紛開辟了KDD專題或?qū)??。IEEE的KnowledgeandDataEngineering會刊領(lǐng)先在1993年出版了KDD技術(shù)專刊,所發(fā)表的5篇論文代表了當(dāng)時KDD研究的最新成果和動態(tài),較全
4、面地論述了KDD系統(tǒng)方法論、發(fā)現(xiàn)結(jié)果的評價(jià)、KDD系統(tǒng)設(shè)計(jì)的邏輯方法,集中討論了鑒于數(shù)據(jù)庫的動態(tài)性冗余、高噪聲和不確定性、空值等問題,KDD系統(tǒng)與其它傳統(tǒng)的機(jī)器學(xué)習(xí)、專家系統(tǒng)、人工神經(jīng)網(wǎng)絡(luò)、數(shù)理統(tǒng)計(jì)分析系統(tǒng)的聯(lián)系和區(qū)別,以及相應(yīng)的基本對策。6篇論文摘要展示了KDD在從建立分子模型到設(shè)計(jì)制造業(yè)的具體應(yīng)用。不僅如此,由美國人工智能學(xué)會主辦的KDD國際研討會規(guī)模由原來的專題討論會發(fā)展到國際學(xué)術(shù)大會,研究重點(diǎn)也逐漸從發(fā)現(xiàn)方向轉(zhuǎn)向系統(tǒng)應(yīng)用,注重多重發(fā)現(xiàn)策略和技術(shù)集成,以及多種學(xué)科之間的相互滲透,并且有很多學(xué)校和科研機(jī)構(gòu)也正投入大量資金進(jìn)行數(shù)據(jù)挖掘技術(shù)的進(jìn)一步開發(fā)和深入研
5、究。國內(nèi)對數(shù)據(jù)挖掘的研究稍晚,沒有形成整體力量。但是國內(nèi)的高校,例如清華大學(xué)、中科院計(jì)算機(jī)技術(shù)研究所等,都已開展了不同程度的知識發(fā)現(xiàn)的基礎(chǔ)理論及其應(yīng)用研究。其中,北京系統(tǒng)工程研究所對模糊方法在知識發(fā)現(xiàn)中的應(yīng)用進(jìn)行了較深入的研究。與國外相比,我國對數(shù)據(jù)挖掘領(lǐng)域的研究仍處于初級階段,絕大多數(shù)工作集中于局部算法設(shè)計(jì),進(jìn)行綜合的系統(tǒng)集成設(shè)計(jì)卻寥寥無幾。由于核心技術(shù)的欠缺,使得數(shù)據(jù)挖掘在國內(nèi)一些領(lǐng)域只是初步應(yīng)用,如銀行、金融、GIS等領(lǐng)域。所以研究數(shù)據(jù)挖掘技術(shù),并將其應(yīng)用到科研、經(jīng)濟(jì)、教育等領(lǐng)域的重要性是可見一斑的。電子商務(wù)(E-Commerce)是以指利用電子數(shù)據(jù)交換
6、(ElectronicDataInterchange,EDI)、電子郵件(E-mail)、電子資金轉(zhuǎn)賬(ElectronicFundsTransfer,EFT)和Internet等主要技術(shù)在個人、企業(yè)和國家之間進(jìn)行無紙化的信息交換,包括商品信息及其訂購信息、資金信息及其支付信息、安全及其認(rèn)證信息等,即以現(xiàn)代信息技術(shù)為手段,以經(jīng)濟(jì)效益為中心的現(xiàn)代化商業(yè)運(yùn)轉(zhuǎn)模式。其最終目標(biāo)是實(shí)現(xiàn)商務(wù)活動的網(wǎng)絡(luò)化、自動化與智能化。隨著Internet的迅速發(fā)展,電子商務(wù)的應(yīng)用不斷深入。在電子商務(wù)應(yīng)用系統(tǒng)中,相關(guān)的用戶數(shù)據(jù)日益增多,數(shù)據(jù)挖掘技術(shù)具有從大量復(fù)雜數(shù)據(jù)中發(fā)現(xiàn)特定規(guī)律的能力。
7、商業(yè)電子化的趨勢不僅為客戶提供了便利的交易方式和廣泛的選擇,同時也為商家提供了更加深入了解客戶需求信息和購物行為特征的可能性。?2.2數(shù)據(jù)挖掘技術(shù)2.2.1統(tǒng)計(jì)技術(shù)統(tǒng)計(jì)技術(shù)對數(shù)據(jù)集進(jìn)行挖掘的主要思想是:統(tǒng)計(jì)的方法對給定的數(shù)據(jù)集合假定了一個分步或者概率的模型(比如一個正態(tài)分布),然后根據(jù)模型采用相應(yīng)的方法進(jìn)行挖掘。2.2.2關(guān)聯(lián)規(guī)則數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類很重要的可以發(fā)現(xiàn)的知識。若兩個或者多個變量的取值之間存在某種規(guī)律性,就成為關(guān)聯(lián)。關(guān)聯(lián)可分為簡單關(guān)聯(lián),時序關(guān)聯(lián),因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱含的關(guān)聯(lián)網(wǎng),優(yōu)勢并不知道數(shù)據(jù)庫中的關(guān)聯(lián)函數(shù),即使知道也是
8、不確定的,因此關(guān)聯(lián)分析生成的規(guī)則帶有可