數(shù)據(jù)挖掘研究

數(shù)據(jù)挖掘研究

ID:44509561

大?。?13.23 KB

頁數(shù):7頁

時(shí)間:2019-10-22

數(shù)據(jù)挖掘研究_第1頁
數(shù)據(jù)挖掘研究_第2頁
數(shù)據(jù)挖掘研究_第3頁
數(shù)據(jù)挖掘研究_第4頁
數(shù)據(jù)挖掘研究_第5頁
資源描述:

《數(shù)據(jù)挖掘研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。

1、****大學(xué)專業(yè)文獻(xiàn)綜述題目:姓名:學(xué)院:t業(yè):級(jí):學(xué)號(hào):成績:指導(dǎo)教師:數(shù)據(jù)挖掘研究綜述廿算機(jī)與信息工程學(xué)院電子信息科學(xué)與技術(shù)職禰:2013年I月I日"I大學(xué)教務(wù)處制數(shù)據(jù)挖掘研究綜述作者指導(dǎo)教師摘要:在屯信系統(tǒng)中,經(jīng)常需要根據(jù)用戶的登入登出進(jìn)行計(jì)時(shí)收費(fèi),這樣我們就需要根據(jù)登錄口志來將用戶的登入記錄和登出記錄按照對(duì)應(yīng)關(guān)系匹配起來,形成一條完整的登錄記錄,登錄記錄屮包含以下信息:用戶登錄名,登入時(shí)刻,登出時(shí)刻,登錄時(shí)長,登錄終端機(jī)器IP等。在匹配過程中,理論上一條登入記錄跟一條登出記錄匹配,但有可能在我們采集數(shù)據(jù)吋用戶還沒有登出,所以日志文件屮可能出現(xiàn)沒冇登

2、出記錄與之匹配的登入記錄,這些登入記錄我們將其保存在一個(gè)指定的文件中,在下次采集時(shí)再讀取。在整個(gè)電信系統(tǒng)中,這些記錄無疑是非常巨大的,不是依靠人力手工能夠完成的,這時(shí),我們就需要冇一個(gè)具體的系統(tǒng)來幫我們自動(dòng)完成這些功能,這也就是本次課題的選擇一一數(shù)據(jù)挖掘系統(tǒng)(DataMiningSystem)。L1J關(guān)鍵詞:數(shù)據(jù)挖掘;客戶端;服務(wù)器端TheSummaryofDataMiningTurtor:Abstract:Intelecommunicationssystem,oftencarriedouttimechargesbasedonuser^sloginorlo

3、gout,soweneedtomatchtheuser'sloginandlogoutrecordsbycorrespondencerelationshipaccordingtothelogandformacompletelogrecords,logrecordcontainsthefollowinginformation:userloginname,logintime,logouttime,loglength,logterminalmachineIPandsoon.Intheprocessofmatching,intheory,aloginrecordm

4、atcheswithalogoutrecord,butwhenwecollectthedatatheusermaynotlogout,sotheremaybenologoutrecordmatchwiththeloginrecordinthelogfile.Wesavetheloginrecordsinadesignatedfile,andreadthematthenextcollection.Inthewholetelecommunicationssystem,theserecordswillundoubtedlybeverytremendous,tor

5、elyonhumanhandcannotbedone,thenweneedaspecificsystemtohelpusfinishthesefunctionsautomatic,itisthechoiceofthissubject--DataMiningSystem.隨著計(jì)算機(jī)及互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,一些大的廠家例如電信,推出了服務(wù)器出租這項(xiàng)業(yè)務(wù),選擇這項(xiàng)業(yè)務(wù)的用戶可以通過遠(yuǎn)程登錄服務(wù)器上進(jìn)行自己的工作。服務(wù)器出租就是指用戶不需要自己購買服務(wù)器,只需要根拯自己的業(yè)務(wù)要求,向運(yùn)營商申請(qǐng)-個(gè)帳號(hào)通過遠(yuǎn)程登錄,便可以輕松享用服務(wù)器。由于服務(wù)器的價(jià)格相當(dāng)昂貴,所

6、以更多的用戶更傾向于選擇租用,而不是購買。這樣服務(wù)器出租便得到了廣泛的發(fā)展。這時(shí)就需要一款運(yùn)行在服務(wù)器上的計(jì)時(shí)軟件,來統(tǒng)計(jì)用戶的使用情況來做出和應(yīng)的收費(fèi)依據(jù)。⑵在此背景下,電信計(jì)費(fèi)系統(tǒng)便應(yīng)運(yùn)而生了。1數(shù)據(jù)挖掘的意義在電信系統(tǒng)屮,經(jīng)常需要根據(jù)用戶的登入登出進(jìn)行計(jì)吋收費(fèi),這樣我們就需要根據(jù)登錄口志來將用戶的登入記錄和登出記錄按照對(duì)應(yīng)關(guān)系匹配起來,形成一條完整的登錄記錄。在匹配過程屮,理論上一條登入記錄跟一條登岀記錄匹配,但有可能在我們采集數(shù)據(jù)時(shí)用戶還沒有登出,所以日志文件中可能出現(xiàn)沒有登出記錄與之匹配的登入記錄,這些登入記錄我們將其保存在一個(gè)指定的文件屮,在下

7、次采集時(shí)再讀取。在整個(gè)電信系統(tǒng)中,這些記錄無疑是非常巨大的,不是依靠人力手工能夠完成的,這時(shí),我們就需要有一個(gè)具體的系統(tǒng)來幫我們口動(dòng)完成這些功能,這也就是本次課題的選擇數(shù)據(jù)挖掘系統(tǒng)(DataMiningSystem)。電信計(jì)費(fèi)系統(tǒng)是專門為服務(wù)器租賃商開發(fā)研究的,租賃商只需要出租的服務(wù)器上安裝木系統(tǒng),就會(huì)有相應(yīng)的數(shù)據(jù)從客戶端源源不斷發(fā)送到服務(wù)端,這樣便可以輕松的了解各地服務(wù)器的運(yùn)營狀況,以及盈虧情況,同時(shí)也可以作為用戶繳納費(fèi)用的依據(jù)。2數(shù)據(jù)挖掘技術(shù)由于用戶數(shù)量巨大,所有用戶信息保存在非結(jié)構(gòu)型日志文件中。如何從海量數(shù)據(jù)屮找到某一用戶的計(jì)費(fèi)信息,就需要數(shù)據(jù)挖掘技

8、術(shù)的支持。2.1數(shù)據(jù)挖掘技術(shù)的基本知識(shí)數(shù)據(jù)挖掘(DataMinin

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。