資源描述:
《基于小波的分析時(shí)間序列數(shù)據(jù)挖掘模型及其在電信欺詐檢測(cè)中的應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、上海交通大學(xué)碩士學(xué)位論文基于小波分析的時(shí)間序列數(shù)據(jù)挖掘模型及其在電信欺詐檢測(cè)中的應(yīng)用姓名:汪超申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):應(yīng)用數(shù)學(xué)指導(dǎo)教師:宋寶瑞20070101上海交通大學(xué)碩士學(xué)位論文符號(hào)說(shuō)明I:客戶欠費(fèi)指數(shù)Rn:n維歐氏空間U:Rn中非空子集Hs(F):F的s維Hausdorff空間DH:Hausdorff維數(shù)Pt:指數(shù)時(shí)間序列Rt:回報(bào)率時(shí)間序列μ:均值ó2:方差S(r):偏度K(r):峰度Xt,N:N個(gè)期間的累計(jì)離差eu:話務(wù)量MN:N個(gè)期間eu的平均值R:極差C:相關(guān)性度量第5頁(yè)上海交通大學(xué)學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的學(xué)位
2、論文,是本人在導(dǎo)師的指導(dǎo)下,獨(dú)立進(jìn)行研究工作所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本論文不包含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫過(guò)的作品成果。對(duì)本文的研究做出重要貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。本人完全意識(shí)到本聲明的法律結(jié)果由本人承擔(dān)。學(xué)位論文作者簽名:汪超日期:2007年1月26日上海交通大學(xué)學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國(guó)家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)上海交通大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢索,
3、可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。保密□,在本學(xué)位論文屬于不保密□√。(請(qǐng)?jiān)谝陨戏娇騼?nèi)打“√”)學(xué)位論文作者簽名:汪超日期:2007年1月26日年解密后適用本授權(quán)書。指導(dǎo)教師簽名:宋寶瑞日期:2007年1月26日上海交通大學(xué)碩士學(xué)位論文基于小波分析的時(shí)間序列數(shù)據(jù)挖掘模型及其在電信欺詐檢測(cè)中的應(yīng)用摘要本論文結(jié)合數(shù)據(jù)挖掘的理論,提出一個(gè)基于小波分析的時(shí)間序列挖掘的數(shù)據(jù)挖掘模型,它支持時(shí)間序列數(shù)據(jù)挖掘的整個(gè)過(guò)程。該模型應(yīng)用小波實(shí)現(xiàn)數(shù)據(jù)的多層次可視化表示、數(shù)據(jù)約簡(jiǎn)和多尺度模式發(fā)現(xiàn)。它可以幫助用戶觀察高維數(shù)據(jù),理解中間結(jié)果和解釋
4、發(fā)現(xiàn)的模式。電信行業(yè)存在著大量現(xiàn)時(shí)的和歷史的操作型數(shù)據(jù)(如用戶基本信息、用戶呼叫行為信息和帳單信息等),這些海量數(shù)據(jù)的存在是進(jìn)行數(shù)據(jù)挖掘的前提條件,也是需要采用數(shù)據(jù)挖掘技術(shù)的根本原因。同時(shí),這些用戶數(shù)據(jù)可以用時(shí)間序列來(lái)表示,進(jìn)而通過(guò)對(duì)數(shù)據(jù)進(jìn)行基于時(shí)間序列的分析可以預(yù)測(cè)用戶未來(lái)的行為特征,發(fā)現(xiàn)用戶使用行為模式,并進(jìn)行模式分類,從中區(qū)分出。但是,電信的海量數(shù)據(jù)形成的不僅僅是簡(jiǎn)簡(jiǎn)單單的時(shí)間序列,從表征上就可以猜想其必是不同頻率成分組成的復(fù)雜時(shí)間序列的集合。小波分析能將交織在一起的不同頻率成分組成的復(fù)雜時(shí)間序列分解成頻率不相同的子序列?;谛〔ǚ纸夂?/p>
5、重構(gòu)思想,可以嘗試將用戶通話行為的日通話量過(guò)程分解成不同尺度下的小波系數(shù)(細(xì)節(jié))和尺度系數(shù)(背景),對(duì)分解所得的系數(shù)按實(shí)測(cè)資料顯示的主周期(年)進(jìn)行隨機(jī)重構(gòu),從而獲得各種各樣的日通話量過(guò)程線。當(dāng)小波函數(shù)和尺度函數(shù)或?yàn)V波器確定后,第1頁(yè)上海交通大學(xué)碩士學(xué)位論文分解和重構(gòu)過(guò)程不需估算參數(shù),也不必進(jìn)行前期分析和任何假定,因而,這種隨機(jī)模擬方法具有非參數(shù)化特征。通過(guò)這種動(dòng)態(tài)過(guò)程的模擬,就能對(duì)用戶的使用行為進(jìn)行仿真,從而能區(qū)分與檢測(cè)出由異常通話模式引發(fā)的電信欺詐行為。本論文將該模型運(yùn)用在電信防欺詐業(yè)務(wù)中,并針對(duì)個(gè)人話務(wù)流量作頻率分布特征分析,運(yùn)用小波分
6、析將不同頻率成分組成的時(shí)間序列分解成低頻和高頻成分,然后依據(jù)小波系數(shù)的重構(gòu)原理還原時(shí)間序列的趨勢(shì)成分,判斷話務(wù)流量時(shí)間序列的趨勢(shì)變化。運(yùn)用小波分析對(duì)某省城客戶話務(wù)流量分析所得結(jié)果,建立神經(jīng)網(wǎng)絡(luò)模型對(duì)該客戶話務(wù)流量進(jìn)行預(yù)測(cè)。基于該預(yù)測(cè)結(jié)果,模擬該客戶的通話行為指紋,通過(guò)指紋比對(duì),達(dá)到防欺詐效果。關(guān)鍵詞:時(shí)間序列數(shù)據(jù)挖掘小波分析電信欺詐第2頁(yè)上海交通大學(xué)碩士學(xué)位論文STUDYONDATAMININGMODELOFTIMESERIESBASEONWAVELETANALYSISANDAPPLICATIONINFRAUDDETECTINGINTELEC
7、OMMUNICATIONABSTRACTInthepaper,anewdataminingoftimeseriesbasedonthewaveletanalysiswhichsupportstimeseriesanalysisandpatterndiscovery,isappliedinfrauddetectionintelecommunication.Italsohelpsobservingthemulti-dimensiondata,understandingthedatastreamtrendandexplainthepatternfi
8、ndingthat.Thetelecomindustryandtheexistenceofalargeamountofhistoricaloperatingdata