資源描述:
《基于小波的分析時間序列數據挖掘模型及其在電信欺詐檢測中的應用》由會員上傳分享,免費在線閱讀,更多相關內容在教育資源-天天文庫。
1、上海交通大學碩士學位論文基于小波分析的時間序列數據挖掘模型及其在電信欺詐檢測中的應用姓名:汪超申請學位級別:碩士專業(yè):應用數學指導教師:宋寶瑞20070101上海交通大學碩士學位論文符號說明I:客戶欠費指數Rn:n維歐氏空間U:Rn中非空子集Hs(F):F的s維Hausdorff空間DH:Hausdorff維數Pt:指數時間序列Rt:回報率時間序列μ:均值ó2:方差S(r):偏度K(r):峰度Xt,N:N個期間的累計離差eu:話務量MN:N個期間eu的平均值R:極差C:相關性度量第5頁上海交通大學學位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的學位
2、論文,是本人在導師的指導下,獨立進行研究工作所取得的成果。除文中已經注明引用的內容外,本論文不包含任何其他個人或集體已經發(fā)表或撰寫過的作品成果。對本文的研究做出重要貢獻的個人和集體,均已在文中以明確方式標明。本人完全意識到本聲明的法律結果由本人承擔。學位論文作者簽名:汪超日期:2007年1月26日上海交通大學學位論文版權使用授權書本學位論文作者完全了解學校有關保留、使用學位論文的規(guī)定,同意學校保留并向國家有關部門或機構送交論文的復印件和電子版,允許論文被查閱和借閱。本人授權上海交通大學可以將本學位論文的全部或部分內容編入有關數據庫進行檢索,
3、可以采用影印、縮印或掃描等復制手段保存和匯編本學位論文。保密□,在本學位論文屬于不保密□√。(請在以上方框內打“√”)學位論文作者簽名:汪超日期:2007年1月26日年解密后適用本授權書。指導教師簽名:宋寶瑞日期:2007年1月26日上海交通大學碩士學位論文基于小波分析的時間序列數據挖掘模型及其在電信欺詐檢測中的應用摘要本論文結合數據挖掘的理論,提出一個基于小波分析的時間序列挖掘的數據挖掘模型,它支持時間序列數據挖掘的整個過程。該模型應用小波實現數據的多層次可視化表示、數據約簡和多尺度模式發(fā)現。它可以幫助用戶觀察高維數據,理解中間結果和解釋
4、發(fā)現的模式。電信行業(yè)存在著大量現時的和歷史的操作型數據(如用戶基本信息、用戶呼叫行為信息和帳單信息等),這些海量數據的存在是進行數據挖掘的前提條件,也是需要采用數據挖掘技術的根本原因。同時,這些用戶數據可以用時間序列來表示,進而通過對數據進行基于時間序列的分析可以預測用戶未來的行為特征,發(fā)現用戶使用行為模式,并進行模式分類,從中區(qū)分出。但是,電信的海量數據形成的不僅僅是簡簡單單的時間序列,從表征上就可以猜想其必是不同頻率成分組成的復雜時間序列的集合。小波分析能將交織在一起的不同頻率成分組成的復雜時間序列分解成頻率不相同的子序列?;谛〔ǚ纸夂?/p>
5、重構思想,可以嘗試將用戶通話行為的日通話量過程分解成不同尺度下的小波系數(細節(jié))和尺度系數(背景),對分解所得的系數按實測資料顯示的主周期(年)進行隨機重構,從而獲得各種各樣的日通話量過程線。當小波函數和尺度函數或濾波器確定后,第1頁上海交通大學碩士學位論文分解和重構過程不需估算參數,也不必進行前期分析和任何假定,因而,這種隨機模擬方法具有非參數化特征。通過這種動態(tài)過程的模擬,就能對用戶的使用行為進行仿真,從而能區(qū)分與檢測出由異常通話模式引發(fā)的電信欺詐行為。本論文將該模型運用在電信防欺詐業(yè)務中,并針對個人話務流量作頻率分布特征分析,運用小波分
6、析將不同頻率成分組成的時間序列分解成低頻和高頻成分,然后依據小波系數的重構原理還原時間序列的趨勢成分,判斷話務流量時間序列的趨勢變化。運用小波分析對某省城客戶話務流量分析所得結果,建立神經網絡模型對該客戶話務流量進行預測?;谠擃A測結果,模擬該客戶的通話行為指紋,通過指紋比對,達到防欺詐效果。關鍵詞:時間序列數據挖掘小波分析電信欺詐第2頁上海交通大學碩士學位論文STUDYONDATAMININGMODELOFTIMESERIESBASEONWAVELETANALYSISANDAPPLICATIONINFRAUDDETECTINGINTELEC
7、OMMUNICATIONABSTRACTInthepaper,anewdataminingoftimeseriesbasedonthewaveletanalysiswhichsupportstimeseriesanalysisandpatterndiscovery,isappliedinfrauddetectionintelecommunication.Italsohelpsobservingthemulti-dimensiondata,understandingthedatastreamtrendandexplainthepatternfi
8、ndingthat.Thetelecomindustryandtheexistenceofalargeamountofhistoricaloperatingdata