資源描述:
《基于小波變換的時(shí)間序列挖掘研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、天津大學(xué)碩士學(xué)位論文基于小波變換的時(shí)間序列挖掘研究姓名:田政雄申請學(xué)位級別:碩士專業(yè):管理科學(xué)與工程指導(dǎo)教師:寇紀(jì)淞20080501摘要時(shí)間序列是按時(shí)間順序排列的,隨時(shí)間變化且相互關(guān)聯(lián)的數(shù)據(jù)序列,在金融、科學(xué)觀測和工程等各個(gè)領(lǐng)域都廣泛存在。如何有效的管理和利用這些數(shù)據(jù),發(fā)現(xiàn)這些數(shù)據(jù)背后隱含的規(guī)律和知識,是人們廣泛關(guān)注,具有重要意義的理論和實(shí)際應(yīng)用課題。數(shù)據(jù)挖掘的方法主要有統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法和數(shù)據(jù)庫方法。本文主要研究了小波變換應(yīng)用到時(shí)間序列挖掘中的方法,包括小波變換在時(shí)間序列屬性
2、約簡,時(shí)間序列相似性匹配,時(shí)間序列奇異點(diǎn)檢測中的應(yīng)用,根據(jù)小波變換的多分辨性提出了基于小波變換的聚類算法,重點(diǎn)研究了時(shí)間序列挖掘中的多層次相似性匹配和多層次頻繁模式挖掘問題。主要研究成果如下:1.小波變換改進(jìn)傳統(tǒng)聚類算法針對傳統(tǒng)聚類算法如k.Means算法中初始聚類中心是隨機(jī)選擇的,不太合理的問題,提出了基于小波分析的時(shí)間序列聚類算法W.kMeans算法,一算出時(shí)間序列的Ham"分解系數(shù),就在這些系數(shù)上運(yùn)用k.Means聚類算法,從第二個(gè)層次開始,再漸漸的進(jìn)行到更高的層次上。2.時(shí)間序列的多尺度
3、相似性模式匹配改進(jìn)了現(xiàn)有的時(shí)間序列多尺度相似匹配算法,現(xiàn)有算法中序列的片段相似標(biāo)準(zhǔn)僅僅考慮了兩個(gè)片段的傾角而沒有考慮長度,本文結(jié)合時(shí)間序列的KL相似性度量提出了一種更好更合理的多尺度時(shí)間序列相似模式匹配算法。并根據(jù)小波變換的多尺度性提出一種更有效,更合理的方法來解決時(shí)間軸伸縮問題,進(jìn)行更長時(shí)間的模式匹配。3.時(shí)間序列的多尺度頻繁模式挖掘時(shí)間序列本身有長期和短期之分,挖掘時(shí)間序列的多尺度模式有著重要的現(xiàn)實(shí)意義,本文首次提出了多尺度頻繁模式挖掘的概念,并根據(jù)小波變換的多分辨性,提出了基于小波變換的時(shí)
4、間序列多尺度頻繁模式挖掘算法,本算法首先對原序列進(jìn)行小波變換,然后在變換后的序列上挖掘頻繁模式,并結(jié)合了基于重要點(diǎn)分段方法和互關(guān)聯(lián)后繼樹方法,能挖掘出不同尺度的頻繁模式。關(guān)鍵詞:數(shù)據(jù)挖掘,時(shí)間序列,小波變換,頻繁模式,互關(guān)聯(lián)后繼樹ABSTRACTAtimeseriesisadatasequenceofobservationswhichareorderedintime,whichexistsinvariousfields,suchasfmance,scienceobservingandengine
5、ering,etc.Howtomanageandusethesetimeseriesdataefficientlyisanimportantandchallengingsubject.Atpresent,mainmethodsofdataminingresearchinclduestatisticalmethods,machinelearning,neuralnetworkanddatabasemethods.Inthisthesiswavelettransformappliedtothetim
6、eseriesminingistobestudied,whichincludeswavelet乜.a(chǎn)nsf.onninthetimeseriesattributereduction,timeseriessimilaritymatching,outlierdetectionintimeseries.Byusingthemultiresolutionpropertyofwavelettransform,anapproachtoperformincrementalclusteringoftimeser
7、iesatvariousresolutions1Spresented,andthen,theissuesofmulti—leveltimeseriessimilaritysearchtechniqueandmulti.1eveldiscoveryofthefrequentpatternsbasedonwavelettransformationsareproposed.Themainworksandcontributionsofthisthesisare:(1)Improvethetraditio
8、nalclusteringalgorithmusingwavelettransformInordertomitigatetheproblemassociatedwiththechoiceofinitialcentersoftraditionalclusteringalgorithm(suchask-means),W-kMeansalgotithmisproposed·OncewecomputetheHaardecomposition,weperformthek—meansclusteringal