資源描述:
《時間序列的數(shù)據(jù)挖掘研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、時間序列的數(shù)據(jù)挖掘研究摘要隨著計算機、網絡和通訊等信息技術和數(shù)據(jù)存儲技術的迅速發(fā)展,人們獲取和存儲的數(shù)據(jù)急劇增長,出現(xiàn)了“數(shù)據(jù)泛濫,知識貧乏”的現(xiàn)象。傳統(tǒng)的數(shù)據(jù)庫技術和數(shù)據(jù)查詢方法由于不能有效的組織和處理這些海量數(shù)據(jù),已經不能滿足人們對隱含在數(shù)據(jù)中的知識的渴求,數(shù)據(jù)挖掘技術隨之應運而生,并得到了迅速的發(fā)展。數(shù)據(jù)挖掘時數(shù)據(jù)庫、人工智能、模式識別和統(tǒng)計分析等學科相互交叉、結合的前沿性研究領域。它的出現(xiàn)為人們有效地從海量數(shù)據(jù)中得到有用的信息和知識提供了有力的手段。目前計算機上存儲了越來越多的時序數(shù)據(jù)信息,作為數(shù)據(jù)的重要存儲和表現(xiàn)形式,時間序列數(shù)據(jù)廣泛的
2、存在于各個領域中,例如證券公司的大量股票信息,商場的售貨中大量的銷售信息,人造衛(wèi)星觀測的氣象信息和廣泛的以時間推移存儲的數(shù)據(jù)等信息。時間序列的數(shù)據(jù)挖掘時數(shù)據(jù)挖掘中的一個重要的領域,近年來越來越引起人們的重視。時間序列的數(shù)據(jù)挖掘幫助人們獲得時序數(shù)據(jù)中隱含的、有價值的信息和知識。例如電力負荷系統(tǒng)時間序列數(shù)據(jù)中就包含著關于電力負荷特征的信息,股票時間序列中包含著有關股票規(guī)律的潛在信息。因此,從時間序列數(shù)據(jù)中挖掘潛在的有用的知識具有重要的理論和實踐意義。本文比較深入地研究了時間序列的數(shù)據(jù)挖掘問題,對其挖掘方法進行了歸納和整理。在介紹目前時間序列的數(shù)據(jù)挖掘
3、領域比較經典的一些思想和方法的基礎上,在時間序列的相似性,離群性和趨勢性等方面提出了一些新的思路和方法。本文的主要研究內容下。1、對時序數(shù)據(jù)相似性挖掘方法進行了深入的研究。首先介紹了相似性以及歐幾里的距離空間的基本概念,以及目前使用較為廣泛的離散復利葉變換進行時序數(shù)據(jù)相似性挖掘的基本方法。然后提出了一種基于小波的相似性挖掘算法,這種方法采用了另外的判別函數(shù)對序列的相似性進行判別。采用小波變換將數(shù)據(jù)降維,用盡量小的數(shù)據(jù)量進行相似性的匹配;同時采用了改進的快速排序法處理排序結果,有效的減少了計算量。此外,本方法對數(shù)據(jù)相似性分析中存在的幅值以及偏移的情
4、況有很好的去除。2、對時序數(shù)據(jù)離群挖掘進行了深入的研究。首先介紹了基于距離的離群挖掘方法以及相關的定義。然后提出了一種基于小波的相似系數(shù)離群挖掘算法。這種方法采用了小波變換得到的細節(jié)分量作為分析對象,對數(shù)據(jù)進行降維處理;計算數(shù)據(jù)對象間的相似系數(shù)進行離群挖掘。同樣,可以使用改進的快速排序方法處理排序結果,也可以有效的減少計算量。3、對時序數(shù)據(jù)趨勢挖掘進行了深入的研究。介紹了兩種趨勢挖掘方法。第一部分介紹了基于小波的神經網絡時序數(shù)據(jù)趨勢挖掘算法。第二部分介紹了基于相似日的時序數(shù)據(jù)趨勢挖掘算法。本章中重點闡述了基于相似日的趨勢挖掘算法,介紹了相似日的選
5、取以及利用誤差反饋進行修正的思想。關鍵字:數(shù)據(jù)挖掘,時間序列,相似性挖掘,離群性挖掘,趨勢性挖掘,小波變換RESEARCHONTHEMETHODOFTIMESERIESDATAMININGAbstractWiththerapiddevelopmentofcomputertechnologies,network,communicationanddatastoragetechnique,thedatathatweacquireandstoreareincreasedquickly.Itappearsthescenethatthemoredata,th
6、elessknowledge.Therapidgrowthdemandformanaginggrowingmountainsofdata,extractingandunderstandingusefulknowledgefromthesedataoutpacesthetraditionaldatabaseanddataanalysismethods,whichleadstotheemergingfieldofdatamining.Dataminingistheforesightedresearchfieldofintegrationofthefi
7、eldsofdatabase,artificialintelligence,patternrecognitionandstatistics.Itprovidesusapowerfultooltoacquiretheusefulinformationandknowledgeeffectivelyfromtherawdata.Now,moreandmoretimeseriesdataisstoredinthecomputer.Beingtheimportantstoringandshowingform,timeseriesdataarisesnatu
8、rallyinmanyrealworldapplicationslikethestockdata,thesalesdataofthePO