資源描述:
《時間序列的數(shù)據(jù)挖掘研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、時間序列的數(shù)據(jù)挖掘研究摘要隨著計算機、網(wǎng)絡(luò)和通訊等信息技術(shù)和數(shù)據(jù)存儲技術(shù)的迅速發(fā)展,人們獲取和存儲的數(shù)據(jù)急劇增長,出現(xiàn)了“數(shù)據(jù)泛濫,知識貧乏”的現(xiàn)象。傳統(tǒng)的數(shù)據(jù)庫技術(shù)和數(shù)據(jù)查詢方法由于不能有效的組織和處理這些海量數(shù)據(jù),已經(jīng)不能滿足人們對隱含在數(shù)據(jù)中的知識的渴求,數(shù)據(jù)挖掘技術(shù)隨之應(yīng)運而生,并得到了迅速的發(fā)展。數(shù)據(jù)挖掘時數(shù)據(jù)庫、人工智能、模式識別和統(tǒng)計分析等學(xué)科相互交叉、結(jié)合的前沿性研究領(lǐng)域。它的出現(xiàn)為人們有效地從海量數(shù)據(jù)中得到有用的信息和知識提供了有力的手段。目前計算機上存儲了越來越多的時序數(shù)據(jù)信息,作為數(shù)據(jù)的重要存儲和表現(xiàn)形式,時間序列數(shù)據(jù)廣泛的
2、存在于各個領(lǐng)域中,例如證券公司的大量股票信息,商場的售貨中大量的銷售信息,人造衛(wèi)星觀測的氣象信息和廣泛的以時間推移存儲的數(shù)據(jù)等信息。時間序列的數(shù)據(jù)挖掘時數(shù)據(jù)挖掘中的一個重要的領(lǐng)域,近年來越來越引起人們的重視。時間序列的數(shù)據(jù)挖掘幫助人們獲得時序數(shù)據(jù)中隱含的、有價值的信息和知識。例如電力負荷系統(tǒng)時間序列數(shù)據(jù)中就包含著關(guān)于電力負荷特征的信息,股票時間序列中包含著有關(guān)股票規(guī)律的潛在信息。因此,從時間序列數(shù)據(jù)中挖掘潛在的有用的知識具有重要的理論和實踐意義。本文比較深入地研究了時間序列的數(shù)據(jù)挖掘問題,對其挖掘方法進行了歸納和整理。在介紹目前時間序列的數(shù)據(jù)挖掘
3、領(lǐng)域比較經(jīng)典的一些思想和方法的基礎(chǔ)上,在時間序列的相似性,離群性和趨勢性等方面提出了一些新的思路和方法。本文的主要研究內(nèi)容下。1、對時序數(shù)據(jù)相似性挖掘方法進行了深入的研究。首先介紹了相似性以及歐幾里的距離空間的基本概念,以及目前使用較為廣泛的離散復(fù)利葉變換進行時序數(shù)據(jù)相似性挖掘的基本方法。然后提出了一種基于小波的相似性挖掘算法,這種方法采用了另外的判別函數(shù)對序列的相似性進行判別。采用小波變換將數(shù)據(jù)降維,用盡量小的數(shù)據(jù)量進行相似性的匹配;同時采用了改進的快速排序法處理排序結(jié)果,有效的減少了計算量。此外,本方法對數(shù)據(jù)相似性分析中存在的幅值以及偏移的情
4、況有很好的去除。2、對時序數(shù)據(jù)離群挖掘進行了深入的研究。首先介紹了基于距離的離群挖掘方法以及相關(guān)的定義。然后提出了一種基于小波的相似系數(shù)離群挖掘算法。這種方法采用了小波變換得到的細節(jié)分量作為分析對象,對數(shù)據(jù)進行降維處理;計算數(shù)據(jù)對象間的相似系數(shù)進行離群挖掘。同樣,可以使用改進的快速排序方法處理排序結(jié)果,也可以有效的減少計算量。3、對時序數(shù)據(jù)趨勢挖掘進行了深入的研究。介紹了兩種趨勢挖掘方法。第一部分介紹了基于小波的神經(jīng)網(wǎng)絡(luò)時序數(shù)據(jù)趨勢挖掘算法。第二部分介紹了基于相似日的時序數(shù)據(jù)趨勢挖掘算法。本章中重點闡述了基于相似日的趨勢挖掘算法,介紹了相似日的選
5、取以及利用誤差反饋進行修正的思想。關(guān)鍵字:數(shù)據(jù)挖掘,時間序列,相似性挖掘,離群性挖掘,趨勢性挖掘,小波變換RESEARCHONTHEMETHODOFTIMESERIESDATAMININGAbstractWiththerapiddevelopmentofcomputertechnologies,network,communicationanddatastoragetechnique,thedatathatweacquireandstoreareincreasedquickly.Itappearsthescenethatthemoredata,th
6、elessknowledge.Therapidgrowthdemandformanaginggrowingmountainsofdata,extractingandunderstandingusefulknowledgefromthesedataoutpacesthetraditionaldatabaseanddataanalysismethods,whichleadstotheemergingfieldofdatamining.Dataminingistheforesightedresearchfieldofintegrationofthefi
7、eldsofdatabase,artificialintelligence,patternrecognitionandstatistics.Itprovidesusapowerfultooltoacquiretheusefulinformationandknowledgeeffectivelyfromtherawdata.Now,moreandmoretimeseriesdataisstoredinthecomputer.Beingtheimportantstoringandshowingform,timeseriesdataarisesnatu
8、rallyinmanyrealworldapplicationslikethestockdata,thesalesdataofthePO