資源描述:
《單時(shí)間序列異常子序列檢測(cè)算法的研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、碩士學(xué)位論文單時(shí)間序列異常子序列檢測(cè)算法的研究RESEARCHOFDETECTIONALGORITHMFORABNORMALSUBSEQUENCEOFSINGLETIMESERIES肖鵬哈爾濱工業(yè)大學(xué)2015年12月國內(nèi)圖書分類號(hào):TP399學(xué)校代碼:10213國際圖書分類號(hào):621.3密級(jí):公開工學(xué)碩士學(xué)位論文單時(shí)間序列異常子序列檢測(cè)算法的研究碩士研究生:肖鵬導(dǎo)師:張春慨副教授申請(qǐng)學(xué)位:工學(xué)碩士學(xué)科:計(jì)算機(jī)科學(xué)與技術(shù)所在單位:深圳研究生院答辯日期:2015年12月授予學(xué)位單位:哈爾濱工業(yè)大學(xué)ClassifiedIndex:TP399U.D.C:
2、621.3DissertationfortheMasterDegreeinEngineeringRESEARCHOFDETECTIONALGORITHMFORABNORMALSUBSEQUENCEOFSINGLETIMESERIESCandidate:PengXiaoSupervisor:AssociateProf.ChunkaiZhangAcademicDegreeAppliedfor:MasterDegreeinEngineeringSpeciality:ComputerScienceAndTechnologyAffiliation:Shen
3、zhenGraduateSchoolDateofDefence:Dec,2015Degree-Conferring-Institution:HarbinInstituteofTechnology摘要摘要隨著信息技術(shù)的快速發(fā)展,數(shù)據(jù)的種類越來越多且數(shù)據(jù)規(guī)模越來越大,而時(shí)間序列是其中一種很重要的數(shù)據(jù)形式。從時(shí)間序列數(shù)據(jù)中尋找出異常極具意義,例如檢測(cè)異常心電數(shù)據(jù)、異常傳感器數(shù)據(jù)等。時(shí)間序列異常有時(shí)不僅僅是數(shù)據(jù)點(diǎn)異常,而是連續(xù)一段數(shù)據(jù)即子序列異常,本文研究的就是單時(shí)間序列中異常子序列的檢測(cè)。單時(shí)間序列異常子序列檢測(cè)方法主要有基于模型的方法及基于比較的方法
4、。基于比較的方法相比基于模型的方法來說,其思想簡單直觀,設(shè)置參數(shù)少,無需訓(xùn)練模型,算法適用范圍更廣。當(dāng)前基于比較的方法一般通過尋找與其余子序列最不相似的子序列來進(jìn)行異常子序列的檢測(cè)。其中典型高效的算法就是HOTSAX(HotSymbolicAggregateApproximation)算法?;诒容^的方法具有許多優(yōu)點(diǎn),但一些問題仍需解決改善,本文就是在基于比較的算法的基礎(chǔ)上進(jìn)行的異常子序列檢測(cè)研究。本文在基于比較的方法框架下,提出利用子序列最小邊界矩形比特化表示的聚類結(jié)果來啟發(fā)異常子序列的搜索順序,從而提高異常子序列檢測(cè)的效率。考慮到原異常子序列
5、定義不能發(fā)現(xiàn)相似異常的缺點(diǎn),改進(jìn)異常子序列的定義,采用基于k近鄰的異常子序列定義,并在此定義下提出高效的異常子序列檢測(cè)算法來尋找異常子序列。實(shí)際應(yīng)用中有時(shí)需要檢測(cè)前若干個(gè)異常,本文同時(shí)提出了檢測(cè)前若干個(gè)最異常子序列的算法。時(shí)間序列數(shù)據(jù)通常是源源不斷更新的,將時(shí)間序列異常子序列檢測(cè)算法運(yùn)用到動(dòng)態(tài)時(shí)間序列數(shù)據(jù)流中進(jìn)行異常子序列在線檢測(cè)更具實(shí)際應(yīng)用價(jià)值,本文通過深入分析時(shí)間序列數(shù)據(jù)流特點(diǎn),將新定義下的異常子序列檢測(cè)算法框架運(yùn)用到時(shí)間序列數(shù)據(jù)流中,提出了高效的異常子序列在線檢測(cè)算法以適應(yīng)時(shí)間序列數(shù)據(jù)流。通過將本文提出的算法運(yùn)用到模擬數(shù)據(jù)集和實(shí)際數(shù)據(jù)集中進(jìn)
6、行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明,算法是有效的,且獲得了較高的效率。關(guān)鍵詞:單時(shí)間序列;異常子序列;HOTSAX;k近鄰-I-AbstractAbstractWiththerapiddevelopmentofinformationtechnology,moreandmoretypeofdataappearandthescaleofdataisalsoincrease,andtimeseriesisakindofimportantdatarepresentationform.Findinganomalyintimeseriesdataisreallymeani
7、ngful,suchasdetectionabnormalelectrocardiogram,abnormalsensordata.Sometimes,thesingledatapointabnormaldoesnotindicatetheanomalyoftimeseries,buttheabnormalsubsequencedoes.Theresearchsubjectofthispaperisthedetectionofabnormalsubsequenceinsingletimeseries.Therearemainlytwotypeso
8、fmethodinfindingsingletimeseriesabnormalsubsequence,oneofmethodiscom