資源描述:
《時(shí)序空間關(guān)聯(lián)規(guī)則挖掘及其應(yīng)用研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、萬方數(shù)據(jù)2008年10月第6卷第5期地理空間信息GEOSPATIALINFORMA7FIONOct.,2008Vol-6.NO.5時(shí)序空問關(guān)聯(lián)規(guī)則挖掘及其應(yīng)用研究沙宗堯(武漢大學(xué)國(guó)際軟件學(xué)院,湖北武漢430070)摘要:空間關(guān)聯(lián)規(guī)則挖掘是空間數(shù)據(jù)挖掘的重要內(nèi)容,文中給出了時(shí)序空間關(guān)聯(lián)規(guī)則挖掘的相關(guān)概念、原理及實(shí)現(xiàn)(算法).研究了時(shí)序空間關(guān)聯(lián)規(guī)則挖掘數(shù)據(jù)集的構(gòu)造方法,提出通過空間實(shí)體關(guān)聯(lián)關(guān)系和時(shí)間項(xiàng)轉(zhuǎn)置方法將處于不同時(shí)刻的、相互獨(dú)立的空間數(shù)據(jù)集進(jìn)行重構(gòu),生成隱含了時(shí)序空間關(guān)聯(lián)特征的挖掘數(shù)據(jù)集,進(jìn)而可應(yīng)用關(guān)聯(lián)規(guī)則挖掘算法獲取時(shí)序空間關(guān)聯(lián)知識(shí),初步進(jìn)行了時(shí)序空間關(guān)聯(lián)規(guī)
2、則挖掘的應(yīng)用研究。關(guān)鍵詞:空間數(shù)據(jù)挖掘:空間關(guān)聯(lián)規(guī)則;時(shí)序關(guān)聯(lián);算法中圖分類號(hào):P208文獻(xiàn)標(biāo)志碼:B文章編號(hào):1672-4623(2008)05—0018一04Time--serialSpatialAssociationDataMiningandItsApplicationsSHAZongyao(InternationalSoftwareSchool,WuhanUniversity,Wuhan430079,China)Abstract:Spatialassociationdataminingisanimportantareaofspatialdataminin
3、g.Thispaperpresentedthebasicconcepts,principleandalgorithmoftime-serialspatialassociationdatamining.Byapplyingassociationrelationshipbetweenspatialentitiesanditem—timetransmitting,thedependentdatasetsatdifferencetimescouldbeintegratedintoanewdataset(N—dataset)whichcontainedthesequent
4、ialinformationoftheoriginaldatasets.Availableas—sociationruleminingalgorithmscouldbeeasilyappliedtotheN-datasettoextracttime-serialspatialassociationrules.Keywords:spatialdatamining;spatialassociationrule;timeserialassociation;algorithm信息社會(huì)的顯著特點(diǎn)是數(shù)據(jù)量呈指數(shù)增加,傳統(tǒng)的基于數(shù)據(jù)查詢、簡(jiǎn)單數(shù)據(jù)統(tǒng)計(jì)的應(yīng)用不能充分發(fā)掘這些數(shù)據(jù)
5、的內(nèi)在價(jià)值。面對(duì)海量的數(shù)據(jù)資源,如何從中發(fā)現(xiàn)潛在的有用模式或知識(shí),成為數(shù)據(jù)庫技術(shù)與應(yīng)用的重要領(lǐng)域——從數(shù)據(jù)庫中發(fā)現(xiàn)知識(shí)(KnowledgeDiscoveryfromDatabases,KDD)或數(shù)據(jù)挖掘(DataMining)?“。隨著空間信息技術(shù)特別是空間數(shù)據(jù)獲取技術(shù)的飛速發(fā)展,空間數(shù)據(jù)庫已成為很多應(yīng)用領(lǐng)域的數(shù)據(jù)基礎(chǔ),通過空間數(shù)據(jù)挖掘或知識(shí)發(fā)現(xiàn),可以從空間數(shù)據(jù)庫中獲取普遍的幾何知識(shí)、空間分布規(guī)律、空間關(guān)聯(lián)規(guī)則、空間聚類規(guī)則、空間演變規(guī)則,為充分利用空間數(shù)據(jù)資源提供有力武器D】【鍆。在數(shù)據(jù)挖掘中,關(guān)聯(lián)規(guī)則是最早被人們所注意并引入商業(yè)應(yīng)用的研究領(lǐng)域之一,關(guān)聯(lián)規(guī)則反
6、映了數(shù)據(jù)庫中不同數(shù)據(jù)項(xiàng)間的關(guān)聯(lián)性,通過挖掘關(guān)聯(lián)規(guī)則,可以分析和理解數(shù)據(jù)庫中不同數(shù)據(jù)項(xiàng)間的關(guān)聯(lián)關(guān)系。空間關(guān)聯(lián)規(guī)則反映了空間實(shí)體間的關(guān)聯(lián)性(如方位關(guān)聯(lián)、鄰接關(guān)聯(lián)、拓?fù)潢P(guān)聯(lián)、距離關(guān)聯(lián)、共生關(guān)聯(lián)、包含關(guān)聯(lián)等),空間關(guān)聯(lián)規(guī)則挖掘是空間知識(shí)發(fā)現(xiàn)的一個(gè)重要內(nèi)容,當(dāng)空間數(shù)據(jù)庫為時(shí)空數(shù)據(jù)庫時(shí),還可以把空間關(guān)聯(lián)規(guī)則與時(shí)間維聯(lián)系起來,挖掘帶有時(shí)間約束條件的時(shí)序空間關(guān)聯(lián)規(guī)則”1161。盡管目前在關(guān)聯(lián)規(guī)則、時(shí)序關(guān)聯(lián)規(guī)則的挖掘方面的研究已經(jīng)較為深入,但對(duì)空間關(guān)聯(lián)規(guī)則特別是當(dāng)考慮到時(shí)序特征的空間關(guān)聯(lián)規(guī)則挖掘的研究卻較少,本文針對(duì)時(shí)序空間關(guān)聯(lián)規(guī)則挖掘,給出相關(guān)原理、算法實(shí)現(xiàn)及應(yīng)用。1概念、原理
7、與算法1.1關(guān)聯(lián)規(guī)則與空間關(guān)聯(lián)規(guī)則關(guān)聯(lián)規(guī)則可以用以下數(shù)學(xué)模型加以描述:令I(lǐng)={屯f2,?,厶}是字母集,稱為數(shù)據(jù)項(xiàng),D。{D1,D2,?,Dn)是全體事務(wù)的集合。事務(wù)T是I的一個(gè)子集,即TCI,每個(gè)事務(wù)由唯一的標(biāo)志TID標(biāo)識(shí)。對(duì)數(shù)據(jù)項(xiàng)集XcI,稱T包含X當(dāng)且僅當(dāng)X_T,關(guān)聯(lián)規(guī)則具有如下形式:X_>Y,這里X_CI,Y_cI,且XnY=少,X稱為規(guī)則的條件,Y稱為規(guī)則的結(jié)果。規(guī)則x=>Y對(duì)集合D的置收稿日期:2008—03—25項(xiàng)目來源:教育部地理信息系統(tǒng)重點(diǎn)實(shí)驗(yàn)室開放資金資助項(xiàng)目(WD200610)。萬方數(shù)據(jù)第6卷第5期沙宗堯:時(shí)序空間關(guān)聯(lián)規(guī)則挖掘及其應(yīng)用研究·
8、19·信度定義為D中c%