資源描述:
《一種基于場(chǎng)論的層次空間聚類算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、Vol.36No.72014年7月GgoFndticsaa44nfcHmGt-icn"ScienGe?€rf-ityJuly2Q44文章編號(hào):1671-8860(2011)07-0847-06文獻(xiàn)標(biāo)志碼:A一種基于場(chǎng)論的層次空間聚類算法敏1,2彭東亮1劉啟亮=2石巖1(1中南大學(xué)測(cè)繪與國土信息工程系(2湖南省地理空間信息工程技術(shù)研究中心,長(zhǎng)沙市麓山南路932號(hào),410083),長(zhǎng)沙市麓山南路932號(hào),410083)摘要:從空間數(shù)據(jù)場(chǎng)的角度出發(fā),提出了一種基于場(chǎng)論的層次空間聚類算法(簡(jiǎn)稱HSCBFT)。該算法是通過模擬空間實(shí)體間的凝聚力來
2、描述空間實(shí)體間的相互作用,進(jìn)而采取層次凝聚的策略進(jìn)行聚類。通過實(shí)驗(yàn)分析可以發(fā)現(xiàn),層次空間聚類算法具有如下優(yōu)勢(shì):1空間聚類簇中各空間實(shí)體很好地滿足了空間鄰近且專題屬性相似的要求;0能發(fā)現(xiàn)任意形狀的空間簇,且具有良好的抗噪性;?輸入?yún)?shù)較少。關(guān)鍵詞:空間聚類;場(chǎng)論;凝聚力;空間數(shù)據(jù)挖掘中圖法分類號(hào):P208空間聚類是當(dāng)前地球信息科學(xué)與計(jì)算機(jī)科學(xué)[1-4]領(lǐng)域共同關(guān)注的熱點(diǎn)問題之一,旨在將空間數(shù)據(jù)庫中的空間實(shí)體劃分成具有一定意義的若干簇,使得同一簇中的實(shí)體盡可能相似,而不同簇中實(shí)體間的差異盡可能大。目前,空間聚類技術(shù)已廣泛應(yīng)用于遙感圖像分類、熱
3、點(diǎn)分析、制圖綜合及地震空間分布模式挖掘等眾多應(yīng)用領(lǐng)域,主要用于揭示空間數(shù)據(jù)的分布規(guī)律,以及探測(cè)空間異常點(diǎn)?,F(xiàn)有的空間聚類算法大致可以分為:1基于[5][6]劃分的聚類方法,如kMeans、k-Mediods等;o基于層次的聚類方法,主要有BIRCH[7]、CURE?、CHAMELEON19]、AMOEBA[io]等;[11]?基于密度的聚類方法,例如DBSCAN[12][13]、[14]、DENCLUE、ADBSCOPTICS、[15][16]、FTSC等;?基于網(wǎng)格的聚類方LDBSC[17]、WaveCluster[18]等;?法,代表
4、算法有STING[19]基于圖論的聚類方法,如ZEMST、構(gòu),對(duì)于認(rèn)識(shí)和解釋復(fù)雜的地學(xué)現(xiàn)象具有重要意義。因此,層次空間聚類方法一直是空間聚類研究中的主要內(nèi)容之一。傳統(tǒng)的Single-Link、Complete-Link>Average-Link等凝聚式層次聚類方法分別采用兩簇之間的最小距離、最大距離、均值距離作為合并依據(jù),聚類結(jié)果容易出現(xiàn)/球型偏見0問題,無法獲得任意形狀的空間簇,且聚類結(jié)果易受噪聲影響。改進(jìn)的層次聚類算法有BIRCH、CURE、ROCK、CHAMELEON、AMOEBA等。雖然這些方法的聚類結(jié)果質(zhì)量有所提高,但依然存在
5、輸入?yún)?shù)過多、難以適應(yīng)空間數(shù)據(jù)的空間分異特性等缺陷。更為重要的是,上述層次聚類方法是針對(duì)傳統(tǒng)事務(wù)性數(shù)據(jù)庫提出的,難以同時(shí)滿足空間聚類中空間鄰近且專題屬性相似的要求。綜上所述,層次空間聚類方法一方面需要綜合顧及空間鄰近與專題屬性的相似;另一方面需0]等;?混合聚類方法AUTOCLUST代表算法[21]>NN-Density【22】等。其中,層次空有CLIQUE間聚類方法采用遞歸策略,依據(jù)一定的度量準(zhǔn)則對(duì)空間數(shù)據(jù)進(jìn)行合并或分裂,直到獲得指定的聚類結(jié)果,可以有效地反映空間數(shù)據(jù)分布的層次結(jié)要適應(yīng)空間數(shù)據(jù)分布的復(fù)雜性(如任意形狀、密度不均勻、噪聲點(diǎn)
6、等)。因此,本文在空間數(shù)據(jù)場(chǎng)的基礎(chǔ)上,通過模擬空間實(shí)體間的凝聚力作用,提出了一種基于場(chǎng)論的層次空間聚類算法(簡(jiǎn)稱HSCBFT)o收稿日期:2011-04-28o項(xiàng)目來源:國家863計(jì)劃資助項(xiàng)目(2009AA12Z206);地理空間信息工程國家測(cè)繪局重點(diǎn)實(shí)驗(yàn)室開放研究基金資助項(xiàng)目(201015);江蘇省資源環(huán)境信息工程重點(diǎn)實(shí)驗(yàn)室(中國礦業(yè)大學(xué))開放研究基金資助項(xiàng)目(JS200901);江西省數(shù)字國土重點(diǎn)實(shí)驗(yàn)室開放研究基金資助項(xiàng)目(DLLJ201005);中南大學(xué)前沿研究計(jì)劃資助項(xiàng)目(2010QYZD002)。1,XiIDNV(p)0,Xi
7、
8、DNV(p)Fp(P,q)=Epmq=1,qIND(p)0,qIND(p)考慮到可以將空間點(diǎn)(3)1基于場(chǎng)論的層次空間聚類算法在地理空間中,各空間實(shí)體間存在一定的依[23]賴與聯(lián)系??臻g數(shù)據(jù)場(chǎng)理論認(rèn)為,空間實(shí)體在其周圍一定范圍內(nèi)產(chǎn)生一個(gè)虛擬的物理場(chǎng),實(shí)體間通過這種物理場(chǎng)產(chǎn)生的凝聚力作用互相聯(lián)系。因此,采用空間數(shù)據(jù)場(chǎng)來描述空間實(shí)體間的相互作用比起傳統(tǒng)的距離度量方式具有更明顯的物理意義??臻g數(shù)據(jù)場(chǎng)的核心在于場(chǎng)強(qiáng)函數(shù)的定義,目前的場(chǎng)強(qiáng)函數(shù)定義方法主要包括高斯函數(shù)[13,24]、分段梯形函數(shù)法宙]以及外部約束法法[16]等。其中外部約束法定義的凝
9、聚場(chǎng)在適應(yīng)空間數(shù)據(jù)分異特性、顧及空間實(shí)體間鄰近關(guān)系以及減少人為參數(shù)設(shè)置等方面具有一定的優(yōu)勢(shì),為此,本文引入了凝聚場(chǎng)[16]來描述空間實(shí)體間的相互作用。1.1凝聚場(chǎng)基于外部約束的凝聚場(chǎng),其核心思