資源描述:
《空間關(guān)聯(lián)規(guī)則挖掘》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、空間關(guān)聯(lián)規(guī)則挖掘姓名:徐博軒學(xué)號:TS13160088學(xué)院:環(huán)境與測繪學(xué)院目錄什么是GIS空間關(guān)聯(lián)規(guī)則挖掘面向主題的空間關(guān)聯(lián)規(guī)則挖掘空間關(guān)聯(lián)規(guī)則挖掘發(fā)展趨勢什么是GIS地理信息系統(tǒng)是一種在計(jì)算機(jī)軟件,硬件支持下,把各種地理信息和環(huán)境參數(shù)按空間分布或地理坐標(biāo),以一定格式輸入,存儲,檢索,顯示和綜合分析應(yīng)用的技術(shù)系統(tǒng),是多種學(xué)科交叉的產(chǎn)物。GIS基本概念GIS與各學(xué)科關(guān)系GIS地理學(xué)遙感技術(shù)制圖技術(shù)計(jì)算機(jī)科學(xué)軟件工程數(shù)據(jù)庫技術(shù)計(jì)算機(jī)圖形學(xué)CAD專家系統(tǒng)1、理論基礎(chǔ)2、為空間分析提供方法1、都是基于地理信息的表達(dá)2.Gis的
2、重要數(shù)據(jù)來源空間數(shù)據(jù)的主要采集手段,與GIS互補(bǔ)GIS基礎(chǔ)分析這些GIS基本分析可以完成地形分析、路網(wǎng)分析、城市規(guī)劃綠地分析、社會經(jīng)濟(jì)分析等。疊加分析緩沖分析距離和密度分析其它二維分析可視化分析地統(tǒng)計(jì)分析數(shù)據(jù)挖掘北京就業(yè)密度三維圖1996-2004年就業(yè)密度變化圖案例:北京市就業(yè)結(jié)構(gòu)統(tǒng)計(jì)分析案例:長三角城市聚類分析按照城市化發(fā)展水平(共21個指標(biāo))使用聚類分析??臻g數(shù)據(jù)挖掘和知識發(fā)現(xiàn)(SDMKD)興起于20世紀(jì)90年代,本質(zhì)是從空間數(shù)據(jù)庫中提取不明確和隱含的知識、空間關(guān)系等,目的是發(fā)現(xiàn)、解釋或預(yù)測空間現(xiàn)象或事件,其中空間
3、關(guān)聯(lián)規(guī)則是空間數(shù)據(jù)挖掘的重要知識內(nèi)容??臻g關(guān)聯(lián)規(guī)則(spatialassociationrules)指的是空間實(shí)體間相鄰、相連、共生和包含等空間關(guān)聯(lián)規(guī)則,發(fā)現(xiàn)的知識通常用關(guān)聯(lián)規(guī)則或頻繁項(xiàng)集的形式表示??臻g關(guān)聯(lián)規(guī)則挖掘如G1∧?∧Gm→H1∧?∧Hn(s%,c%),令G=G1∧?∧Gm為規(guī)則前件,H=H1∧?∧Hn為規(guī)則后件。c%是此規(guī)則的可信度如果謂詞“G∧H”,在集合S上是頻繁的且規(guī)則“G→H/S”的可信度較高,則稱“G→H/S”為強(qiáng)規(guī)則。G在集合S中的支持度S定義為滿足G的對象數(shù)量與S中對象數(shù)量之比,記為б(G/S)
4、。規(guī)則G→H在集合S中的可信度定義為б(G∧H/S)與б(G/S)之比,記為φ(G→H/S)。如果G的支持度不低于概念層次第k層的最小支持度閾值б’k,則謂詞G在集合S的第k層是頻繁的,且G的所有祖先在相應(yīng)的概念層次上也較頻繁。如果可信度不低于相應(yīng)層的可信度閾值φ’k,則規(guī)則”G→H/S”在集合S的第k層較高空間關(guān)聯(lián)規(guī)則挖掘(1)空間拓?fù)潢P(guān)系topologyrelation={disjoin,intersect,adjacentto,cover,coveredby…}(2)空間距離關(guān)系確定區(qū)域距離是一個復(fù)雜的工作,因?yàn)橐?/p>
5、充分考慮空間對象自身的大小在距離度量上的重要性。Distance={close_to,far-away…}(3)方向關(guān)系Direction={left,right,north,east,northeast…}例:is_a(X,”housel”)^close_to(X,”beach”)=>is_expensive(X)[85%,90%]空間關(guān)系常用算法的數(shù)據(jù)流程圖主要是針對減少搜索頻繁項(xiàng)集的次數(shù),以及如何有效地對空間關(guān)系進(jìn)行概化。據(jù)此,可將幾種改進(jìn)方法分為:②基于空間復(fù)雜性的優(yōu)化①基于時間復(fù)雜性的優(yōu)化。針對基本關(guān)聯(lián)規(guī)則算法
6、的改進(jìn)時間復(fù)雜性主要是搜索計(jì)算頻繁謂詞的次數(shù),有效縮小搜索頻繁項(xiàng)的頻率,即降低算法的時間復(fù)雜度基于規(guī)則模板的模型基于模糊邏輯的近似區(qū)域表示模型案例預(yù)測雷電頻發(fā)區(qū)域中桿塔發(fā)生故障的規(guī)則。在雷電頻發(fā)區(qū)域中桿塔發(fā)生故障有以下情況:(1)由于桿塔被雷擊引起跳閘,發(fā)生故障;(2)由于桿塔污染嚴(yán)重,發(fā)生故障。面向主題的空間關(guān)聯(lián)規(guī)則挖掘第一步:對矢量數(shù)據(jù)圖進(jìn)行數(shù)據(jù)預(yù)處理(空缺數(shù)據(jù)填充,連續(xù)屬性數(shù)據(jù)離散…)第二步:數(shù)據(jù)庫->Task_DB->MBR謂詞存貯在空間數(shù)據(jù)庫Coarse_DB中第三步:為Coarse_DB中的每個謂詞計(jì)算支持度
7、和可信度,過濾形成形成數(shù)據(jù)庫Frequent_coarse_DB。(1)使用最小邊界矩形(MBR)結(jié)構(gòu)進(jìn)行近似空間運(yùn)算;(2)計(jì)算粗略的空間謂詞)第四步:采用MRR技術(shù)對第三步以后的進(jìn)行檢查,形成Fine_DB.第五步:采用Apriori算法在Fine_DB上抽取強(qiáng)空間關(guān)聯(lián)規(guī)則并提取出關(guān)聯(lián)規(guī)則?;诙鄠€空間數(shù)據(jù)層的空間概念關(guān)系在給定主題的空間關(guān)聯(lián)規(guī)則挖掘中,要全面了解一個主題的有關(guān)信息,往往需要多個空間數(shù)據(jù)層的信息。概念層次圖進(jìn)行數(shù)據(jù)挖掘的數(shù)據(jù)表關(guān)聯(lián)規(guī)則最小支持率6%和最小置信度75%桿塔的故障率為規(guī)則后件,以其余屬性為
8、規(guī)則前件規(guī)則1:距離植被較近∧植被較高∧桿塔雷擊頻率較高→故障率高規(guī)則2:距離植被較近∧植被面積較大∧桿塔雷擊頻率較高→故障率高規(guī)則3:距離道路較近∧車流量大∧桿塔雷擊頻率較高→故障率高規(guī)則4:距離道路較近∧車流量大∧桿塔污染嚴(yán)重→故障率高規(guī)則5:距離植被較遠(yuǎn)∧植被較低∧桿塔雷擊頻率較低→故障率低規(guī)則6:距離植被較遠(yuǎn)