資源描述:
《時(shí)空數(shù)據(jù)分析算法及其應(yīng)用研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、...時(shí)空數(shù)據(jù)分析算法及其應(yīng)用研究空間和時(shí)間是現(xiàn)實(shí)世界最基本、最重要的屬性,許多空間應(yīng)用系統(tǒng)都需要表達(dá)地學(xué)對(duì)象的時(shí)空屬性,例如在地理位置變更、環(huán)境監(jiān)測(cè)、城市演化等領(lǐng)域都需要管理歷史變化數(shù)據(jù),以便重建歷史、跟蹤變化、預(yù)測(cè)未來(lái)。面向?qū)ο蟮募夹g(shù)是用在軟件設(shè)計(jì)中的一種方法,它用在時(shí)空數(shù)據(jù)[1]表達(dá)中主要是為了克服給定實(shí)體的空間或非空間屬性在不同時(shí)間不同頻率變化而出現(xiàn)的復(fù)雜問(wèn)題[2]。下面從KNN、RNN、SkyLine三種時(shí)空數(shù)據(jù)分析算法出發(fā),論述時(shí)空數(shù)據(jù)分析算法的應(yīng)用。1、KNN分析算法的基本概述及應(yīng)用分析
2、KNN算法是非參數(shù)回歸模型的基本算法之一,通過(guò)在狀態(tài)空間中搜索與待測(cè)點(diǎn)X相近的k個(gè)樣本(Xi,Yi)估計(jì)gn(x),因此又稱為k最近鄰非參數(shù)回歸,其預(yù)測(cè)函數(shù)[3]可表示為kkY=g(X)=Wi(X;Xk1,?,Xkk)Yi=kiYi(1)i1i1其中Xk1.表示與x距離最近的點(diǎn),并賦予權(quán)值k1;Xk2則被賦予權(quán)值k2;以此類推,得到k個(gè)權(quán)函數(shù)k1,k2,?,kk,滿足kk1≥k2≥?≥kk≥0,k=1(2)ii1KNN算法通過(guò)計(jì)算樣本個(gè)體之間的距離或者相似度來(lái)尋找與每個(gè)樣本個(gè)體最相近的K個(gè)個(gè)體,在這個(gè)
3、過(guò)程中需要完成一次樣本個(gè)體的兩兩比較,所以算法的時(shí)間復(fù)雜度,跟樣本的個(gè)數(shù)直接相關(guān)。K最近鄰算法通常情況下是用于分類的,這只是對(duì)K近鄰算法用途的本質(zhì)說(shuō)明[4]。從實(shí)際來(lái)看,K近鄰算法可以應(yīng)用的地方還有很多,比如系統(tǒng)推薦等等。簡(jiǎn)單的講,就是挖掘出客戶喜歡的相同商品,來(lái)進(jìn)行相似物品的推薦。另外區(qū)分客戶群體,從而使我們更好的為客戶服務(wù)。下面是KNN分類器構(gòu)建實(shí)例。KNN的實(shí)現(xiàn)分訓(xùn)練和識(shí)別兩步。訓(xùn)練時(shí),把每類樣本降維后的結(jié)果作為KNN的輸入。如圖1所示,圓圈表示待識(shí)別數(shù)據(jù)所處的位置,選擇K值為3時(shí),選中實(shí)線圓中
4、的3個(gè)數(shù)據(jù),識(shí)別結(jié)果為三角形代表的類;選擇K
值為5時(shí),選中虛線圓中的5個(gè)數(shù)據(jù),識(shí)別結(jié)果為正方形代表的類。-1-......圖1KNN分類器構(gòu)建關(guān)于智能商務(wù)中的聚類算法等,已經(jīng)應(yīng)用于很多系統(tǒng)中,比如推薦系統(tǒng)、文本分類系統(tǒng)等等[5]。這其中衍生出的產(chǎn)品或者項(xiàng)目都已經(jīng)被廣泛使用于電子商務(wù)領(lǐng)域。為了增加交易,滿足不同的顧客的需求,研究人員已經(jīng)推出了利用消費(fèi)者訪問(wèn)和購(gòu)買的行為的推薦系統(tǒng)。廣泛應(yīng)用在大的超市或者企業(yè)中。這些系統(tǒng)通常通過(guò)給顧客一些與他購(gòu)買物品高度相關(guān)聯(lián)的推薦物品,來(lái)增加購(gòu)買和交易。比如亞馬遜是通過(guò)
5、偏好和用戶信息和購(gòu)買信息來(lái)向顧客推薦相關(guān)書籍。并且在這過(guò)程中,使用的技術(shù)并不復(fù)雜,而這不妨礙推薦系統(tǒng)的精確有效。2、RNN分析算法的基本概述及應(yīng)用分析通常,RNN查詢[6]的定義為:給定一個(gè)數(shù)據(jù)點(diǎn)集合P和一個(gè)查詢點(diǎn)q,單色反向最近鄰查詢(MonochromaticReverseNearestNeighborQuery,RNN)找出所有以查詢點(diǎn)q為最近鄰的數(shù)據(jù)點(diǎn),即RNN(q)={p∈P丨?p’∈Ps.t.d(p,p’)6、向最近鄰查詢(BichromaticReverseNearestNeighborQuery,bRNN)找出所有的數(shù)據(jù)點(diǎn)p∈P,滿足p與q之間的距離比p與Q中任意一個(gè)點(diǎn)的距離都要短,即bRNN(q)={p∈P丨?p’∈Qs.t.d(p,q’)7、來(lái),反向最近鄰查詢學(xué)術(shù)界得到了深入探討和研究,并且在諸如決策支持、資源分配等許多領(lǐng)域得到了廣泛應(yīng)用。例如利用隨機(jī)神經(jīng)元網(wǎng)絡(luò)方法和輻射神經(jīng)元網(wǎng)絡(luò)方法設(shè)計(jì)分布式數(shù)據(jù)庫(kù)系統(tǒng),從而確定數(shù)據(jù)的物理分段方式[8];再如利用基于隨機(jī)神經(jīng)網(wǎng)絡(luò)的時(shí)延預(yù)測(cè)模型對(duì)時(shí)延進(jìn)行精確的預(yù)測(cè),為實(shí)施網(wǎng)絡(luò)擁塞控制、路由選擇提供重要的依據(jù)[9]。3、SkyLine分析算法的基本概述及應(yīng)用分析近年來(lái),流數(shù)據(jù)挖掘與管理成為學(xué)術(shù)界和工業(yè)界所共同關(guān)注的問(wèn)題,并且隨著信息技術(shù)的不斷發(fā)展和應(yīng)用的不斷深入,數(shù)據(jù)收集手段越來(lái)越豐富,海量存儲(chǔ)也越來(lái)越普遍
8、。由此,一種新的操作算子--skyline操作被引入了數(shù)據(jù)庫(kù)領(lǐng)域,目的是要發(fā)現(xiàn)數(shù)據(jù)集中不被其他點(diǎn)支配的所有點(diǎn)的集合[10]。隨著skyline計(jì)算在多標(biāo)準(zhǔn)決策系統(tǒng)、城市導(dǎo)航系統(tǒng)、數(shù)據(jù)挖掘和可視化、智能防御系統(tǒng)、以及地理信息系統(tǒng)等領(lǐng)域的廣泛應(yīng)用,有效地在數(shù)據(jù)流上實(shí)現(xiàn)skyline計(jì)算成為數(shù)據(jù)挖掘領(lǐng)域的研究熱點(diǎn)。一個(gè)多維數(shù)據(jù)庫(kù)的skyline,是該數(shù)據(jù)庫(kù)上不被其它任何數(shù)據(jù)點(diǎn)支配(dominate)的點(diǎn)所組成的集合。數(shù)據(jù)點(diǎn)p支配點(diǎn)q,當(dāng)且僅當(dāng)p在任一維上的取值