資源描述:
《歐幾里得距離.doc》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在教育資源-天天文庫。
1、歐幾里德空間和距離歐幾里德空間(EuclideanSpace),簡稱為歐氏空間,在數(shù)學中是對歐幾里德所研究的二維和三維空間的一般化。所謂一般化就是把歐幾里德對于距離、以及相關的概念如長度和角度等轉換成任意數(shù)維的坐標系。歐幾里德距離(EuclideanDistance)TheEuclideandistancebetweenpointsandinEuclideann-space,isdefinedas:.設xn和yn分別是n維度量空間中的點,則其歐幾里德距離定義為:d(x,y)=(∑(xi-yi)2)1/2當n=2時,則為平面上兩點的距離,當n=3
2、時,則為三維空間中兩點的距離。2.2.1區(qū)間標度變量區(qū)間標度變量是一個粗略線性標度的連續(xù)變量。用來計算相異度d(i,j),其距離度量包括歐幾里德距離,曼哈坦距離和明考斯基距離。首先實現(xiàn)數(shù)據(jù)的標準化,給定一個變量f的度量值,可以進行一下轉化:(1)計算平均的絕對偏差Sf:Sf=(
3、x1f-mf
4、+
5、x2f-mf
6、+……+
7、xnf-mf
8、)/n這里x1f,……,xnf是f的n個度量值,mf是f的平均值。(2)計算標準化的度量值:Zif=(xif-mf)/sf我們知道對象之間的相異度是基于對象間的距離來計算的。最常用的度量方法是歐幾里德距離,形式如下
9、:d(i,j)=(
10、xi1-xj1
11、2+
12、xi2-xj2
13、2+……+
14、xip-xjp
15、2)1/2這里i=(xi1,xi2,……,xip)和j=(xj1,xj2,……,xjp)是兩個p維的數(shù)據(jù)對象。曼哈坦距離的公式如下:d(i,j)=
16、xi1-xj1
17、+
18、xi2-xj2
19、+……
20、xip-xjp
21、上面的兩個公式必須滿足下面的條件:d(i,j)≧0:距離非負。d(i,i)=0:對象與自身的距離為0。d(i,j)=d(j,i):距離函數(shù)具有對稱性。d(i,j)≦d(i,h)+d(h,j):對象i到對象j的距離小于等于途經(jīng)其他任何對象h的距離之和。明考斯
22、基距離是以上兩中距離計算公式的概括,其具體的公式如下:d(i,j)=(
23、xi1-xj1
24、q+
25、xi2-xj2
26、q+……+
27、xip-xjp
28、q)1/q當q=1時該公式就是歐幾里得距離公式;當q=2時,是曼哈坦距離公式。2.2.2二元變量二元變量只有0、1兩個狀態(tài),0表示變量為空,1表示該變量存在。對象j10Sum對象i1qrq+r0sts+tSumq+sr+tpp=q+r+s+t。二元變量中基于對稱的二元變量的相似度稱為恒定相似度,這里有最著名的簡單匹配系數(shù)來評價兩個對象之間的相似度,其定義如下:d(i,j)=(r+s)/(q+r+s+t)基于不
29、對稱的二元變量的相似度稱為非恒定相似度,最著名的評價系數(shù)是Jaccard系數(shù),形式如下:d(i,j)=(r+s)/(q+r+s)這里負匹配的數(shù)目t被認為是不重要的,所以省略。