資源描述:
《圖像匹配算法研究之sift算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、圖像匹配算法研究之sift算法SIFT算法由D.G丄owe1999年提出,2004年完善總結(jié),論文發(fā)表在2004年的UCV上,主要用于提取具有圖像旋轉(zhuǎn)不變性和伸縮不變性的特征點(diǎn)。這項(xiàng)技術(shù)可以推廣到圖像識(shí)別、圖像拼接以及圖像恢復(fù)等。DavidG.Lowe,HDistinctiveimagefeaturesfromscale-iinvariantkeypoints,MInternationalJournalofComputerVision,60,2(2004),pp.91-110論文詳細(xì)地址:lowesi
2、ft算法算法主要分為4個(gè)步驟:?scale-spaceextremadetection-尺度空間上的極值檢測(cè)?keypointlocalization-關(guān)鍵點(diǎn)的定位?orientationassignment一為關(guān)鍵點(diǎn)標(biāo)定方向?keypointdescriptor-提取特征點(diǎn)描述符$1?尺度空間上的極值檢測(cè)在介紹這一部分的時(shí)候,先引入幾個(gè)概念:?降采樣:對(duì)于一幅圖像而言的降采樣就是每隔兒行、兒列得到取一點(diǎn),組成一個(gè)新的圖像。以比例因了為2的降采樣來(lái)說(shuō):就是対一幅圖像每隔一行一列取一點(diǎn)。?升采樣:其實(shí)一
3、種插值,就是在一幅圖像里利用和關(guān)的插值運(yùn)算得到一幅大的圖像!比如比例因了為2的升采樣就是每個(gè)相鄰像素點(diǎn)種插值出一個(gè)像素(這里包扌舌X、Y兩個(gè)方向),最常用的插值方法有線性插值等。?圖像金字塔:由一個(gè)原始圖像經(jīng)過(guò)降采樣得到一幅圖像,再對(duì)新的圖像做降采樣,重復(fù)多次構(gòu)成的一組集合。以采樣因了2為例說(shuō)明,如果形象的把這些圖像摞起來(lái)就想一個(gè)金字塔,每次Z間長(zhǎng)和寬大小恰好為2倍關(guān)系,故此得名。?高斯卷積:就是權(quán)函數(shù)為高斯函數(shù)的模板進(jìn)行卷積運(yùn)算。通常做高斯卷積后的圖像會(huì)比原圖像平滑但也會(huì)模糊,所以乂稱高斯模糊!?高
4、斯金字塔:高斯金字塔里有兩個(gè)概念:組(Octave)和層(Level或Interval),每組里有若干層!高斯金字塔的構(gòu)造是這樣的,第一組的第一層為原圖像,然后將圖像做一次高斯平滑(高斯卷積、高斯模糊)高斯平滑里有一個(gè)參數(shù)&,在SIFT里作者取1.6o然后將6乘一個(gè)比例系數(shù)k作為新的平滑因了來(lái)平滑第一組第二層得到第三層,重復(fù)若干次,得到L層(L一般取5)他們分別對(duì)應(yīng)的平滑參數(shù)為:0,6,k6,k26,k36o然后將最后一幅圖像做比例因子為2的降采樣得到第二組的第一層,然后對(duì)第二組的第一層做參數(shù)是6的高
5、斯平滑,對(duì)第二層做k6的平滑得到第三層??…這里一定注意:每組對(duì)應(yīng)的平滑因了6是一樣的,而不是像有的資料上說(shuō)的持續(xù)遞增。這樣反復(fù)形成了O組L層的高斯金字塔。一般模糊的高斯模板長(zhǎng)寬都約為66(這里&為當(dāng)次的平滑因子,就是可能是k6,k25..)?DoG(DifferenceofGaussian)金字塔:是由高斯金字塔構(gòu)造出來(lái)的,他的第一組第一層是由高斯金字塔的第一組第二層減第一組第一層,他的第一組第二層是由高斯金字塔的第一組第三層減第一組第二層得到。每組都這樣就生成了一個(gè)DoG金字塔。順便說(shuō)一下,DoG
6、金字塔每組圖像幾乎都是一片黑,但仔細(xì)看你能看出輪廓的。最后關(guān)于金字塔具體處理的說(shuō)明:1)在SIFT里高斯金字塔的第一組第一層通常是由一個(gè)原圖像長(zhǎng)寬擴(kuò)大一倍開(kāi)始的,這樣做是為了可以得到更多的特征點(diǎn);2)大家可以發(fā)現(xiàn)如果用每組5層的高斯金字塔構(gòu)造一個(gè)DoG金字塔的的話,DoG的每組的層數(shù)是4;3)對(duì)于DoG金字塔,特征點(diǎn)的搜索從每組的二層到倒數(shù)第二層的(后面說(shuō)明為什么),所以如果DoG金字塔有效層數(shù)目為n的話,那么DoG金字塔應(yīng)該有n+2層,那么對(duì)應(yīng)的高斯金字塔應(yīng)該有n+3層;4)高斯金字塔從第二組開(kāi)始的
7、每組第一層是由上一組的倒數(shù)笫二層降采樣得到的,如下所示。講了這么多概念,現(xiàn)在止式開(kāi)始講解如何在尺度空間里尋找特征點(diǎn)啦。由于圖像進(jìn)行伸縮等變換后尺度空間發(fā)生變化,所以為了方便找出匹配點(diǎn),需要將圖像在不同的尺度空間里進(jìn)行平滑,并相減得到更多的邊緣等高頻信息(特征點(diǎn)的集中域)。高斯平滑并計(jì)算dog金字塔利用下面的3個(gè)計(jì)算公式:至于為什么用DOG算子來(lái)捉取額特征點(diǎn),而不是hessian或者其他角點(diǎn)方法比如Harris,是因?yàn)镸ikolajczyk(2002)發(fā)現(xiàn)通過(guò)計(jì)算出來(lái)的局部區(qū)域極大值和極小值與上述幾種角
8、點(diǎn)相比能產(chǎn)生更加穩(wěn)定的特征點(diǎn)。但是上而的公式和DOG又冇素描關(guān)系呢?看下而的公式就知道了:進(jìn)一步得到二》兩者Z間只是相差了(k?1)62倍而已,不影響特征點(diǎn)的尋找。還有一點(diǎn)需要說(shuō)明的是,這里不同的&就是代表不同的尺度,0(本身),6,k6,等等…&的值越大,意味著尺度空間越大。具體該怎么理解尺度這個(gè)概念呢,就是需要描述的像素灰度分布越廣,尺度越廣,也就是說(shuō)越模糊的圖像尺度也越大。舉個(gè)例子,有兩個(gè)灰度值分別為0和1,模糊后變?yōu)?.4和0.6,要表示這兩個(gè)灰