資源描述:
《Histograms of Oriented Gradients f or Human Detection翻譯》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、用于人體檢測的方向梯度直方圖?NavneetDalal,BillTriggs????摘要??????我們研究了視覺目標檢測的特征集問題,并用線性SVM方法進行人體檢測來測試,通過與當前的基于邊緣和梯度的描述子進行實驗對比,得出方向梯度直方圖(HistogramsofOrientedGradient,HOG)描述子在行人檢測方面表現(xiàn)更加突出。我們研究了計算過程中每一階段的影響,得出小尺度梯度(fine-scalegradients)、精細方向采樣(fineorientationbinning)、粗糙空域抽樣(coarsespatialbinn
2、ing)以及重疊描述子塊的局部對比度歸一化(localcontrastnormalizationinoverlappingdescriptorblocks)都對最終結(jié)果有重要作用。這種方法在最初的MIT行人數(shù)據(jù)庫上表現(xiàn)近乎完美,所以我們引入了一個更具挑戰(zhàn)性的包含1800個不同姿勢和背景的已標注人體數(shù)據(jù)集。??1引言??????由于人體姿勢和外表的多變,在圖像中檢測人體是一項具有挑戰(zhàn)性的工作。首先需要的就是一個強壯的特征集,使得在不同光照和背景下都能清晰地分辨出人體。我們研究了人體檢測的特征集問題,局部歸一化的HOG描述子相比于現(xiàn)存的特征集(
3、包括小波[17,22])有更好的表現(xiàn)。相比于邊緣方向直方圖(EdgeOrientationHistograms[4,5])、SIFT([12])、形狀上下文(ShapeContexts[1]),HOG是在網(wǎng)格密集的大小統(tǒng)一的細胞單元(densegridofuniformlyspacedcells)上進行計算,而且為了提高性能,還采用了重疊的局部對比度歸一化(overlappinglocalcontrastnormalizations)。我們用行人檢測(人體是大部分可見的并且基本上是直立的)進行測試,為了保證速度和簡潔性,使用線性SVM作為分
4、類器。HOG檢測器在MIT的行人數(shù)據(jù)集([17,18])上表現(xiàn)相當好,所以我們又引入了一個更具挑戰(zhàn)性的包含1800個不同姿勢和背景的已標注人體數(shù)據(jù)集。正在進行的工作表明,我們的特征集對于其他基于形狀的目標檢測也同樣好。???????第2節(jié)中簡要介紹了在人體檢測上前人的研究工作,第3節(jié)是HOG方法的總體介紹,第4節(jié)介紹了我們使用的數(shù)據(jù)集,第5-6節(jié)是HOG方法的詳細介紹以及不同處理階段的實驗結(jié)果,第7節(jié)是結(jié)論和總結(jié)。??2前人的研究工作??????在目標檢測方向上有大量的文獻,這里只列舉與人體檢測有關(guān)的論文[18,17,22,16,20]。[
5、6]是一篇綜述。Papageorgiou等[18]提出了一種使用糾正哈爾小波(rectifiedHaarwavelet)作為特征的多項式SVM行人檢測方法,以及[17]中基于子窗口的改進方法。Depoortere等給出了論文[2]中方法的一個最優(yōu)化版本。Gavrila和Philomen[8]采用一種更直接的方法,提取邊緣圖并將其與樣本進行匹配,使用chamfer距離作為評判標準,這種方法已被用在一個實時行人檢測系統(tǒng)中[7]。Viola等[22]提出了一種高效的運動人體檢測器,使用AdaBoost來訓(xùn)練一串漸進復(fù)雜的基于類Haar小波和時空差
6、的區(qū)域拒絕規(guī)則。Ronfard等[19]提出了一種關(guān)節(jié)式的身體檢測器,他通過將基于SVM的肢體分類器合并到動態(tài)規(guī)劃框架中的一階和二階高斯濾波來實現(xiàn),與Felzenszwalb和Huttenlocher[3],以及Ioffe和Forsyth[9]的方法相似。?Mikolajczyk等[16]提出了一種方向位置直方圖和二值梯度幅值相結(jié)合的身體部位檢測器,能夠檢測臉、頭、以及身體上部或下部的前視或側(cè)視輪廓。相比之下,我們的檢測器結(jié)構(gòu)更簡單,使用單一檢測窗口,但行人檢測的效果更好。??3算法概述??????此節(jié)是HOG特征提取方法的概述,實現(xiàn)細節(jié)在
7、第6節(jié)。此方法基于對稠密網(wǎng)格中歸一化的局部方向梯度直方圖的計算。相似的特征在過去十年中越來越多的被使用[4,5,12,15]。此類方法的基本觀點是:局部目標的外表和形狀可以被局部梯度或邊緣方向的分布很好的描述,即使我們不知道對應(yīng)的梯度和邊緣的位置。在實際操作中,將圖像分為小的細胞單元(cells),每個細胞單元計算一個梯度方向(或邊緣方向)直方圖。為了對光照和陰影有更好的不變性,需要對直方圖進行對比度歸一化,可以通過將細胞單元組成更大的塊(blocks)并歸一化塊內(nèi)的所有細胞單元來實現(xiàn)。我們將歸一化的塊描述符叫做HOG描述子。將檢測窗口中的
8、所有塊的HOG描述子組合起來就形成了最終的特征向量,然后使用SVM分類器進行人體檢測,見圖1。?圖1??????????????圖1描述了我們的特征提取和目標檢測流程。檢測窗口劃