資源描述:
《Histograms of Oriented Gradients f or Human Detection翻譯》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、用于人體檢測的方向梯度直方圖?NavneetDalal,BillTriggs????摘要??????我們研究了視覺目標(biāo)檢測的特征集問題,并用線性SVM方法進行人體檢測來測試,通過與當(dāng)前的基于邊緣和梯度的描述子進行實驗對比,得出方向梯度直方圖(HistogramsofOrientedGradient,HOG)描述子在行人檢測方面表現(xiàn)更加突出。我們研究了計算過程中每一階段的影響,得出小尺度梯度(fine-scalegradients)、精細(xì)方向采樣(fineorientationbinning)、粗糙空域抽樣(coarsespatialbinn
2、ing)以及重疊描述子塊的局部對比度歸一化(localcontrastnormalizationinoverlappingdescriptorblocks)都對最終結(jié)果有重要作用。這種方法在最初的MIT行人數(shù)據(jù)庫上表現(xiàn)近乎完美,所以我們引入了一個更具挑戰(zhàn)性的包含1800個不同姿勢和背景的已標(biāo)注人體數(shù)據(jù)集。??1引言??????由于人體姿勢和外表的多變,在圖像中檢測人體是一項具有挑戰(zhàn)性的工作。首先需要的就是一個強壯的特征集,使得在不同光照和背景下都能清晰地分辨出人體。我們研究了人體檢測的特征集問題,局部歸一化的HOG描述子相比于現(xiàn)存的特征集(
3、包括小波[17,22])有更好的表現(xiàn)。相比于邊緣方向直方圖(EdgeOrientationHistograms[4,5])、SIFT([12])、形狀上下文(ShapeContexts[1]),HOG是在網(wǎng)格密集的大小統(tǒng)一的細(xì)胞單元(densegridofuniformlyspacedcells)上進行計算,而且為了提高性能,還采用了重疊的局部對比度歸一化(overlappinglocalcontrastnormalizations)。我們用行人檢測(人體是大部分可見的并且基本上是直立的)進行測試,為了保證速度和簡潔性,使用線性SVM作為分
4、類器。HOG檢測器在MIT的行人數(shù)據(jù)集([17,18])上表現(xiàn)相當(dāng)好,所以我們又引入了一個更具挑戰(zhàn)性的包含1800個不同姿勢和背景的已標(biāo)注人體數(shù)據(jù)集。正在進行的工作表明,我們的特征集對于其他基于形狀的目標(biāo)檢測也同樣好。???????第2節(jié)中簡要介紹了在人體檢測上前人的研究工作,第3節(jié)是HOG方法的總體介紹,第4節(jié)介紹了我們使用的數(shù)據(jù)集,第5-6節(jié)是HOG方法的詳細(xì)介紹以及不同處理階段的實驗結(jié)果,第7節(jié)是結(jié)論和總結(jié)。??2前人的研究工作??????在目標(biāo)檢測方向上有大量的文獻,這里只列舉與人體檢測有關(guān)的論文[18,17,22,16,20]。[
5、6]是一篇綜述。Papageorgiou等[18]提出了一種使用糾正哈爾小波(rectifiedHaarwavelet)作為特征的多項式SVM行人檢測方法,以及[17]中基于子窗口的改進方法。Depoortere等給出了論文[2]中方法的一個最優(yōu)化版本。Gavrila和Philomen[8]采用一種更直接的方法,提取邊緣圖并將其與樣本進行匹配,使用chamfer距離作為評判標(biāo)準(zhǔn),這種方法已被用在一個實時行人檢測系統(tǒng)中[7]。Viola等[22]提出了一種高效的運動人體檢測器,使用AdaBoost來訓(xùn)練一串漸進復(fù)雜的基于類Haar小波和時空差
6、的區(qū)域拒絕規(guī)則。Ronfard等[19]提出了一種關(guān)節(jié)式的身體檢測器,他通過將基于SVM的肢體分類器合并到動態(tài)規(guī)劃框架中的一階和二階高斯濾波來實現(xiàn),與Felzenszwalb和Huttenlocher[3],以及Ioffe和Forsyth[9]的方法相似。?Mikolajczyk等[16]提出了一種方向位置直方圖和二值梯度幅值相結(jié)合的身體部位檢測器,能夠檢測臉、頭、以及身體上部或下部的前視或側(cè)視輪廓。相比之下,我們的檢測器結(jié)構(gòu)更簡單,使用單一檢測窗口,但行人檢測的效果更好。??3算法概述??????此節(jié)是HOG特征提取方法的概述,實現(xiàn)細(xì)節(jié)在
7、第6節(jié)。此方法基于對稠密網(wǎng)格中歸一化的局部方向梯度直方圖的計算。相似的特征在過去十年中越來越多的被使用[4,5,12,15]。此類方法的基本觀點是:局部目標(biāo)的外表和形狀可以被局部梯度或邊緣方向的分布很好的描述,即使我們不知道對應(yīng)的梯度和邊緣的位置。在實際操作中,將圖像分為小的細(xì)胞單元(cells),每個細(xì)胞單元計算一個梯度方向(或邊緣方向)直方圖。為了對光照和陰影有更好的不變性,需要對直方圖進行對比度歸一化,可以通過將細(xì)胞單元組成更大的塊(blocks)并歸一化塊內(nèi)的所有細(xì)胞單元來實現(xiàn)。我們將歸一化的塊描述符叫做HOG描述子。將檢測窗口中的
8、所有塊的HOG描述子組合起來就形成了最終的特征向量,然后使用SVM分類器進行人體檢測,見圖1。?圖1??????????????圖1描述了我們的特征提取和目標(biāo)檢測流程。檢測窗口劃