資源描述:
《人眼定位算法研究與實現(xiàn).pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、第28卷第4期佛山科學(xué)技術(shù)學(xué)院學(xué)報(自然科學(xué)版)Vol.28No.42010年7月JournalofFoshanUniversity(NaturalScienceEdition)Jul.2010文章編號:1008-0171(2010)04-0030-05人眼定位算法研究與實現(xiàn)于昕梅,蔣業(yè)文(佛山科學(xué)技術(shù)學(xué)院電子信息工程系,廣東佛山528000)摘要:基于2DGabor函數(shù)與高等動物視覺皮層接受場的一致性,采用一種基于Gabor變換的眼睛定位方法:在對圖像進行規(guī)一化處理以減少光照影響的基礎(chǔ)上,利用Gabor變換后的圖像在眼睛處的幅值較大的特點,通過投影方法得到眼睛的坐標(biāo)。算法運算時間較短,結(jié)合簡
2、單有效的灰度投影分析,大大提高了定位的速度。實驗結(jié)果表明,該算法能夠精確地定位眼睛,并能克服非均勻光照、噪聲以及飾件對眼睛定位的影響,對各種臉部姿勢變化有較強的適應(yīng)性。關(guān)鍵詞:Gabor變換;眼睛定位;灰度投影中圖分類號:TP391.41文獻標(biāo)志碼:A近年來,人臉的自動識別技術(shù)在模式識別中是一個非?;钴S的研究領(lǐng)域,眼睛與人臉的其他部分相比,具有灰度變化十分明顯的特征,眼睛定位對人臉識別系統(tǒng)識別率的提高有重要的意義和影響。眼睛作為人面部上最顯著、最穩(wěn)定的特征,可以被用于幫助定位人臉,提供人的注視信息,識別人臉動作(如[1-2]表情變化)等。有資料表明,高速公路上發(fā)生的交通事故50%以上是由于長時
3、間駕駛造成疲勞或由所見目標(biāo)單調(diào)而形成注意力不集中、甚至打瞌睡等原因造成的。而駕駛員在車輛行駛過程中是否疲勞駕駛可以從眼睛的狀態(tài)反映出來,利用駕駛員眼睛的狀態(tài)信息來判斷其疲勞狀況是一種可行的方法。在車輛上安裝駕駛員疲勞監(jiān)測系統(tǒng),利用攝像頭對駕駛員的駕駛行為進行監(jiān)控,獲取駕駛員臉部的一段連續(xù)圖像,對每幅圖像中的眼睛狀態(tài)進行分析,綜合每幅圖像的數(shù)據(jù)來獲得一個眨眼周期。由于正常的眨眼頻率與疲勞狀態(tài)的眨眼頻率有著明顯的區(qū)別,從而可以判斷出該圖像序列獲取時駕駛員的精神狀態(tài),在判斷駕駛員疲勞時由系統(tǒng)適時地給出警告信號以避免事故發(fā)生。因此,準(zhǔn)確、快速獲得每幅圖像中眼睛的精確位置,是實現(xiàn)駕駛員疲勞狀態(tài)監(jiān)控的關(guān)鍵
4、。作為眼睛定位的另外一個重要應(yīng)用是人臉識別,人臉識別在司法驗證、安全監(jiān)控、智能卡、檔案管理、視頻會議、人機交互等方面有著廣泛的應(yīng)用。1基于Gabor變換的眼睛定位方法Gabor濾波器具有良好的帶通特性。如果人臉圖像的某一頻率范圍與Gabor濾波器的通頻帶吻合,則濾波器輸出的值將會很大;如果不吻合,其輸出將受到抑制。所以,可以通過選擇與眉眼區(qū)域的頻率及方向相一致的Gabor濾波器參數(shù),使濾波后在輸出的圖像中突出顯示所感興趣的眉眼區(qū)域,而其他區(qū)域信息受到抑制。已有的一些實驗表明,圖像在視覺皮層的表示存在空域和頻域分量,且可以將一幅圖像分解為局部對稱和反對稱的基函數(shù)表示。Gabor函數(shù)正是這種基信號
5、的良好近似,這是因為空域中的Gabor小波是一個被高斯函數(shù)調(diào)制的復(fù)指數(shù)函數(shù),可以模擬具有方向選擇性的單細胞的響應(yīng)特性。圖像的Gabor小收稿日期:2010-03-31基金項目:廣東省科技合作計劃資助項目(034067)作者簡介:于昕梅(1974-),女,內(nèi)蒙古赤峰人,佛山科學(xué)技術(shù)學(xué)院講師。第4期于昕梅等:人眼定位算法研究與實現(xiàn)31波變換具有聯(lián)合最優(yōu)的空域和頻域局部化特性,且對邊沿具有大的響應(yīng)。假定Rx=Ry=R,多級Gabor小波定義為122222-((xcosH+ysinH)+(-xsinH+ycosH))/2Ri(XxcosH+XysinH)-XR/27(x,y,X0000,H)=2e×[
6、e-e],(1)2PR式(1)中,x、y為像素的空間坐標(biāo),X0為頻域的徑向中心頻率,H為方向,R為高斯函數(shù)沿著x和y方向的22-X0R/2標(biāo)準(zhǔn)方差。此外,因為復(fù)指數(shù)函數(shù)的余弦分量有非零的平均值,所以Gabor小波的第二項e用于補償直流分量。一般地,眼睛頻率響應(yīng)的半幅度帶寬沿軸向大約是1~1.5倍頻程,R和X0的關(guān)系為52+1R=k/X0,且k=2ln25,(2)2-1式(2)中,5為倍頻帶寬。圖像的Gabor變換能夠通過圖像和Gabor小波的卷積獲得。用G(x,y)表示圖像,則(X,H)0C(x,y)=G(x,y)á7(x,y,X0,H),(3)7G(X0,H)式(3)中,á表示卷積運算,C(
7、x,y)是對應(yīng)于徑向中心頻率為X0、方向為H的小波的卷積結(jié)果。變化7GX0和H,可得到人臉圖像的多級多方向Gabor小波描述。由于卷積運算較慢,采用FFT和IFFT可以提高變換速度。由于圖像邊沿方向垂直于波矢量(X0cosH,X0sinH),所以Gabor小波在邊沿處有較強的響應(yīng),其實部和虛部按一個特征頻率振蕩,并不是一個光滑的峰,其響應(yīng)的幅度能作為圖像局部特征的一個測度。為了保持幅度的歸一化,將