資源描述:
《一種基于改進(jìn)dtw算法動(dòng)態(tài)手勢(shì)識(shí)別方法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、一種基于改進(jìn)DTW算法動(dòng)態(tài)手勢(shì)識(shí)別方法摘要:結(jié)合Kinect傳感器提出了一種基于改進(jìn)的DTW算法的動(dòng)態(tài)手勢(shì)識(shí)別方法。首先,通過SDK對(duì)Kinect傳感器獲得的深度信息進(jìn)行分析,獲得人體骨骼點(diǎn)3D位置,選取其中4個(gè)點(diǎn)作為手部運(yùn)動(dòng)特征;然后,用加權(quán)距離和全局路徑限制的方法對(duì)傳統(tǒng)的DTW算法進(jìn)行改進(jìn);最后,用改進(jìn)的DTW算法進(jìn)行模板訓(xùn)練和實(shí)現(xiàn)動(dòng)態(tài)手勢(shì)的識(shí)別。實(shí)驗(yàn)表明:該方法能很好地實(shí)現(xiàn)動(dòng)態(tài)手勢(shì)的識(shí)別,實(shí)時(shí)性好,在背景干擾和光照方面有較強(qiáng)的魯棒性,較傳統(tǒng)的DTW算法在識(shí)別速度和識(shí)別正確率方面有所提高。關(guān)鍵詞:動(dòng)態(tài)手勢(shì)識(shí)別;Kinect傳感器;改
2、進(jìn)的DTW算法中國分類號(hào):TP391-4文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):10053824(2013)030021050引言手勢(shì)識(shí)別是人機(jī)交互中的一種重要手段[12],動(dòng)態(tài)手勢(shì)具有直觀性和自然性等特點(diǎn),一直是國內(nèi)外研究的重點(diǎn)。BrittaBaue等人[3]利用單攝像頭獲取圖像信息并利用KMeans算法自組織聚類基元,基于HMM模型訓(xùn)練和實(shí)時(shí)識(shí)別手語;Zhang等人[4]提出使用HMM算法來進(jìn)行中文手語視頻檢索;S訂anom等人[5]提出了根據(jù)手勢(shì)運(yùn)動(dòng)分析識(shí)別泰文字母的方法。然而,以上基于視覺的動(dòng)態(tài)手勢(shì)的識(shí)別容易受到光照、復(fù)雜背景和算法復(fù)雜度等因素
3、的影響,識(shí)別率和實(shí)時(shí)性受到限制。本文采用微軟的Kinect傳感器替換普通攝像頭,獲取深度數(shù)據(jù),對(duì)深度數(shù)據(jù)進(jìn)行動(dòng)態(tài)手勢(shì)分割,再用一種改進(jìn)的DTW算法進(jìn)行動(dòng)態(tài)手勢(shì)識(shí)別,克服了光照和復(fù)雜背景的干擾,降低了算法的復(fù)雜度,有效地提高了動(dòng)態(tài)手勢(shì)識(shí)別的穩(wěn)定性和實(shí)時(shí)性。IKinect傳感器獲取特征1.IKinect傳感器簡介Kinect是微軟為其Xbox360游戲主機(jī)和Windows平臺(tái)PC打造的一款運(yùn)動(dòng)感知輸入設(shè)備,作為一款體感外設(shè),它實(shí)際上是一個(gè)采用全新空間定位技術(shù)(lightcoding)的3D體感攝像頭[6]oKinect一共有3個(gè)攝像頭,中間
4、一個(gè)是RGB攝像頭,用來捕獲640X480的彩色圖像,每秒最多獲取30幀圖像;兩邊的是2個(gè)深度傳感器,左邊是紅外線發(fā)射器,右邊是紅外線接收器,用來檢測玩家的相對(duì)位置。1.2特征提取用Kinect傳感器獲得骨骼點(diǎn)的位置[7],用KinectforwindowsSDK實(shí)時(shí)追蹤人體全身的20個(gè)3維骨骼點(diǎn)坐標(biāo),如圖1所示。該3D坐標(biāo)信息不易受到背景、燈光、攝像頭以及人體膚色等因素的影響。選擇20個(gè)骨骼點(diǎn)中4個(gè)點(diǎn)作為特征處理,分別為左手、右手、左肩和右肩。圖120個(gè)骨骼點(diǎn)示意圖注:1.右腳;2?左腳;3?右腳踝;4?左腳踝;5?右膝蓋;6?左膝蓋
5、;7?右髓;8?左髓;9?骯部中心;10.脊柱;11?肩膀中心;12?頭部;13?右手;14?左手;15?右手腕;16?左手腕;17?右肘部;18?左肘部;19?右肩;20.左肩一個(gè)特征向量可以表示為Fn二(xl,yl,zl,x2,y2,z2,???,x4,y4,z4)其中,n為tn時(shí)刻的骨骼索引(一個(gè)手勢(shì)序列包含n個(gè)這樣的特征向量)。骨骼點(diǎn)左右手的運(yùn)動(dòng)代表了手部的運(yùn)動(dòng),左肩右肩的運(yùn)動(dòng)相對(duì)較小,其位置可以用基準(zhǔn)點(diǎn)來計(jì)取左肩和右肩的中心點(diǎn)為基準(zhǔn)點(diǎn),表示為A(xa,ya,za)=12(x3+x4,y3+y4,z3+z4),(1)得到基準(zhǔn)點(diǎn)后
6、,我們可以對(duì)特征向量進(jìn)行歸一化,定義0后=O-A
7、L-R
8、,(2)式(2)中:A為計(jì)算出的基準(zhǔn)點(diǎn)在原有坐標(biāo)系對(duì)應(yīng)的向量;0為歸一化前骨骼點(diǎn)對(duì)應(yīng)的向量;0后為歸一化后骨骼點(diǎn)對(duì)應(yīng)的向量;L為左肩對(duì)應(yīng)的向量;R為右肩對(duì)應(yīng)的向量。這樣,我們就可以將原有的人體化坐標(biāo)系轉(zhuǎn)換到以雙肩中心點(diǎn)為原點(diǎn)的雙手坐標(biāo)系。消除人體的尺寸和離攝像頭距離的遠(yuǎn)近對(duì)特征向量引起的變化。2DTW算法識(shí)別DTW是把時(shí)間規(guī)整和距離測度計(jì)算結(jié)合起來的一種非線性規(guī)整技術(shù),能夠?qū)τ腥只蚓植繑U(kuò)展、壓縮或者變形的模式完成匹配過程[8]。DTW算法就是在2個(gè)模式,即測試模式和參考模式的特
9、征信號(hào)之間建立一條科學(xué)的時(shí)間校準(zhǔn)匹配路徑。我們?cè)O(shè)R二(rl,r2,r3,…,rn)為手勢(shì)測試序列,T=(tl,t2,t3,…,tm)為手勢(shì)模板序列,n,m都是手勢(shì)幀的時(shí)序標(biāo)號(hào),通過非線性映射匹配時(shí)間序列,因此一個(gè)映射可以用一系列有序元素表示:(il,jl),(i2,j2),(i3,j3),…,(if,jf),元素(i,j)表示測試序列R第i幀的特征向量與模板序列T第j幀的特征向量之間的映射,f映射個(gè)數(shù)定義d(i,j)為r(i)與t(j)之間的距離,則一個(gè)映射R和T的總開銷D可以表示為D=Zfk=ld(ik,jk)o(3)一個(gè)映射也可以描
10、述為在一個(gè)2維網(wǎng)格上的一條路徑,用參考模板序列r(i)作為橫坐標(biāo)i軸,測試模式序列t(j)作為縱坐標(biāo)j軸,建立直角坐標(biāo)系如圖2所示。網(wǎng)格中的每個(gè)節(jié)點(diǎn)(i,j)—交叉點(diǎn),表示r(i)與t(j)的映射。在這個(gè)2