資源描述:
《綜述:雙目立體視覺與BP神經(jīng)網(wǎng)絡(luò).doc》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、1引言22傳統(tǒng)的立體視覺算法及視覺系統(tǒng)標(biāo)定22.1傳統(tǒng)的立體視覺算法22.2傳統(tǒng)的攝像機(jī)標(biāo)定33基于BP神經(jīng)網(wǎng)絡(luò)的攝像機(jī)標(biāo)定43.1BP神經(jīng)網(wǎng)絡(luò)43.2改進(jìn)的BP算法53.3基于BP網(wǎng)絡(luò)的攝像機(jī)標(biāo)定過程64仿真實(shí)驗(yàn)設(shè)計(jì)75實(shí)驗(yàn)結(jié)果與分析71引言隨著現(xiàn)代計(jì)算機(jī)技術(shù)的快速發(fā)展,計(jì)算機(jī)在工程領(lǐng)域得到了廣泛的應(yīng)用。計(jì)算機(jī)視覺作為其中的一個(gè)分支,在車身檢測(cè)、機(jī)器人視覺導(dǎo)航、三維重建等領(lǐng)域得到廣泛的應(yīng)用。計(jì)算機(jī)視覺的中心任務(wù)就是利用人工視覺系統(tǒng)對(duì)三維場(chǎng)景進(jìn)行描述和識(shí)別。所謂的描述是指丟棄深度信息,將三維場(chǎng)景生成二維圖像;而所謂的識(shí)別則是指由若干幅二維圖像恢復(fù)深度輪廓等三維信息。在此之前,
2、所要解決的關(guān)鍵問題就是確定真實(shí)場(chǎng)景中的三維點(diǎn)與所描述對(duì)應(yīng)的二維點(diǎn)之間的對(duì)應(yīng)關(guān)系。這種關(guān)系是由攝像機(jī)成像幾何模型決定的,而確定這種對(duì)應(yīng)關(guān)系的過程就是所謂的攝像機(jī)標(biāo)定。傳統(tǒng)的攝像機(jī)標(biāo)定方法主要是通過預(yù)先建立或假設(shè)一定的攝像機(jī)模型,然后標(biāo)定出攝像機(jī)的內(nèi)外參數(shù)。從計(jì)算的角度考慮,傳統(tǒng)的攝像機(jī)標(biāo)定可分為線性法、非線性優(yōu)化法、兩步法以及自標(biāo)定法。這些方法大都建立在一定的幾何模型之上,一種方法只針對(duì)某一種CCD模型,因而缺乏一定通用性。并且大都需要建立復(fù)雜的數(shù)學(xué)模型,增加了系統(tǒng)的復(fù)雜性。而且在許多場(chǎng)合,求解攝像機(jī)的內(nèi)外參數(shù)并不是標(biāo)定的最終目的,而是用這些參數(shù)來描述二維圖像點(diǎn)和三維空間點(diǎn)之間
3、的非線性的關(guān)系。針對(duì)這些問題,提出了一種基于BP神經(jīng)網(wǎng)絡(luò)的視覺系統(tǒng)標(biāo)定方法,利用人工神經(jīng)網(wǎng)絡(luò)潛在的非線性映射能力來隱性的標(biāo)定攝像機(jī)內(nèi)外參數(shù)。通過學(xué)習(xí)二維圖像點(diǎn)和三維空間點(diǎn)之間的非線性的關(guān)系,使系統(tǒng)不通過建立復(fù)雜的攝像機(jī)數(shù)學(xué)模型,即可完成攝像機(jī)標(biāo)定,為視覺系統(tǒng)的后續(xù)任務(wù)奠定基礎(chǔ)。2傳統(tǒng)的立體視覺算法及視覺系統(tǒng)標(biāo)定2.1傳統(tǒng)的立體視覺算法設(shè)在立體視覺中,左右兩個(gè)相機(jī)的C矩陣分別為:Cl,Cr,空間一點(diǎn)Pi在世界坐標(biāo)系中的坐標(biāo)為(xi,yi,zi),在左右圖像上的坐標(biāo)分別為:(uil,vil)和(uir,vir),則有:(1)(2)(3)式子中:在(1)和(2)中,可,得到以分別消
4、去tl和tr,得到4個(gè)關(guān)于(uil,vil,uir,vir)和Cl,Cr,時(shí),即可通過(3)式求的Pi點(diǎn)的空間坐標(biāo)(xi,yi,zi),這就是立體視覺求解三維坐標(biāo)的傳統(tǒng)方法。2.2傳統(tǒng)的攝像機(jī)標(biāo)定攝像機(jī)標(biāo)定過程就是確定攝像機(jī)的內(nèi)部幾何與光學(xué)參數(shù)和攝像機(jī)坐標(biāo)系與世界坐標(biāo)系之間的相對(duì)位置和方向的過程。在雙目立體視覺中,還要確定兩個(gè)攝像機(jī)之間的相對(duì)位置和方向。以典型攝像機(jī)針孔模型為例,參考系F中的點(diǎn)P(x,y,z)與對(duì)應(yīng)圖像點(diǎn)(u,v)間坐標(biāo)關(guān)系為。其展開式為:(4)根據(jù)式(1),給定足夠的點(diǎn)P和對(duì)應(yīng)的圖像點(diǎn)P’,就可以唯一確定關(guān)系矩陣C。當(dāng)兩個(gè)攝像機(jī)與同一指定坐標(biāo)系F之間建立了這
5、種關(guān)系,則任何一可觀測(cè)點(diǎn)P在F下的三維坐標(biāo)可根據(jù)其在兩個(gè)圖像上的投影坐標(biāo)(u,v),通過對(duì)C矩陣的數(shù)學(xué)處理計(jì)算出來。但是攝像機(jī)并不是一個(gè)理想的針孔透視模型,在很多情況下這種線性模型并不能準(zhǔn)確描述攝像機(jī)成像的幾何關(guān)系?;趲缀文P偷膫鹘y(tǒng)的雙目視覺標(biāo)定方法,因存在光電響應(yīng)、電子噪聲與鏡頭畸變等非線性干擾因素,難以建立精確的標(biāo)定模型。只有考慮非線性畸變補(bǔ)償后的非線性模型才能較為準(zhǔn)確的描述透視模型。在具體應(yīng)用中,需根據(jù)使用場(chǎng)合和要求達(dá)到的精度,建立不同的攝像機(jī)模型。而且所建模型越接近攝像機(jī)的實(shí)際,模型就越復(fù)雜,求解的難度也越大。攝像機(jī)非線性模型的求解方法可以分為非線性搜索法、線性與非
6、線性相結(jié)合的方法。這些模型的計(jì)算量都非常大,速度較慢,并且很可能造成算法不收斂。因此,有必要尋找一種新的途徑來表達(dá)透視模型的復(fù)雜非線性映射關(guān)系,即人工神經(jīng)元網(wǎng)絡(luò)的方法來解決這一問題。由于網(wǎng)絡(luò)有相連的非線性單元組成,因此具有學(xué)習(xí)非線性成像過程的潛在能力。3基于BP神經(jīng)網(wǎng)絡(luò)的攝像機(jī)標(biāo)定神經(jīng)網(wǎng)絡(luò)是利用神經(jīng)元等效模型對(duì)人腦神經(jīng)系統(tǒng)進(jìn)行數(shù)學(xué)模擬,其目的是學(xué)習(xí)和模仿人腦的信息處理能力。其相關(guān)研究可以追溯到20世紀(jì)中期。到20世紀(jì)80年代初,D.Werbos,D.Rumelhart,和D.Parker三人各自獨(dú)立發(fā)明了反向傳播算法(Back-Propagation,BP)使得多層前饋神經(jīng)網(wǎng)
7、絡(luò)的實(shí)現(xiàn)成為可能,并導(dǎo)致80年代末90年代初人們對(duì)神經(jīng)網(wǎng)絡(luò)的深入研究和廣泛應(yīng)用。目前,人們?cè)趹?yīng)用神經(jīng)網(wǎng)絡(luò)來解決實(shí)際問題時(shí),90%左右均采用BP網(wǎng)絡(luò)及其變化形式,這體現(xiàn)了BP網(wǎng)絡(luò)是前向網(wǎng)絡(luò)的核心部分,代表著人工神經(jīng)網(wǎng)絡(luò)的精華。3.1BP神經(jīng)網(wǎng)絡(luò)一個(gè)典型的三層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如圖1所示。自左至右分別為輸入層、隱含層和輸出層。網(wǎng)絡(luò)中相鄰層采用全互聯(lián)方式連接,同層神經(jīng)元之間沒有任何連接,輸出和輸入層之間也沒有任何連接。此處假設(shè)輸入層、隱含層,輸出層的神經(jīng)元個(gè)數(shù)分別為L(zhǎng)、M、N。令從第層神經(jīng)元到層神經(jīng)元的連接權(quán)