資源描述:
《基于視覺(jué)感知的影像質(zhì)量評(píng)價(jià)方法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、西安電子科技大學(xué)博士學(xué)位論文基于視覺(jué)感知的影像質(zhì)量評(píng)價(jià)方法研究姓名:路文申請(qǐng)學(xué)位級(jí)別:博士專(zhuān)業(yè):模式識(shí)別與智能系統(tǒng)指導(dǎo)教師:高新波20090401摘要影像質(zhì)量評(píng)價(jià)旨在尋找精確的計(jì)算模型來(lái)預(yù)測(cè)影像視覺(jué)質(zhì)量的變化。影像是利用各種觀測(cè)系統(tǒng)以不同形式刻畫(huà)客觀世界而獲得的視覺(jué)實(shí)體。它相對(duì)于文字和圖形所承載的信息更真切、更豐富,正所謂“百聞不如一見(jiàn)”。由于影像數(shù)據(jù)在采集、壓縮、處理、傳輸和恢復(fù)的過(guò)程中可能會(huì)引入各種失真,這些失真會(huì)對(duì)后續(xù)的影像處理、分析和理解帶來(lái)困難,不利于人們正確的認(rèn)識(shí)客觀世界。因此,需要通過(guò)度量影像的視覺(jué)失真程度,來(lái)設(shè)計(jì)方法和優(yōu)化系統(tǒng),以最少的代價(jià)提供最好的視覺(jué)質(zhì)量。本文針對(duì)影像質(zhì)量
2、評(píng)價(jià)的基本問(wèn)題,探索人類(lèi)視覺(jué)系統(tǒng)和數(shù)字信息之間的聯(lián)系,在圖像稀疏表示和特征建模的基礎(chǔ)上,為影像處理中由未知因素造成的各種失真構(gòu)建客觀評(píng)價(jià)方法,以度量影像的失真程度和提供信息的能力,從而為視覺(jué)質(zhì)量評(píng)價(jià)提供合理依據(jù)。主要工作概括如下:(1)針對(duì)人類(lèi)視覺(jué)系統(tǒng)的生理學(xué)和心理學(xué)特性,結(jié)合基于仿生學(xué)的誤差可見(jiàn)度模型,從圖像的基本結(jié)構(gòu)和幾何特征出發(fā),利用原始圖像和待測(cè)圖像的結(jié)構(gòu)差異和幾何相似來(lái)度量視覺(jué)質(zhì)量的變化。提出了基于人類(lèi)視覺(jué)系統(tǒng)的全參考型圖像質(zhì)量評(píng)價(jià)測(cè)度。實(shí)驗(yàn)結(jié)果表明,本方法不僅與視覺(jué)感知有較好的一致性,而且算法復(fù)雜度很低,取得了預(yù)期的效果。(2)在圖像特征提取和稀疏表示的基礎(chǔ)上,模擬人類(lèi)視覺(jué)系統(tǒng)的
3、多通道特性,采用多尺度幾何分析來(lái)獲取圖像的幾何特征。然后利用人類(lèi)視覺(jué)心理物理學(xué)的對(duì)比敏感度和掩模特性,對(duì)圖像的幾何特征進(jìn)行感知濾波,進(jìn)而利用該特征來(lái)捕捉由于失真而引起的視覺(jué)感知的變化。提出了基于多尺度幾何分析的部分參考型圖像質(zhì)量評(píng)價(jià)測(cè)度框架。實(shí)驗(yàn)結(jié)果表明,利用該框架的各種方法所得到的客觀評(píng)價(jià)結(jié)果與主觀觀測(cè)值之間具有很好的一致性,能準(zhǔn)確地反映人眼對(duì)圖像質(zhì)量的主觀感受。(3)在自然圖像統(tǒng)計(jì)特性的基礎(chǔ)上,布規(guī)律,采用輪廓波來(lái)刻畫(huà)圖像尺度間、利用計(jì)算模型來(lái)構(gòu)建圖像特征的一般分尺度內(nèi)、和方向間的統(tǒng)計(jì)相關(guān)性,然后對(duì)自然圖像模型在輪廓波變換域尺度間的變化進(jìn)行分析,并結(jié)合圖像模型的變化來(lái)捕獲不同程度的失真,
4、最后使用這些變化特征的非線性映射來(lái)表征圖像質(zhì)量。提出了基于輪廓波變換域的無(wú)參考型圖像質(zhì)量評(píng)價(jià)測(cè)度。該算法適用于不同的圖像失真類(lèi)型,且與視覺(jué)感知的一致性較好。(4)針對(duì)不同失真類(lèi)型的特點(diǎn),根據(jù)視覺(jué)感知與失真過(guò)程的密切關(guān)系,從人Ⅱ摘要眼對(duì)影像的敏感性和敏銳性出發(fā),結(jié)合影像的整體結(jié)構(gòu)和內(nèi)容的局部結(jié)構(gòu)進(jìn)行分析,利用影像的結(jié)構(gòu)相似性來(lái)度量視覺(jué)失真的變化。提出了基于失真模型優(yōu)化的視頻質(zhì)量評(píng)價(jià)方法。在VQEG視頻數(shù)據(jù)庫(kù)上進(jìn)行測(cè)試,獲得了較好的評(píng)價(jià)性能。(5)深入分析了VQEG視頻數(shù)據(jù)庫(kù)的優(yōu)缺點(diǎn),針對(duì)該數(shù)據(jù)庫(kù)存在的局限性和網(wǎng)絡(luò)流媒體發(fā)展的緊迫性,結(jié)合目前主流視頻壓縮標(biāo)準(zhǔn)H.264,對(duì)大量的內(nèi)容豐富的視頻序列
5、進(jìn)行各種不同量化尺度以及碼率的壓縮,并邀請(qǐng)一定數(shù)量的非專(zhuān)業(yè)人士,利用主觀排序方法和自動(dòng)評(píng)分平臺(tái)對(duì)壓縮產(chǎn)生的失真序列進(jìn)行主觀打分。完成了面向編碼失真的視頻質(zhì)量評(píng)價(jià)數(shù)據(jù)庫(kù)的構(gòu)建,為視頻質(zhì)量評(píng)價(jià)研究的深入進(jìn)行夯實(shí)了基礎(chǔ)。上述研究成果是在實(shí)際應(yīng)用中抽象出的科學(xué)問(wèn)題,涉及到影像處理的基礎(chǔ)理論,是從新的角度、基于新的條件和應(yīng)用進(jìn)行研究的,富有一定的前瞻性和挑戰(zhàn)性,具有極其重要的理論意義和應(yīng)用價(jià)值。本論文在理論上有一些突破,技術(shù)上有一定創(chuàng)新,為影像質(zhì)量評(píng)價(jià)的發(fā)展開(kāi)辟了新的思路,提供了一些有意義的參考。關(guān)鍵詞:影像質(zhì)量評(píng)價(jià)人類(lèi)視覺(jué)系統(tǒng)多尺度幾何分析圖像模型視頻數(shù)據(jù)庫(kù)輪廓波ABSTRACTnITheaimof
6、theimageandvideoqualityassessmentistofindacomputationalmodelthatCanpredicttheperceptualvisualqualityautomatically.AnimageisavisionentitythatCandescribetheobjectiveworldindifferentformsbyvariableobservationsystem.Comparedwithtextsandgraphics,theimageconveystheinformationmorevividlyandaffluently.Sinc
7、eimagesaresubjecttodistortionsduringacquisition,compression,transmission,processingandreproduction,whichwillbringdifficultiestothesubsequentprocesssuchasimageandvideoprocessing,analysisandunderstanding,Itis