資源描述:
《基于顏色特征的圖像檢索系統(tǒng)設計論文》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、基于顏色特征的圖像檢索系統(tǒng)設計畢業(yè)論文目錄摘要IAbstractII1緒論11.1課題背景及涉及問題11.2圖像檢索主要應用21.3研究現(xiàn)狀21.4相關反饋技術31.5性能評價32基于顏色的圖像檢索52.1RGB顏色空間和HSV顏色空間52.2RGB顏色模型52.3HSV顏色模型62.4從RGB到HSV的轉換72.5顏色特征、特征提取和特征表達72.6圖像的相似性度量92.6.1直方圖相交法92.6.2絕對值距離法92.6.3卡方距離法92.6.4歐式距離法103系統(tǒng)設計與實現(xiàn)113.1系統(tǒng)設計原則113.2系統(tǒng)運行平臺和開發(fā)工具選擇113.3系統(tǒng)框架113.4數(shù)據(jù)
2、管理123.5圖像入庫及特征入庫123.6其他功能擴展和介紹12594GUI界面設計及功能實現(xiàn)144.1開始界面144.2檢索主界面164.3Toolbar164.4菜單欄164.5GUI編程難點164.5.1多窗口之間的數(shù)據(jù)傳遞164.5.2制作表格184.5.3為檢索系統(tǒng)添加判斷功能205檢索結果與性能比較215.1顏色矩提取顏色特征215.2顏色直方圖提取顏色特征225.3不同算法對檢索結果的影響235.3.1結果分析246全文總結與展望266.1全文總結266.2展望26致謝28參考文獻29附錄A30特征庫提取程序30檢索程序35算法程序36附錄B381緒論
3、1.1課題背景及涉及問題從20世紀70年代開始,有關圖像檢索的研究已經(jīng)開始,當時主要是基于文本的圖像檢索(TBIR),主要在數(shù)據(jù)庫領域中進行研究,它手下對圖像用文本進59行注解(關鍵字),然后用基于文本的數(shù)據(jù)庫管理系統(tǒng)(DBMS)來進行圖像關鍵字檢索。TBIR沿用了傳統(tǒng)文本檢索技術,回避了對圖像可視化元素的分析,而是從圖像名稱、圖像尺寸、壓縮類型、作者、年代等方面標引圖像,一般以關鍵字形式的提問查詢圖像,圖像所在的頁面的主題、圖像的文件名稱、與圖像密切環(huán)繞的文字內容、圖像的連接地址都被用作圖像分析的依據(jù),根據(jù)這些文本分析的結果推斷其中圖像的特征。或者根據(jù)等級目錄的形
4、式瀏覽查找特定類目下的圖像,如GettyAAT使用近133000個術語來描述藝術、藝術史、建筑以及其他文化方面的對象,并推出30多個等級目錄,從7個方面描述圖像的概念、物理屬性、類型和刊號等。在數(shù)字圖像數(shù)字化之前,檔案管理者、圖書管理員都是采用這種方式組織和管理圖像。到90年代后,多媒體信息迅速膨脹,全世界的數(shù)字圖像的容量以驚人的速度增長,這些圖像分布在世界各地,它們都是無序、無索引的。由于人工標注具有主觀性和不確定性,基于文本的圖像檢索在圖像的數(shù)據(jù)量非常大的時候存在很大困難:l手工對圖像進行注釋所需的工作量太大;l許多圖像很難用文字的方式進行描述;l不同的人對同一
5、幅圖像的理解不一樣,即使是同一個人,在不同的時間對同一幅圖像的理解也不一定相同。l由于世界上存在許多的語種,采用不同的語言文字對圖像進行描敘而建立的索引在應用中造成一定的障礙。基于文本方式的圖像檢索存在很大的局限性,圖像中包含大量有用的信息無法被有效的訪問和利用,在這樣的環(huán)境下尋找資料是非常耗時的,因此人們提出了一中新的對圖像內容語義的檢索技術——基于圖像內容的檢索技術CBIR,它不需要用戶的參與,而利用圖像自身的特征,如顏色、紋理、形狀等特征來進行檢索,具有較強的客觀性。591.2圖像檢索主要應用基于內容的圖像檢索不但減少了在人力方面的資源消耗,而且提高了檢索的精
6、度和效率。它可以應用在生活中的方方面面:如各種圖書資源的管理、醫(yī)學上的應用、工程制圖、時裝設計、數(shù)字圖書館、天氣預報、犯罪的預防以及犯罪記錄調查、可視化安全系統(tǒng)的構建、交互式電視及其他眾多的方面得到廣闊的應用。1.3研究現(xiàn)狀基于內容的圖像檢索技術是當前研究的熱點,許多著名雜志如IEEETrans.OnPAM1、IEEETrans.OnImageprocessing等紛紛設專刊介紹該領域研究的最新成果,著名的國際會議如:IEEEconferenceofCVPR、ACMconferenceonmultimedia等紛紛設專題交流最新的研究成果。各大研究機構和公司相繼退出
7、了他們的系統(tǒng):lIBM的QBIC系統(tǒng)IBM的QBIC是第一個商業(yè)化的基于內容的圖像檢索系統(tǒng),他的熊結構包括圖像入庫、特征計算、查詢階段三部分,允許使用例子圖像、用戶構建的草圖和圖畫、選擇的顏色和紋理模式、鏡頭和目標運動和其他圖形信息等,對大型圖像和視頻數(shù)據(jù)庫進行查詢。它的系統(tǒng)框架和結構對后來的圖像檢索系統(tǒng)具有深遠的影響。l新加坡大學和MIT媒體實驗室的photobook系統(tǒng)該系統(tǒng)是用于交互式瀏覽和搜索圖像庫的工具。圖像在裝入是按形狀、紋理和人臉的面部外形三種特征自動分類,同時還能結合文本關鍵字進行查詢,圖像根據(jù)類別通過顯著語義特征壓縮編碼。lVirage公司的V