資源描述:
《支持向量機(jī)在漢字圖象識(shí)別中的應(yīng)用研究》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、支持向量機(jī)在漢字圖象識(shí)別中的應(yīng)用研究摘要脫機(jī)手寫(xiě)體漢字識(shí)別是當(dāng)前模式識(shí)別領(lǐng)域的一個(gè)研究熱點(diǎn),理論和技術(shù)上都具有較大的研究?jī)r(jià)值。支持向量機(jī)(SW)理論是基于統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上的,它較好的解決了小樣本學(xué)習(xí)的問(wèn)題。SW算法是建立在結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理基礎(chǔ)之上發(fā)展成的一種新型結(jié)構(gòu)化學(xué)習(xí)方法,能很好的解決有限數(shù)量樣本的高維模型的構(gòu)造問(wèn)題。因此,將SVM理論運(yùn)用于脫機(jī)手寫(xiě)漢字的識(shí)別有較大的理論意義和實(shí)踐價(jià)值。本文分析比較了SVM核函數(shù)選取和參數(shù)確定在脫機(jī)手寫(xiě)體漢字識(shí)別中的應(yīng)用,主要工作內(nèi)容如下:(1)手寫(xiě)體漢字圖象的
2、預(yù)處理與特征提取。介紹了手寫(xiě)體漢字樣本圖象的灰度化,二值化,漢字圖象的濾波,漢字大小的歸一化處理。給出四種漢字圖象特征提取的方法。這四種方法樣本數(shù)據(jù)的融合可對(duì)手寫(xiě)體漢字整體與筆畫(huà)和統(tǒng)計(jì)與結(jié)構(gòu)特征的互補(bǔ)性表征,可以更好的用于小樣本集的SVM識(shí)別。(2)字符識(shí)別。提出了一種基于支持向量機(jī)的手寫(xiě)體漢字識(shí)別器。該方法可以在漢字樣本數(shù)量相對(duì)較少的情況下,通過(guò)支持向量機(jī)訓(xùn)練,最后得到較好的識(shí)別結(jié)果。(3)手寫(xiě)體漢字SVM分類(lèi)器核函數(shù)以及核參數(shù)的選取。在分析各種核函數(shù)特性基礎(chǔ)上,通過(guò)仿真實(shí)驗(yàn)比較了各種核函數(shù)在漢字識(shí)別
3、中的性能。為手寫(xiě)體漢字識(shí)別這一具體問(wèn)題的核函數(shù)選擇進(jìn)行了嘗試。選取了SCUT-IRAC手寫(xiě)體漢字樣本庫(kù)作為實(shí)驗(yàn)樣本,以MATLAB6.5和VC++6.0為仿真工具進(jìn)行了實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)結(jié)果表明:對(duì)于手寫(xiě)體漢字特征的小樣本識(shí)別問(wèn)題,用支持向量機(jī)以及核函數(shù)訓(xùn)練識(shí)別是可行的。關(guān)鍵詞:支持向量機(jī)核函數(shù)特征提取字符識(shí)別ResearchandApplicationofSupportsVectorMachineforChineseCharacterImageRecognitionAbstractChineseChara
4、ctersrecognitionisoneaspectofpatternrecognitionfield.SVM(SupportVectormachine),thetheoryofsmall—samplestatisticallearningproposedbyVapnik,isanimportantresearchdirectioninpatternrecognition.BasedontheideaofExperience硒skMinimization,itisagoodlearningmethod
5、forespeciallystudyingsmall—sampleprediction.AnewstructurallearningmethodhasbeendevelopedbySVM.Itcallwellsolvetheconstructionissueofahi曲dimensionalmodelofsmall—sampleset.ItCallgetabiggishtheorymeaningandpracticevaluethattheSVMtheoryisusedfortheoff-lineHan
6、dwrittenChineseCharactersRecognizing.Theprimarycontentsofthispaperare:(1)ChineseCharactersImagepretreatmentandfeatureextraction.Theimagegradation,binarization,filteringandsizenormalizationofmanuscriptcharacterimagesareintroducedinthispaper,thefeaturedate
7、isextractedbyfourmethods.CharactersstatisticfeatureandstrokesfeatureCallbedenotationbythefourmethodsinosculateddate.TheinosculateddateismoreusefulinSVMrecognition.(2)Charactersrecognitionmachine.ArecognitionmachineisdesignedbasedontheSVMmethod.Theeffecto
8、frecognitionissatisfiedbyusingsmallnumberofoff-linehandwrittenChineseCharacterssamples.(3).SVMclassifierkernelfunctionsofmanuscriptcharacterimagesandselectionofparameters.Onthebasisoftheanalysisofkindsofkernelfunctions,com