資源描述:
《基于hht語音情感識(shí)別技術(shù)的研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、國(guó)內(nèi)圖書分類號(hào):TP39學(xué)校代碼:10213國(guó)際圖書分類號(hào):681.3密級(jí):公開工學(xué)碩士學(xué)位論文基于HHT的語音情感識(shí)別技術(shù)研究碩士研究生:王振魯導(dǎo)師:李海峰教授申請(qǐng)學(xué)位:工學(xué)碩士學(xué)科:計(jì)算機(jī)科學(xué)與技術(shù)所在單位:計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院答辯日期:2012年7月授予學(xué)位單位:哈爾濱工業(yè)大學(xué)ClassifiedIndex:TP39U.D.C:681.3DissertationfortheMasterDegreeHHTBASEDSPEECHEOMOTIONRECOGNITIONTECHNIQUERESEA
2、RCHCandidate:WangZhenluSupervisor:Prof.LiHaifengAcademicDegreeAppliedfor:MasterDegreeSpeciality:ComputerScienceandTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:July,2012Degree-Conferring-Institution:HarbinInstituteofTechnolo
3、gy哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文摘要語音情感識(shí)別研究是情感計(jì)算領(lǐng)域的一個(gè)重要組成部分,近年來越來越多的研究者和研究機(jī)構(gòu)都投身于該領(lǐng)域的研究中。傳統(tǒng)的基于快速傅里葉變換方法的情感特征提取不得不進(jìn)行的一個(gè)前提操作是對(duì)語音片段進(jìn)行分幀,因?yàn)檫@樣才能滿足短時(shí)傅里葉變換的條件。本文將采用HHT方法應(yīng)用于語音情感識(shí)別研究中,該方法具有處理非線性非平穩(wěn)性信號(hào)的能力,可以將整條語料作為一個(gè)整體進(jìn)行分析,這樣就可以從傳統(tǒng)方法對(duì)語音分幀這一局限中跳出來,對(duì)整條語料進(jìn)行情感特征提取和分析。本文重點(diǎn)完成了以下幾個(gè)工作
4、:1.利用希爾伯特黃變換方法,基于希爾伯特邊際譜實(shí)現(xiàn)了一種新的用于語音情感識(shí)別的長(zhǎng)時(shí)特征提取方法,與傳統(tǒng)的基于傅里葉變換方法提取的長(zhǎng)時(shí)特征相比,該長(zhǎng)時(shí)特征在識(shí)別分類短句語料的情感特性方面具有優(yōu)勢(shì),并對(duì)影響實(shí)驗(yàn)結(jié)果的因素給出了詳細(xì)的分析。2.依據(jù)經(jīng)驗(yàn)?zāi)B(tài)分解分解結(jié)構(gòu)提出了架構(gòu)特征提取方案以及依據(jù)固有模態(tài)分量提出了成分特征提取方案,深入研究了不同情感的語料在相同級(jí)數(shù)的固有模態(tài)分量的差異,并依據(jù)這些差異設(shè)計(jì)并實(shí)現(xiàn)了實(shí)驗(yàn)方案。3.深入研究了經(jīng)驗(yàn)?zāi)B(tài)分解從音頻分解出來的固有模態(tài)分量對(duì)各類情感語音的影響,并
5、且詳細(xì)分析了同類情感類型條件下來自每階固有模態(tài)分量對(duì)識(shí)別率的貢獻(xiàn)情況,實(shí)驗(yàn)結(jié)果數(shù)據(jù)在一定程度上體現(xiàn)了不同情感類型語音的情感信息在各個(gè)頻帶的分布情況,對(duì)于揭示情感在語音中的分布表達(dá)方式細(xì)節(jié)具有重要意義。4.針對(duì)經(jīng)驗(yàn)?zāi)B(tài)分解分解的耗時(shí)問題提出了迭代次數(shù)限定法和誤差閾值法相結(jié)合的改進(jìn)篩選迭代算法,改進(jìn)的方案大大提高了算法的運(yùn)行效率。關(guān)鍵詞:邊際譜;長(zhǎng)時(shí)特征;經(jīng)驗(yàn)?zāi)B(tài)分解;成分特征-I-哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文AbstractSpeechemotionrecognitionisanimportan
6、tpartofthefieldofaffectivecomputingandmoreandmoreresearchersandinstitutionsengagedinthisfieldinrecentyears.UsuallywehavetoperformtheframingoperationbeforeapplyingFFTmethodtothevoicefragment.Inthisarticle,theHilbert-Huangtransformmethodisusedinourrese
7、arch.TheHHTmethodisveryusefultooltohandlethenon-linearandnon-stationarysignalsandtheentiresentencecouldbetreatedasaunittobeprocessed.Thisarticlehasfocusedonseveralfollowingworks.1.ByusingtheHilbert-HuangTransformmethod,anewsetoflong-termfeaturesbased
8、onHilbertmarginalspectrumhasbeenproposed.Comparedwithtraditionallong-termfeaturesbasedonFFTmethod,thesefeaturesgaingreatadvantageinrecognizingtheshortersentencesintheemotionalcorpus.Wealsogiveadetaileddescriptionabouttheimpactingfactorsoftheexperimen