資源描述:
《連續(xù)數(shù)字語(yǔ)音識(shí)別系統(tǒng)的研究及應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、碩士學(xué)位論文論文題目:連續(xù)數(shù)字語(yǔ)音識(shí)別系統(tǒng)的研究及應(yīng)用作者姓名劉勝江指導(dǎo)教師徐志江副教授學(xué)科專業(yè)電子與通信工程培養(yǎng)類別全日制專業(yè)學(xué)位碩士所在學(xué)院信息工程學(xué)院提交日期2016年10月18日浙江工業(yè)大學(xué)碩士學(xué)位論文連續(xù)數(shù)字語(yǔ)音識(shí)別系統(tǒng)的研究及應(yīng)用作者姓名:劉勝江指導(dǎo)教師:徐志江副教授浙江工業(yè)大學(xué)信息工程學(xué)院2016年10月DissertationSubmittedtoZhejiangUniversityofTechnologyfortheDegreeofMasterResearchandApplicationofContinuousDigitalSpe
2、echRecognitionSystemCandidate:LiuShengjiangAdvisor:AssociateProf.XuZhijiangCollegeofInformationEngineeringZhejiangUniversityofTechnologyOctober2016漸江工業(yè)大學(xué)學(xué)位論文原創(chuàng)性聲明本人鄭重聲明;所提交的學(xué)位論文是本人在導(dǎo)師的指導(dǎo)下,獨(dú)立進(jìn)行研巧工作所取得的研究成果。除文中已經(jīng)加^斗標(biāo)注引用的內(nèi)容外,本論文不包含其他個(gè)人或集體己經(jīng)發(fā)表或撰寫過的研巧成果,也不含為獲得浙江工業(yè)大學(xué)或其它教育機(jī)構(gòu)的
3、學(xué)位證書而使用過的材料。對(duì)本文的研巧做出重要貢獻(xiàn)的個(gè)人和集體,均已在文中W明確方式標(biāo)明。本人承擔(dān)本聲明的法律責(zé)任。^:作者簽名:日期^/俗1月日7/學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留。并向國(guó)家有關(guān)部口或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱本人授權(quán)浙江工業(yè)大學(xué)可W將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢索,可レッ采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。本學(xué)位論文屬于一1、保密□,在年解密后適用本授權(quán)書。2、保密□,在H
4、年解密后適用本授權(quán)書。"3、不保密囚<""(請(qǐng)?jiān)讠欹蒙舷鄳?yīng)方框內(nèi)打V)作者簽名:若1巧曰期;W辟a月I曰導(dǎo)師簽名:日期年月r日浙江工業(yè)大學(xué)碩士學(xué)位論文連續(xù)數(shù)字語(yǔ)音識(shí)別系統(tǒng)的研究及應(yīng)用摘要隨著信息技術(shù)的不斷發(fā)展,特別是關(guān)于算法、廉價(jià)并行計(jì)算、大數(shù)據(jù)等技術(shù)的突破,人工智能在本世紀(jì)領(lǐng)導(dǎo)著IT發(fā)展的潮流。智能人機(jī)交互接口是目前人工智能的一個(gè)研究熱點(diǎn),很多專家指出,人機(jī)交互的維度將繼“點(diǎn)擊”時(shí)代過渡到“觸摸屏”時(shí)代之后,繼續(xù)從“觸摸屏”時(shí)代過渡到“語(yǔ)音”時(shí)代。如果能實(shí)現(xiàn)人與機(jī)器的自然對(duì)話,讓機(jī)器聽懂人的語(yǔ)言,并根據(jù)信息執(zhí)行人類的意圖,那么
5、這無疑是一種理想的人機(jī)交互方式,而這一切的實(shí)現(xiàn)都要基于語(yǔ)音識(shí)別技術(shù)的研究。本文主要是針對(duì)非特定人連續(xù)數(shù)字語(yǔ)音識(shí)別的研究,目的是實(shí)現(xiàn)IP電話應(yīng)用程序語(yǔ)音自動(dòng)撥號(hào)功能。本文的主要工作和成果如下:1、研究了混合高斯模型(GMM)和隱馬爾科夫模型(HMM)及其相關(guān)算法。2、詳細(xì)介紹了語(yǔ)音識(shí)別過程中的信號(hào)處理和特征提取,包括分幀加窗、預(yù)處理、端點(diǎn)檢測(cè)、特征提取,特別提到了一種基于GMM的端點(diǎn)檢測(cè)方法。3、結(jié)合識(shí)別任務(wù)、已有的數(shù)據(jù)資源以及PC和Android手機(jī)的運(yùn)算能力,選取基于混合高斯模型的隱馬爾科夫模型(GMM-HMM)來進(jìn)行聲學(xué)建模并設(shè)計(jì)了模型的拓?fù)浣Y(jié)
6、構(gòu)。4、研究并借鑒了英國(guó)劍橋大學(xué)語(yǔ)音識(shí)別系統(tǒng)HTK的開源代碼,調(diào)整模型高斯混合復(fù)雜度,優(yōu)化解碼網(wǎng)絡(luò),搭建了一個(gè)能夠?qū)σ淮B續(xù)的數(shù)字串進(jìn)行語(yǔ)音識(shí)別的系統(tǒng),并對(duì)連續(xù)語(yǔ)音識(shí)別原理進(jìn)行了深入研究。5、將HTK識(shí)別部分及訓(xùn)練好的模型移植到Android平臺(tái)應(yīng)用程序中,讓一個(gè)IP電話的應(yīng)用程序?qū)崿F(xiàn)語(yǔ)音撥號(hào)的功能,讓本文識(shí)別技術(shù)的研究真正達(dá)到應(yīng)用。關(guān)鍵詞:語(yǔ)音識(shí)別,高斯混合模型,隱馬爾科夫模型,語(yǔ)音端點(diǎn)檢測(cè),Android系統(tǒng)i浙江工業(yè)大學(xué)碩士學(xué)位論文RESEARCHANDAPPLICATIONOFCONTINUOUSDIGITALSPEECHRECOGNITI
7、ONSYSTEMABSTRACTWiththecontinuousdevelopmentofinformationtechnology,especiallythegreatadvancemadeinalgorithms,cheapparallelcomputing,bigdataandothertechnology,artificialintelligenceisleadingthetrendofITdevelopmentinthe21stcentury.Intelligenthuman-computerinteractioninterfaceis
8、aresearchhotspotofartificialintelligence.Manyexpertspointoutt