基于dsp語音識別課程設(shè)計報告-楊艷珍

基于dsp語音識別課程設(shè)計報告-楊艷珍

ID:28206589

大小:1.20 MB

頁數(shù):20頁

時間:2018-12-08

基于dsp語音識別課程設(shè)計報告-楊艷珍_第1頁
基于dsp語音識別課程設(shè)計報告-楊艷珍_第2頁
基于dsp語音識別課程設(shè)計報告-楊艷珍_第3頁
基于dsp語音識別課程設(shè)計報告-楊艷珍_第4頁
基于dsp語音識別課程設(shè)計報告-楊艷珍_第5頁
資源描述:

《基于dsp語音識別課程設(shè)計報告-楊艷珍》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、DSP實驗報告——語音識別攻讀碩士學(xué)位研究生試卷(作業(yè))封面(2013至2014學(xué)年度第二學(xué)期)題目基于DSP語音識別課程設(shè)計科目DSP應(yīng)用與開發(fā)姓名楊艷珍專業(yè)電子與通信工程學(xué)號2013201283入學(xué)年月2013年9月簡短評語成績:授課教師簽字:19DSP實驗報告——語音識別目錄一、設(shè)計任務(wù)書1二、設(shè)計內(nèi)容2三、設(shè)計方案、算法原理說明31系統(tǒng)概述32.硬件構(gòu)成32.1系統(tǒng)構(gòu)成32.2系統(tǒng)主要功能模塊構(gòu)成43.語音識別算法軟件實現(xiàn)53.1系統(tǒng)流程圖53.2語音信號的端點檢測53.3特征參數(shù)的提取83.4建立語音庫93.5特定人語音識別

2、算法10四、程序設(shè)計、調(diào)試與結(jié)果分析13五、參考文獻(xiàn)1819DSP實驗報告——語音識別一、設(shè)計任務(wù)書語音技術(shù),包括語音識別、語音合成、關(guān)鍵詞檢出、說話人識別與確認(rèn)、口語對話系統(tǒng)等,是現(xiàn)代人機交互的重要方式之一,具有廣泛的應(yīng)用前景。其中語音識別技術(shù),尤其是連續(xù)語音識別技術(shù),是最基礎(chǔ)、最重要的部分,而且已經(jīng)逐步走向成熟與實用。語音識別是研究使機器能夠準(zhǔn)確地聽出人的語音內(nèi)容的問題,即準(zhǔn)確地識別所說的話,語音識別是近二三十年來發(fā)展起來的新興學(xué)科,在計算機、信息處理、通信與電子系統(tǒng)、自動控制等領(lǐng)域中,在工業(yè)、軍事、交通、醫(yī)學(xué)等方面有著廣泛的應(yīng)用

3、。語音識別裝置有著重要的應(yīng)用價值。而計算機技術(shù)=模式識別和信號處理技術(shù)及聲學(xué)技術(shù)的發(fā)展也使?jié)M足各種需要的語音識別的實現(xiàn)成為可能。語音識別按不同的角度有以下幾種分類方法:從所要識別的單位。有孤立詞識別、音素識別、音節(jié)識別、孤立句識別、連續(xù)語音識別和理解。目前已進(jìn)入識別的語音識別系統(tǒng)是單詞識別。以幾百個單詞為限定識別對象。從識別的詞匯量來分。有小詞匯(10-50個)、中詞匯(50-200個)、大詞匯(200以上)等。從講話人的范圍來分。有單個特定講話人、多講話人和與講話者無關(guān)。特定講話人比較簡單,能夠得到較高的識別率。后兩者難度較大,不容

4、易得到高的識別率。從識別的方法分。有模塊匹配法、隨機模型法和概率語法分析法。這三種都屬于統(tǒng)計模式識別方法。這三種方法都建立在最大似然決策bayes判決的基礎(chǔ)上,但具體做法不同,簡述如下:a.模塊匹配法。將測試語音與模塊的參數(shù)一一進(jìn)行比較與匹配,判決的依據(jù)是是真測度最小準(zhǔn)則。這里,除了參數(shù)分析的精度之外,選擇何種失真測度至關(guān)重要。通常它要求對語音信息的各種信息具有頑健行,而且可以使用具備加權(quán)技術(shù),使得測度更符合或更接近于最佳。b.隨機模型法。這是一種使用隱馬爾可夫模型(HMM)的概率參數(shù)來對似然函數(shù)進(jìn)行估計和判決,從而得到識別結(jié)果的一種

5、方法。由于HMM具有狀態(tài)函數(shù),所以這種方法可以利用語音頻譜的內(nèi)在變化和他們的相關(guān)性。這表明,該方法能夠較好地將語言結(jié)構(gòu)的動態(tài)特性用到識別中來。c.概率語法分析法。19DSP實驗報告——語音識別適用于大長度范圍的連續(xù)語言的識別情況,也就是說它可以利用連續(xù)語言中的形式語法約束的知識來對似然函數(shù)進(jìn)行估計和判決。這里,形式語法可以用參數(shù)形式來表示,也可以用概率估計的非參數(shù)形式來表示。甚至可以用兩者結(jié)合的形式。因此該方法可將a或b方法結(jié)合起來。除了上面三種方法,其他的識別方法包括人工神經(jīng)網(wǎng)絡(luò)語音語音識別、應(yīng)用模型數(shù)學(xué)識別的語音識別語句等。對于漢

6、字語音的識別,本質(zhì)上和其他語音識別沒有區(qū)別,也有其特點。主要是它宜于用音節(jié)作為基本研究對象,從而使特征的提取、字節(jié)的分割、動態(tài)時間匹配的選取等也具有特點。目前漢語識別的研究重點主要是以詞為單位的孤立詞識別和連續(xù)語音識別對等。本實驗的主要任務(wù)就是對以TMS320VC5402芯片為核心的系統(tǒng)硬件設(shè)計進(jìn)行了研究,通過TLC320AD50C對語音信號進(jìn)行A/D轉(zhuǎn)換,通過TMS30VC5402對語音信號“0”、“1”、“2”進(jìn)行訓(xùn)練和識別,并由對于的燈LED0、LED1、LED2亮來顯示結(jié)果是否正確;該系統(tǒng)核心識別算法采用動態(tài)時間規(guī)整(DTW)

7、算法,主要流程包括預(yù)處理、端點檢測、提取特征值、模式匹配和模板訓(xùn)練,取得了很好的識別效果。二、設(shè)計內(nèi)容(1)對DMA進(jìn)行初始化;(2)對A/D、D/A進(jìn)行初始化;(3)編寫DMA中斷服務(wù)程序,實現(xiàn)語音信號的實時識別;(4)根據(jù)識別系統(tǒng)的類型選擇一種識別方法,采用語音分析方法分析出這種識別方法所要求的語音特征參數(shù),作為標(biāo)準(zhǔn)模式由機器存儲起來,形成標(biāo)準(zhǔn)模式庫。(5)對語音進(jìn)行特征參數(shù)的分析,語音信號經(jīng)過相同的通道得到語音參數(shù),生成測試模板;(6)將測試模板與參考模板進(jìn)行匹配,將匹配分?jǐn)?shù)最高的參考模板作為識別結(jié)果,從而實現(xiàn)語音的識別。19D

8、SP實驗報告——語音識別三、設(shè)計方案、算法原理說明1系統(tǒng)概述???語音識別系統(tǒng)的典型實現(xiàn)方案如圖1所示。輸入的模擬語音信號首先要進(jìn)行預(yù)處理,包括預(yù)濾波、采樣和量化、加窗、斷點檢測、預(yù)加重等。語音信號經(jīng)過預(yù)處理后,接下來重

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。