基于小波變換的說話人識別方法.研究

基于小波變換的說話人識別方法.研究

ID:31982490

大?。?.11 MB

頁數(shù):49頁

時間:2019-01-30

基于小波變換的說話人識別方法.研究_第1頁
基于小波變換的說話人識別方法.研究_第2頁
基于小波變換的說話人識別方法.研究_第3頁
基于小波變換的說話人識別方法.研究_第4頁
基于小波變換的說話人識別方法.研究_第5頁
資源描述:

《基于小波變換的說話人識別方法.研究》由會員上傳分享,免費在線閱讀,更多相關內容在教育資源-天天文庫。

1、第一章緒論弟一早珀T匕§1.1研究目的和意義在生物學和信息科學高度發(fā)展的今天,生物認證技術作為一種便捷、先進的信息安全技術開始在全球電子商務時代嶄露頭角【11。這是一種根據(jù)人體自身的生理特征(指紋、手形、臉部、虹膜、視網膜、氣味等)和行為特征(聲音、簽名、擊鍵方式等)來識別身份的技術。它是集光學、傳感技術、紅外掃描和計算機技術于一身的第三代身份驗證技術,能滿足現(xiàn)代社會對于身份鑒別的準確性、安全性與實用性的更高要求。在信號檢測與處理、模式識別、人工智能、機器學習等理論與技術迅速發(fā)展的推動下,不久的將來

2、,生物認證技術必將進入一個光輝的時代。通過語音傳遞信息是人類最重要、最有效、最常用和最方便的信息交換形式。因此,語音信號處理的研究也日益顯示出它的重要性。在語音識別技術領域中,說話人識別技術(或稱聲紋識別技術),以其獨特的方便性、經濟性和準確性等優(yōu)勢受到世人矚目,并日益成為人們日常生活和工作中重要且普及的安全驗證方式。說話人識別12J屬于生物識別技術的一種,是一項根據(jù)語音波形中反映說話人生理和行為特征的語音參數(shù),通過對這些個性特征的分析和識別,從而達到對說話人進行辨認或者確認的目的。與語音識別不同的

3、是,說話人識別利用的是語音信號中的說話人信息,而不考慮語音中的字詞意思,它強調說話人的個性化特征;而語音識別的目的是識別出語音信號中的言語內容,并不考慮說話人是誰,它強調說話人的共性特征。與其他生物識別技術相比,說話人識別(或聲紋識別)具有更為簡便、準確、經濟及可擴展性良好等眾多優(yōu)勢,可廣泛應用于安全驗證、控制等各方面。另一方而,隨著移動通信技術的飛速發(fā)展,尤其是網絡和電子商務的繁榮,電話的使用率空前增長,遠程身份認證越來越頻繁。如果僅需要張口打一個電話就可以獲得服務、進行交易,將是何等的方便和快捷

4、?,F(xiàn)有的說話人識別系統(tǒng)在實驗室環(huán)境下能達到很高的識別率,但實際環(huán)境中無處不在的噪聲帶來了訓練模型和測試語音之間的失配,使得噪聲環(huán)境中說話人識別系統(tǒng)的識別率急劇下降l引。目前,對于利用HMM的說話人識別系統(tǒng),在用高品質的話筒,從安靜環(huán)境下的語音信號中提取的倒譜參數(shù),利用事后設定的閾值進行判定時,對于幾十名話者的識別率可以達到99%以上。然而,對于通過實際網絡(例如市話網)傳輸?shù)碾娫捳Z音、存在噪音的實際環(huán)境下的語音進行判定的說話人識別系統(tǒng)性能還有待研究提高。含噪語音的說話入識別是目前研究的熱點和難點???/p>

5、噪聲說話人識別的目的是盡量減小或者消除噪聲所帶來的訓練模型和測試語音之間的失配,使得識別性能盡可能接近訓練環(huán)境下的性能。因而抗噪聲的研究是說話人識別系統(tǒng)實用的關鍵。環(huán)境噪聲會影響語音質量,語音增強就是從帶噪語音信號中提取盡可能純凈的原始語音。在實際應用時,要根據(jù)具體的噪聲情況和特定環(huán)境,選用不同的語音增強方法或語音增強方法的組合,來達到最好的語音增強的效果。為了讓說話人識別系統(tǒng)在強噪聲環(huán)境中,有較好的識別效果,研究一個將語音增強器和說話人識別連起來,將語音增強作為前端處理來提高輸入的信噪比,進而提高

6、說話人識別的抗噪聲性能是十分必要的。此外,目前的說話人識別系統(tǒng)使用的普遍性比較強,而針對性不夠即是說市場性不夠,因此在研究中應該多針對實用中的某一方面進行深入探討,以保證系統(tǒng)的實用性和效益性【41??傊?,未來說話人識別技術將對語音信號增強處理、說話人個性特征的提取方法和識別算法做進一步研究進而推動說話人識別的發(fā)展。§1.2國內外研究現(xiàn)狀1.國外研究現(xiàn)狀說話人識別的歷史可追溯到1660年,據(jù)史料記載,英國國王查爾斯一世之死的偵破過程中,就利用了聲音作為找出犯人的線索,這也許就是根據(jù)說話人聲音審理案件的

7、記錄。對說話人識別的研究始于20世紀30年代【51。早期的工作主要集中在人耳聽辨實驗和探討聽音識別的可能性方面。隨著研究手段和工具的改進,研究工作逐漸脫離了單純的人耳聽辨。Bell實驗室的LGKesta目視觀察語譜圖進行識別,提出了“聲紋(voiceprint)”的概念。隨后,電子技術和計算機技術的發(fā)展,使通過機器自動識別人的聲音成為可能。Bell實驗室提出了基于模式匹配和概率統(tǒng)計方差分析的說話人識別方法,而引起信號處理領域許多學者的注意,掀起了說話人識別的一個研究高潮,其間的工作主要集中在各種識別

8、參數(shù)的提取、選擇和實驗上,并將倒譜和線性預測分析等方法應用于說話人識別。1964年,Pruzansky和Mathews利用方差分析的方法進行說話人研究,提出了有名的衡量說話人特征參數(shù)有效性的F比值公式。同時,Becker等人采用自適應系統(tǒng)對說話人進行了實驗研究,至此,說話人識別已明確劃分為說話人確認和說話人辨認兩大研究任務。在這之后,Glenn等研究了基于鼻輔音的說話辨認研究,發(fā)現(xiàn)從鼻輔音中可以提取出說話人的有效特征。Luck首先將基頻、倒譜技術對基頻參數(shù)進行主分量分

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內容,確認文檔內容符合您的需求后進行下載,若出現(xiàn)內容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。