1011100330黃婷婷[文獻綜述]-05-19

1011100330黃婷婷[文獻綜述]-05-19

ID:15278005

大?。?16.50 KB

頁數(shù):8頁

時間:2018-08-02

1011100330黃婷婷[文獻綜述]-05-19_第1頁
1011100330黃婷婷[文獻綜述]-05-19_第2頁
1011100330黃婷婷[文獻綜述]-05-19_第3頁
1011100330黃婷婷[文獻綜述]-05-19_第4頁
1011100330黃婷婷[文獻綜述]-05-19_第5頁
資源描述:

《1011100330黃婷婷[文獻綜述]-05-19》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫

1、畢業(yè)論文:文獻綜述                                          畢業(yè)論文(設(shè)計)文獻綜述題目:電子語音系統(tǒng)學院:信息與電子工程學院專業(yè):電子信息工程班級:電子1003學 號:1011100330學生姓名:黃婷婷指導教師:王安定二○一四年二月-7-                      畢業(yè)論文:文獻綜述                                          語音合成技術(shù)及其應(yīng)用摘要:文章介紹了語音合成技術(shù)及其國內(nèi)外發(fā)展現(xiàn)狀、未來的發(fā)展趨勢,以及在網(wǎng)絡(luò)信息服

2、務(wù)、人機自然交互、移動信息終端及各種嵌入式設(shè)備上的應(yīng)用價值。關(guān)鍵詞:語音合成、文語轉(zhuǎn)換、發(fā)展現(xiàn)狀、發(fā)展趨勢、應(yīng)用價值-7-                      畢業(yè)論文:文獻綜述                                          SpeechsynthesistechnologyanditsapplicationAbstract:Thispaperintroducesthespeechsynthesistechnologyanditsdevelopmentathomeandabroad,

3、thefuturetrendofdevelopment,andtheapplicationvalueinthenetworkinformationservice,human-computerinteraction,mobileinformationterminalandembeddeddevices.Keywords:speechsynthesis,texttospeech,developmentstatus,developmenttrend,applicationvalue1引言語音合成不僅是智能計算機研究的主導方向,也是

4、人機語音通信的關(guān)鍵技術(shù)之一。在各國科學界,語音合成就一直備受關(guān)注。如今,隨著研究的突破,語音合成技術(shù)對計算機發(fā)展以及社會生活的重要性日益凸顯出來。利用語音合成技術(shù)設(shè)計并開發(fā)出來的計算機應(yīng)用軟件等產(chǎn)品,幾乎深入社會的每行每業(yè)與方方面面。語音合成技術(shù)的應(yīng)用前景非常良好,尤其對漢語語音合成技術(shù)的應(yīng)用而言,在有十幾億人使用漢語的中國,其市場需求以及社會、經(jīng)濟效益從中可以管窺一斑。2語音合成技術(shù)概述語音合成是利用電子計算機與一些專門裝置模擬人,制造語音的技術(shù)。語音合成技術(shù)又稱文字—語音轉(zhuǎn)換(TexttoSpeech,TTS)技術(shù),能夠

5、將任意文字信息實時轉(zhuǎn)化為標準、流暢的語音朗讀出來,相當于給機器裝上了人工嘴巴。它涉及了聲學、語言學、計算機科學、數(shù)字信號處理等多門學科技術(shù),是中文信息處理領(lǐng)域中的一項前沿技術(shù),它所解決的主要問題是如何將文字信息轉(zhuǎn)化為可聽的語音信息,即讓機器像人一樣開口說話。這里所說的“讓機器像人一樣開口說話”同傳統(tǒng)的聲音回放設(shè)備有著本質(zhì)區(qū)別。與磁帶錄音機原理類似的傳統(tǒng)聲音回放設(shè)備,是采用預(yù)先錄制聲音然后回放的方式來實現(xiàn)“讓機器說話”的。這種方法不論是在內(nèi)容、存儲、傳輸還是方便性、及時性等方面都有很大限制。而通過計算機語音合成則可以隨時將任意

6、文本轉(zhuǎn)換為具有高自然度的語音,從而實現(xiàn)讓機器“像人一樣開口說話”。-7-                      畢業(yè)論文:文獻綜述                                          目前,語音合成的研究已進入TTS階段,它的功能模塊可以分為文本分析、韻律建模以及語音合成三個模塊。其中,語音合成是TTS系統(tǒng)中最基礎(chǔ)、最重要的功能模塊。概括地說,語音合成的主要功能就是根據(jù)韻律建模的結(jié)果,從原始語音庫中提取相應(yīng)的語音基元,用特定的語音合成技術(shù)來對語音基元進行韻律特性的調(diào)整及修改,最終合成符合要求

7、的語音。語音合成技術(shù)的研究經(jīng)歷了一個逐步發(fā)展的過程:從參數(shù)合成法到拼接合成法,再到兩者的逐步結(jié)合。人們的認知水平和需求的提高成為其不斷發(fā)展的動力。當前,常用的語音合成技術(shù)主要有:共振峰合成、LPCLPC(LinearPredictiveCoding,線性預(yù)測編碼)是主要用于音頻信號處理與語音處理中根據(jù)線性預(yù)測模型的信息用壓縮形式表示數(shù)字語音信號譜包絡(luò)(en:spectralenvelope)的工具。它是最有效的語音分析技術(shù)之一,也是低位速下編碼方法高質(zhì)量語音最有用的方法之一,它能夠提供非常精確的語音參數(shù)預(yù)測。合成、PSOLA

8、PSOLA(基音同步疊加)是用于波形編輯語音合成技術(shù)中對合成語音的韻律進行修改的一種算法。拼接合成和LMALMA:LogMagnitudeApproximate聲道模型技術(shù)。它們各有優(yōu)缺點,人們在應(yīng)用過程中往往將多種技術(shù)有機地結(jié)合在一起,或?qū)⒁环N技術(shù)的優(yōu)點運用到另一種技術(shù)上,以克服另一種技

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。