資源描述:
《基于arm的車載語音識別系統(tǒng)設(shè)計與實現(xiàn)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、基于ARM的車載語音識別系統(tǒng)設(shè)計與實現(xiàn)【摘要】在對車載語音識別功能的需求分析基礎(chǔ)上,以語音識別過程為設(shè)計思路,提出一種以ARM為核心的嵌入式語音識別模塊的設(shè)計與實現(xiàn)方案。系統(tǒng)核心處理器采用飛思卡爾推出的1MX27芯片,語音識別功能通過LD3320芯片實現(xiàn),并采用嵌入式Linux操作系統(tǒng)實現(xiàn)統(tǒng)一的任務(wù)調(diào)度和外圍設(shè)備管理?!娟P(guān)鍵詞】ARM;語音識別;LD33201.引言隨著汽車工業(yè)的發(fā)展以及電子市場的成熟,車載智能終端逐漸成為汽車重要的配套設(shè)備,另外,近年來,經(jīng)濟的繁榮也促使國內(nèi)各地汽車數(shù)量急劇增加,人們的
2、出行習(xí)慣也隨之發(fā)生變化,人車共處的時間越來越長,因此,車載智能終端的功能從簡單的行車導(dǎo)航多功能轉(zhuǎn)變,但駕駛?cè)藛T在行車過程中,面對繁復(fù)的界面進行功能選擇操作,易造成安全隱患,因此本文提出基于ARM的車載語音識別系統(tǒng)設(shè)計方案,旨在讓駕駛?cè)送ㄟ^語音指令,操作智能終端,實現(xiàn)基本的導(dǎo)航、語音通信等功能,為安全駕駛提供保障。2.語音識別過程語音識別過程是首先將采集到的語音數(shù)據(jù)進行預(yù)處理,以提高自然語言的識別率,并降低處理器對數(shù)據(jù)進行密集運基于ARM的車載語音識別系統(tǒng)設(shè)計與實現(xiàn)【摘要】在對車載語音識別功能的需求分析基
3、礎(chǔ)上,以語音識別過程為設(shè)計思路,提出一種以ARM為核心的嵌入式語音識別模塊的設(shè)計與實現(xiàn)方案。系統(tǒng)核心處理器采用飛思卡爾推出的1MX27芯片,語音識別功能通過LD3320芯片實現(xiàn),并采用嵌入式Linux操作系統(tǒng)實現(xiàn)統(tǒng)一的任務(wù)調(diào)度和外圍設(shè)備管理?!娟P(guān)鍵詞】ARM;語音識別;LD33201.引言隨著汽車工業(yè)的發(fā)展以及電子市場的成熟,車載智能終端逐漸成為汽車重要的配套設(shè)備,另外,近年來,經(jīng)濟的繁榮也促使國內(nèi)各地汽車數(shù)量急劇增加,人們的出行習(xí)慣也隨之發(fā)生變化,人車共處的時間越來越長,因此,車載智能終端的功能從簡單
4、的行車導(dǎo)航多功能轉(zhuǎn)變,但駕駛?cè)藛T在行車過程中,面對繁復(fù)的界面進行功能選擇操作,易造成安全隱患,因此本文提出基于ARM的車載語音識別系統(tǒng)設(shè)計方案,旨在讓駕駛?cè)送ㄟ^語音指令,操作智能終端,實現(xiàn)基本的導(dǎo)航、語音通信等功能,為安全駕駛提供保障。2.語音識別過程語音識別過程是首先將采集到的語音數(shù)據(jù)進行預(yù)處理,以提高自然語言的識別率,并降低處理器對數(shù)據(jù)進行密集運算的處理量,然后再進行端點檢測、語音特征提取,完成從采集到的語音數(shù)據(jù)波型中,分析并提取以時間為參照的語音特征序列,隨后轉(zhuǎn)換為可對比的信號參數(shù),與系統(tǒng)語音模型
5、庫進行語言匹配,即可得出識別結(jié)果。1.系統(tǒng)整體設(shè)計本系統(tǒng)由硬件、軟件兩部分構(gòu)成,操作系統(tǒng)采用嵌入式Linux,為語音識別指令操作實現(xiàn)、車載智能終端功能實現(xiàn)提供基本的軟件平臺,硬件系統(tǒng)由語音識別部分、核心處理部分、外圍電子設(shè)備部分構(gòu)成,語音識別階段由LD3320專用芯片在51級單片機的控制下完成,獲取語昔特征后,指令識別程序進行指令的對比識別,并通過指令操作系統(tǒng)程序調(diào)用諸如定位、導(dǎo)航、媒體播放、視頻監(jiān)控等應(yīng)用程序,系統(tǒng)結(jié)構(gòu)如下圖1所示。2.硬件系統(tǒng)設(shè)計硬件系統(tǒng)主要包括系統(tǒng)主板、核心處理器、語音采拾器、語音
6、識別芯片、語音控制單片機、存儲器、電源等部分構(gòu)成,詳細介紹如下:4.1核心處理模塊系統(tǒng)中,核心處理器既做語音指令識別、指令下迗的核心部件,還是車載智能終端的核心,考慮車載智能終端的多功能性,例如定位導(dǎo)航、媒體播放、遠程視頻監(jiān)控等,系統(tǒng)核心處理器采用飛思卡爾推出的1MX27芯片,利用其H.264硬件編解碼模塊可在車載智能終端上實現(xiàn)MPEG4、H.263及H.264視頻流的高效處理,在能夠支持語音識別功能的同時,還使智能終端產(chǎn)品達到DI(DVD畫面質(zhì)量,720X480的屏幕分辨率)分辨率。1MX27在處理H
7、.264的同時占用極少的CPU的資源并提高了視頻處理的性能,使核心有更多資源進行其它的應(yīng)用,例如本系統(tǒng)的語音識別功能,另外,1MX27還具備非常靈活和豐富的標準接口、串行端口和擴展端口,實現(xiàn)與多種外部設(shè)備的連接,包括攝像頭、顯示器,還可以使用Wi-Fi、藍牙實現(xiàn)即插即用及無線互連的功能,通過增加適當?shù)耐鈬K,即可實現(xiàn)GPS定位、GPRS通信等應(yīng)用。4.2語音識別模塊目前語音識別方案,有針對特定人的語音識別技術(shù),但用戶無法自行修定識別內(nèi)容,還有基于ARM的軟件識別技術(shù),即將采集到的語音數(shù)據(jù),直接交由AR
8、M平臺上運行的軟件進行處理、比對、識別,這種方案優(yōu)點是可以附帶龐大的語音模型庫,適應(yīng)范圍較廣,但對ARM硬件平臺要求較高,軟件設(shè)計也相對復(fù)雜,本系統(tǒng)根據(jù)設(shè)計目的,提出的解決方案是,采用專用的語音識別芯片LD3320完成語音識別功能,將識別后的少量數(shù)據(jù)通過串行通信接口傳送給ARM處理器,再由軟件執(zhí)行判斷并執(zhí)行相應(yīng)的功能,一方面僅需求少量的外電子器件,即可完成非特定人、非特定人、孤立詞、小詞匯量的語音識別功能,另一方面也可減少對ARM硬件的需求