資源描述:
《基于深度信念網(wǎng)絡(luò)的豬咳嗽聲識別》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、基于深度信念網(wǎng)絡(luò)的豬咳嗽聲識別黎煌趙建高云雷明剛劉望宏糞永杰華中農(nóng)業(yè)大學(xué)工學(xué)院生豬健康養(yǎng)殖協(xié)同創(chuàng)新中心華中農(nóng)業(yè)大學(xué)動物科技學(xué)院動物醫(yī)學(xué)院為丫在生豬養(yǎng)殖產(chǎn)生呼吸道疾病的初期,通過監(jiān)測豬咳嗽聲進行疾病預(yù)警,提出了基于深度信念網(wǎng)絡(luò)(DBN)對豬咳嗽聲進行識別的方法。以長白豬咳嗽、打噴嚏、吃食、尖叫、哼哼、甩耳朵等聲音為研究對象,利用基于多窗譜的心理聲學(xué)語音增強算法和單參數(shù)雙門限端點檢測對豬聲音進行預(yù)處理,實現(xiàn)豬聲音信號的去噪和有效信號檢測?;趨奸g規(guī)整算法提取300維短吋能量和720維梅爾頻率倒譜系數(shù)(MFCC)組合成1020維特征參數(shù),將該組合特征參數(shù)作為DBN學(xué)習(xí)和識別數(shù)據(jù)集,選定3隱層
2、神經(jīng)元個數(shù)分別為42個、17個和7個,構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu)為1020-42-17-7-2的5層深度信念網(wǎng)絡(luò)豬咳嗽聲識別模型。通過5折交叉實驗驗證,基于DBN的豬咳嗽聲識別率和總識別率均達到90.00%以上,誤識別率達到10%以內(nèi),最優(yōu)組豬咳嗽聲識別率達到94.12%,誤識別率達到7.45%,總識別率達到93.2W。進一步基于主成分分析法(PCA)提取1020維特征參數(shù)98.01%主成分得到479維特征參數(shù),通過5折交叉實驗驗證,豬咳嗽聲識別率、誤識別率和總識別率相對降維前均有所提高,最優(yōu)組豬咳嗽聲識別率達到95.80%,誤識別率達到6.83%,總識別率達到94.29%,實驗結(jié)果表明所建模型是有
3、效可行的。關(guān)鍵詞:生豬;咳嗽;深度佶念網(wǎng)絡(luò);特征參數(shù);識別;生豬產(chǎn)業(yè)規(guī)?;l(fā)展的冋吋,呼吸道疾病己成為各大養(yǎng)豬場最常見、危害最嚴(yán)重的疾病之一。而咳嗽是豬呼吸道疾病的主要癥狀,尤其是早期癥狀,因此可以通過監(jiān)測咳嗽聲進行豬早期呼吸道疾病預(yù)警11^1。目前所采用的方法一般為簡單易行的人工檢測,但是人工檢測不僅人力成本高,并且識別率難以得到保證。隨著現(xiàn)代信息、數(shù)字信號處理、傳感器等技術(shù)的快速發(fā)展,將計算機技術(shù)與聲音特征分析相結(jié)合,利用語音識別技術(shù)分析豬咳嗽聲與豬非咳嗽聲,對豬咳嗽聲進行識別,有利于生豬呼吸道疾病的預(yù)警,促進生豬健康養(yǎng)殖的發(fā)展U1。國外開展豬聲音識別的研宄相對較早。MITCHEL
4、L等位1發(fā)現(xiàn)了健康豬和病豬咳嗽聲短時能量動態(tài)變化的差異,測得健康豬咳嗽聲持續(xù)時間一般為0.21s,而病豬咳嗽聲持續(xù)時間一般為0.30s。SARA等通過實驗發(fā)現(xiàn)病豬咳嗽咅頻的標(biāo)準(zhǔn)化壓力均方差及峰值頻率均值均低于健康豬,而病豬咳嗽聲持續(xù)時間和頻率均高丁?健康豬。EXADAKTYL0S等hl采用改進的模糊c均值聚類算法識別豬咳嗽,總識別率達到85%,其中病豬咳嗽聲識別率達到82%oGUARINO等M采用動態(tài)時間規(guī)整(Dynamictimewarping,DTW)算法識別豬咳嗽,識別率達到85.5%,非咳嗽聲識別率達到86.6%。HTRTUM等£71考慮低頻環(huán)境噪聲對咳嗽聲的影響,建立環(huán)境噪聲
5、模型,在此棊礎(chǔ)上構(gòu)建棊于模糊c均值聚類算法的咳嗽聲識別模型,非實時單個咳嗽聲識別率能夠達到92%,但錯誤率達到21%。目前,國內(nèi)針對豬聲音識別的研宄尚處于起步階段。馬輝棟等M設(shè)計了基于短時能量和短時過零率的豬咳嗽聲雙門限端點檢測算法。劉振宇等m釆用隱馬爾科夫模型(Hiddenmarkovmodel,fMM)對豬咳嗽聲進行識別,識別率達到80.0%。徐亞妮利用模糊c均值聚類算法進行豬咳嗽聲與尖叫聲識別,識別率分別達到83.4%和83.1%。深度信念網(wǎng)絡(luò)(Deepbeliefnets,DBN)由HINTON等[11]于2006年提出,DBN通過對人腦組織結(jié)構(gòu)和功能的模擬,有著與人類類似的記
6、憶能力、概括推理能力以及強大的分類、預(yù)測能力[12]。最近幾年來,深度學(xué)習(xí)在語音識別領(lǐng)域得到了很好的應(yīng)用,體現(xiàn)丫其強火的聲學(xué)建模能力[13-15]。本文把深度信念網(wǎng)絡(luò)引入豬聲音識別領(lǐng)域,以長白豬咳嗽、打噴嚏、吃食、尖叫、哼哼、甩耳朵等聲音為研宄對象,構(gòu)建豬咳嗽聲識別模型,為生豬健康養(yǎng)殖過程中豬咳嗽聲的識別提供了一種新的方法。1豬聲音采集與預(yù)處理1.1豬聲音采集豬聲音采集在校屬精品豬場進行。采集工具為美博-M66錄音筆,采樣頻率為48000Hz,采樣精度16位,可連續(xù)錄音24h。聲音采集在3-4月豬病多發(fā)期進行,井采集10頭體重75kg左右長白豬的聲音,經(jīng)獸咲診斷10頭豬中5頭豬感染呼吸
7、道疾病,咳嗽明顯。采用專家分類法對錄音筆采集的豬聲音進行分類標(biāo)記,選取咳嗽、打噴嚏、吃食、尖叫、哼哼和甩耳朵聲作為研究對象。得到豬聲咅樣本1400個,其屮咳嗽樣本594個,打噴嚏樣本241個,吃食樣本152個,尖叫樣本130個,哼哼樣本125個,甩耳朵樣本158個,保存為wav格式。1.2豬聲音預(yù)處理豬場環(huán)境下釆集到的豬聲音樣木伍含很多噪音和無效聲音,為提高豬咳嗽聲與非咳嗽聲識別率,在特征參數(shù)提取之前需要進行去噪和端點檢測。1.2.1豬聲音樣本