資源描述:
《基于頻域和時域差分的音頻指紋算法研究.pdf》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、第33卷第5期西華大學(xué)學(xué)報(bào)(自然科學(xué)版)2014年9月Vo1.33,No.5JournalofXihuaUniversity·NaturalScienceSep.2014·計(jì)算機(jī)軟件理論、技術(shù)與應(yīng)用·基于頻域和時域差分的音頻指紋算法研究牛憲華,曾柏森,陳思利(1.西華大學(xué)數(shù)學(xué)與計(jì)算機(jī)學(xué)院,四川成都610039;,2.中國聯(lián)通成都市分公司網(wǎng)絡(luò)優(yōu)化中心,四川成都6100363.成都工業(yè)學(xué)院通信工程系,四川成都611730)摘要:針對現(xiàn)有算法在某些信號畸變情況下魯棒性不理想的問題,修改了頻帶濾波器組模塊的功率譜子帶劃分方式和二維濾波器模塊的子帶間時頻差
2、分方式,分別提出了基于頻域和時域差分的2種音頻指紋改進(jìn)算法。實(shí)驗(yàn)結(jié)果表明,改進(jìn)算法在低信噪比、線性速度改變等方面的魯棒性均優(yōu)于現(xiàn)有的算法。關(guān)鍵詞:音頻指紋;功率譜;魯棒性中圖分類號:TN912.34;TP391.42文獻(xiàn)標(biāo)志碼:A文章編號:1673—159X(2014)05—0010—06doi:10.3969/j.issn.1673—159X.2014.05.003ResearchonAudioFingerprintingAlgorithmBasedonDiferenceinFrequencyandTimeDomainNIUXian—hua.Z
3、ENGBo.sen.CHENSi—li(1.SchoolofMathematicsandComputerScienceTechnology,XihuaUniversity,Chengdu610039China;2.ChengduNetworkOptimizationCenterofChinaUnicomNetworkBranch,Chengdu610036China;3.DepartmentofCommunicationEngineering,ChengduTechnologicalUniversity,Chengdu611730China)Ab
4、stract:ThispaperisconcernedwiththeanalysisofaudiofingerprintalgorithmbasedonFouriertransform.Inallusiontooccur—ringproblemsoftheexistingalgorithminrobustness,theauthorsmodifiedthemodeofenergydivisionanddifferencebetweenthesub—bandsandpresentedanimprovedaudiofingerprintalgorit
5、hmwhichappliedthedifferenceinfrequencyandtimedomain.Thepro—posedalgorithmwasanalyzedsubsequently,andexperimentalresultsshowedthattheproposedalgorithmsimprovedtherobustnessinseveralaspectssuchaslowSNRandlinearspeedchangethanexistingalgorithm.Keywords:audiofingerprinting;powers
6、pectrum;robustness隨著互聯(lián)網(wǎng)的發(fā)展和音頻壓縮技術(shù)的進(jìn)步,網(wǎng)Haitsma等提出Philips音頻指紋算法。Philips算絡(luò)上出現(xiàn)了海量的音頻信息。人工管理海量的數(shù)法將頻譜子帶能量時頻濾波結(jié)果的正負(fù)值作為音字音頻數(shù)據(jù)是一件幾乎無法完成的工作,這直接促頻特征,對多種信號畸變具有較好的魯棒性。2006使了音頻指紋(audiofingerprinting,AF)技術(shù)的快速年,A.Ramalingam等將香農(nóng)熵、子帶能量、頻譜子發(fā)展。音頻指紋技術(shù)建立了一種用于比較2個音樂帶質(zhì)心、頻譜帶寬和梅爾頻率倒譜系數(shù)等多種基于數(shù)據(jù)聽覺質(zhì)量的有效機(jī)制
7、,可以快速高效地識別和短時傅里葉變換的特征作為音頻特征分析其魯棒檢索出音頻內(nèi)容,是數(shù)字音頻的內(nèi)容識別、版權(quán)保性,其實(shí)驗(yàn)結(jié)果表明在一定的信號畸變下,頻譜子護(hù)、內(nèi)容完整性校驗(yàn)等領(lǐng)域的關(guān)鍵技術(shù)之一。近年帶質(zhì)心的魯棒性較好。J.S.Seo等r基于文獻(xiàn)[6]來,音頻指紋技術(shù)成為國內(nèi)外學(xué)者研究的熱點(diǎn)¨I4。提出采用歸一化頻譜子帶質(zhì)心(normalizedspectral采用短時傅里葉變換得到音頻信號的頻譜信息是sub-bandcentroids,NSSC)作為音頻特征,并證明提取音頻指紋時廣泛使用的一種方法。2002年,J.NSSC算法具有良好的魯棒性。本文
8、對性能較好的收稿日期:2014一O1—16基金項(xiàng)目:四川省教育廳自然科學(xué)項(xiàng)目(13ZB0027);四川省高校重點(diǎn)實(shí)驗(yàn)室開放研究基金項(xiàng)目(