資源描述:
《試析基于內容的音頻檢索研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、南京理工大學碩士學位論文基于內容的音頻檢索研究姓名:鄒益申請學位級別:碩士專業(yè):計算機應用技術指導教師:唐振民20070701碩士論文基于內容的音頻檢索研究摘要隨著網絡技術和多媒體技術的迅速發(fā)展,大量的多媒體信息都可以從網上獲得。音頻是多媒體中的一種重要媒體。由于音頻數據量的快速增長,如何自動地對這些內容進行管理就成為一個突出的問題。特別對于身邊的種類繁多的音樂數據,人們要求有快速高效的方法對它們進行分類管理(根據不同風格或演唱者等),這需要有效的自動分類技術對音頻數據進行整理,以便于檢索和相關的分析處理。本文對基于內容的音樂分類進行研究。目
2、前音樂分類的研究主要集中在音樂特征提取和分類兩方面。音樂特征包括時域的短時能量、短時過零率等,頻域的帶寬、譜質心等,還有基于聽覺感受的Mel倒譜系數(MrCC)等。許多音樂特征都可用于音樂分類。而分類算法可利用模式分類中現存的大量高效算法,例如高斯混合模型(GMM)、神經網絡(N№、支持向量機(sⅥ舊、隱馬爾可夫模型(HMM)等。本文根據上述的研究,采用基于Mel倒譜系數特征的隱馬爾可夫模型對音樂進行分類。在音樂特征提取方面,以感知特征和Mel倒譜系數組成特征向量;在音樂分類方面,以隱馬爾可夫模型作為分類器,對音樂進行聚類和分類。通過有監(jiān)督的
3、學習方式進行聚類,分類時將測試樣本歸入似然值最大的類別,對同一音頻抽取若干樣本,對樣本識別結果采用投票法,判定該音頻的音樂類別,使分類的準確率得到進一步的提高。根據上述方法進行了仿真實驗,并對實驗結果進行了分析。本文將音頻數據分為5類,對4種分類器的分類性能進行了比較,并對有干擾的模型進行了分類實驗。實驗結果表明HMM模型的分類性能還是有一定優(yōu)勢的,并有較強的抗干擾性。音頻分類技術是音頻檢索以及其他音頻處理的重要輔助手段。通過基于內容的音樂分類之后,為進一步的音樂檢索和相關的分析處理提供了便利。因此,在基于內容的音樂檢索研究中,對音樂的分類研
4、究是一項非常重要而有意義的工作。關鍵詞:基于內容的音樂分類;特征提??;Mel倒譜系數;模式識別;隱馬爾可夫模型碩士論文基于內容的音頻檢索研究AbstractWithrapiddevelopmentofnetworktechnologyandmultimediatechnology,alargenumberofmultimediainformationcanbeobtainedfromtheInteract.Audioisanimportantpartofthemultimedia.Asrapidincreaseinaudiodata,howt
5、oautomaticallymanagethesedatahasbecomeaprominentissue.Especiallytothewidevarietyofmusicdata,peopledemandarapidandefficientmethodforthemanagementoftheirclassification(accordingtodifferentstylesorsingers,ctc.).Thisrequiresanefficientautomaticclassificationtechnologytocollatea
6、udiodata,anditcanserveaudiosearchorrelatedanalysis.Inthisdissertation,wepresentastudyoncontent-basedmusicclassification.Currentlymostresearchofmusicclassificationfocusonmusicfeatureextractionandclassification.Musicfeaturesincludetime—domainfeatures,suchasshort-termenergy,sh
7、ort-termzerorotes,frequency-domainfeatures,suchasbandwidth,spcctnnncenter,andMel-frequencycepstralcoefficients(MrCC)basedontheexperienceofhearing.Manyfeaturesofmusiccabbeusedformusicclassification.Andclassificationalgorithmscanusetheexistingclassificationmodelofalargenumber
8、ofefficientalgorithms,forexample,GaussianMixtureModel(OMM),NeuralNetworks(M田,Suppo