資源描述:
《基于SVM的多特征數(shù)據(jù)的概率融合方法》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、第29卷湖匕師范學院學報(自然科學版)V01.29第2期JournalofHubeiNormalUniversity(NaturalScience)No.2,2009基于SVM的多特征數(shù)據(jù)的概率融合方法潘繼斌(湖北師范學院數(shù)學與統(tǒng)計學院,湖北黃石435002)摘要:針對刻畫研究對象的獨立多特征的多來源數(shù)據(jù)或信息,目的為對總體類別識別問題,研究了利用支持向量機方法對各特征分別進行模式識另q后,引入樣本的后驗概率,并以此形成似然函數(shù),從而建立多源數(shù)據(jù)特征級概率融合方法,該方法具有不必對數(shù)據(jù)進行預處理,處理的數(shù)據(jù)可以是不同質(zhì)、高維、小樣本數(shù)據(jù),沒有強的先驗假設(shè),能用機器自動實現(xiàn)等特點。關(guān)鍵詞:
2、支持向量機;后驗概率;似然函數(shù);數(shù)據(jù)融合中圖分類號:TP'/51文獻標識碼:A文章編號:1009-2714(2009)02·0021-03數(shù)據(jù)融合是將來自多傳感器觀測數(shù)據(jù)或多源信息進行綜合處理,從而得出比單傳感器更為準確可靠的結(jié)論。人類可以非常自然地把多傳感器(眼、耳、鼻、四肢)的信息(景物、聲音、氣味、觸覺)組合起來,使用先驗知識去估計,理解周圍的環(huán)境和正在發(fā)生的事情。多傳感器數(shù)據(jù)融合的基本原理就象人腦綜合處理信息一樣,充分利用多個傳感器資源,對它們觀測的信息進行合理支配和使用,把多個傳感器在空間和時間上的冗余或互補信息依照某種規(guī)則進行組合,以獲得被測對象的一致性解釋或描述。目前,對多
3、源數(shù)據(jù)的比較成熟融合方法和應(yīng)用大多為像素數(shù)融合。像素數(shù)融合是直接在原始數(shù)據(jù)層上進行融合,要求信息有一定的精度且來自同質(zhì)傳感器,處理數(shù)據(jù)量大,可用于多源圖像復合、圖像分析和理解等。而實際應(yīng)用中,常遇到的多源數(shù)據(jù)是不同質(zhì)的,反映研究對象不同特性的特征數(shù)據(jù),需要進行特征級融合,要求用更高級的融合技術(shù)。對特征融合,人們一般采用Bayesian方法,邏輯推理結(jié)合D—s證據(jù)理論法及神經(jīng)網(wǎng)絡(luò)法。它們都有一定的假設(shè)條件,使用范圍受到限制,實際中難以實現(xiàn)等缺點,最近一些學者提出一些新的融合方法。如文[3]在對各類各指標假定服從正態(tài)分布的前提下,利用參數(shù)估計得到密度函數(shù),進而用極大似然思想對密度函數(shù)作概率融
4、合。本文針對多源數(shù)據(jù)或信息的模式識別問題,提出了基于支持向量機輸出,引入后驗概率,融合過程采用最大化后驗概率形成的似然函數(shù)的概率融合方法。該方法沒有數(shù)據(jù)噪聲模型的先驗假設(shè),具有支持向量機的高維、非線性、小樣本條件等優(yōu)點,利用現(xiàn)有算法可自動、簡便實現(xiàn)。1多特征模式類型判別模型設(shè)有研究對象x,其可能屬于k個類型{c。,c:,?,c}中的某一類,為了對x的實際類型作出判別,可選取能夠反映本質(zhì)特征的/7,個獨立指標{,?},若每個指標到K個類型有一個未知的概率分布(/=。c),i=I,2,?,rt√=I,2,?,k,則問題是由按每個(,ci)獨立抽取的容量為m的觀測數(shù)據(jù){x,j(£)},f=1,
5、2,?,m,i=1,2,?,rt,j。=1,2,?,k及的指標觀測值(,,2,?,),對的類型進行判別,即建立一個判別準則,:其中:F={,?},力={c,c:,?,c。}.上述問題在實踐中大量存在,如對未知類型物體的不同部位用不同的傳感器進行測量,依此判別收稿日期:20o9—o2一l6作者簡介:潘繼斌(1963~),男,湖北浠水人,副教授。在讀博士,主要研究方向為統(tǒng)計學習理論、模式識別、信息處理·21·物體的類型;根據(jù)病人不同生理特征值作出病情診斷;對同一地面物體用不同測量手段得到的觀測數(shù)據(jù)對其類型作出判斷,用不同的教育測量量表或心理測量方法對人的能力、性格作出判斷等。上述模型對每個指
6、標而言是基于經(jīng)驗數(shù)據(jù)的一般學習模型,可以利用支持向量機方法解決,但為了能將所有指標信息結(jié)合起來,需要把支持向量機的輸出轉(zhuǎn)換為后驗概率,據(jù)此利用極大似然函數(shù)的思想得到判別規(guī)則。本文提出的算法模型為:圈亟囹匝匭匝互委囫亟囹匝墮?quán)蛞辉盐遴蛉!i匭亟囹匭囹匭墮五團2支持向量機中引入后驗概率的理論支持向量機的思想是在由核函數(shù)(,Y)確定的特征空間日上構(gòu)造軟間隔分離超平面,用正則化因子平衡間隔最大化和訓練誤差最小化,它可轉(zhuǎn)化為優(yōu)化問題:minimize~b(to,)=÷Il∞ll+c互£,Y[(∞·i)+b]≥l一直,基≥0此問題可轉(zhuǎn)化為具有凸線性約束的二次規(guī)則問題:maxi。mizeW(ct)=
7、一寺f薈1y-Ii}(,)+,i,,‘%0,o≤≤c,=1,2,?,m·它的最優(yōu)解是)=l∑%Yk(x,)+b,其中b可由KK一7’條件和標準支持向量求出,分類的決策規(guī)貝q為g(x)=sgn(.廠())=sgn(Yik(x,)+b).傳統(tǒng)的支持向量機并不產(chǎn)生后驗概率,但后驗概率對分類器的設(shè)計非常重要。近幾年,一些學者開始研究如何在支持向量機分類器中引人后驗概率。多數(shù)人的思想是利用輸出中的判別函數(shù)廠(),對后驗概率采用指數(shù)型參數(shù)化模型