資源描述:
《基于模糊k最近鄰規(guī)則的葛根類藥材的模式識別》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、基于模糊k最近鄰規(guī)則的葛根類藥材的模式識別【摘要】 目的:探討模糊k最近鄰算法運用于葛根類藥材模式識別的可行性。方法:選擇6種化學(xué)成分的含量,對不同產(chǎn)地的多種葛根類中藥的藥理抗內(nèi)毒素活性建立了模糊k最近鄰規(guī)則識別模式。結(jié)果:模糊k最近鄰規(guī)則對葛根類中藥的藥理抗內(nèi)毒素活性識別正確率達100%,優(yōu)于經(jīng)典k最近鄰法與Bayers判別法。結(jié)論:模糊k最近鄰算法可用于中藥模式識別研究?!娟P(guān)鍵詞】模糊k最近鄰算法;k最近鄰算法;模式識別;葛屬 模式識別技術(shù)是一種借助數(shù)學(xué)方法和計算機技術(shù)來對樣品的內(nèi)部規(guī)律及隱含性質(zhì)進行分析的綜合技術(shù),包括判別分析、聚類分析、機器學(xué)習(xí)等多種方法
2、。該技術(shù)已經(jīng)廣泛應(yīng)用于各個領(lǐng)域,隨著中藥現(xiàn)代化進程,該項技術(shù)逐漸在中藥領(lǐng)域深入應(yīng)用。k最近鄰法已被廣泛應(yīng)用于模式識別的分類器設(shè)計,所謂k最近鄰法(KNN)就是取未知樣本的k個近鄰,看這k個近鄰多數(shù)屬于哪一類,就把其歸于哪一類,在分類過程中KNN是采用簡單多數(shù)投票法來確定未知樣本的分類[1]。問題是,當(dāng)學(xué)習(xí)樣本類別分布不均的時候,如果僅考慮排序后的k個最近鄰而忽視樣本間的不同距離,勢必會降低KNN的分類精度[2]。模糊k最近鄰算法(FuzzyKNN,FKNN)就是將模糊理論與k最近鄰法相結(jié)合的一種監(jiān)督學(xué)習(xí)技術(shù),它有效解決了上述問題,它將未知樣本與k個最近鄰的距離模糊化,并為
3、每個類別都設(shè)置了相應(yīng)的隸屬度,而不象KNN那樣簡單的將未知樣本的歸類定為“屬于”或者“不屬于”[3]。FKNN已被成功的應(yīng)用于多個領(lǐng)域,在蛋白質(zhì)結(jié)構(gòu)預(yù)測[3]及文本分類[2]都有著不錯的性能,本研究將FKNN應(yīng)用于中藥的模式識別,目前國內(nèi)尚未見報道?! ?FKNN算法的原理及實現(xiàn) 本研究的FKNN算法[4]不同于聶生冬等[5]將模糊c均值聚類與KNN簡單結(jié)合,而是在KNN的基礎(chǔ)上結(jié)合模糊理論進行歸類決策實現(xiàn)的,其具體算法安排如下: ?、旁O(shè)已知樣本集合P={p1,p,…pn},n為已知分類的樣本數(shù),c代表分類數(shù),u代表一個c×n的矩陣; ⑵確定未知樣本的最近鄰數(shù)k的值; ⑶選
4、擇歐式距離范數(shù)d作為距離測度; ?、葘γ總€未知樣本x: ①計算n個距離d=d(x,pj),并對其進行排序: pi∈P,且xP d(1)≤d(2)≤d(3)……≤d(k)≤d(k+1)≤…≤d(n) 其中d(1)到d(k)是未知樣本x的k個最近鄰與x的距離?! 、谠趗中找出對應(yīng)于k個最近鄰距離的k個列{uj},其中j=1,2,……k?! 、劾蒙弦徊綇膗中獲得的k個列{uj},計算[4]: ui(x)=kj=1uij1d(x,pj)2m-1kj=11d(x,pj)2m-1 其中m為模糊權(quán)重調(diào)節(jié)因子,對于z=1,2,…,c,如果ui(x)=max{uz(x)},z≠i
5、,則x屬于第i類。取下一個未知樣本轉(zhuǎn)到(4)繼續(xù),上述算法不是迭代過程,每個未知樣本都必須按照上述算法處理一遍?! ?中藥葛根類藥材的模式識別 中藥模式識別通常是根據(jù)中藥所含化學(xué)成分的整體進行分類或描述,識別該中藥的真?zhèn)闻c優(yōu)劣。葛根為豆科植物野葛或甘葛藤的干燥根,全世界已知的葛屬植物大約有18種,我國是葛屬植物的原產(chǎn)地之一,分布極其廣泛,葛屬植物有9個種和2個變種,其中7種與藥用有關(guān),研究結(jié)果表明,不同葛屬植物中藥用成分異黃酮含量和組分差異顯著。曾明等[7]對8個來源共17個藥材樣本的葛屬植物的總黃酮X1、葛根素X2、大豆苷X3、大豆苷元X4、3’甲氧基葛根素X5及多糖X6,6
6、個化學(xué)成分進行了測定[6],并測定了相應(yīng)的抗內(nèi)毒素活性強度,按照