基于R語言的k-最近鄰法數(shù)字模式識別研究.pdf

基于R語言的k-最近鄰法數(shù)字模式識別研究.pdf

ID:52351666

大?。?010.09 KB

頁數(shù):3頁

時間:2020-03-26

基于R語言的k-最近鄰法數(shù)字模式識別研究.pdf_第1頁
基于R語言的k-最近鄰法數(shù)字模式識別研究.pdf_第2頁
基于R語言的k-最近鄰法數(shù)字模式識別研究.pdf_第3頁
資源描述:

《基于R語言的k-最近鄰法數(shù)字模式識別研究.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、應(yīng)用技術(shù)與研究學術(shù)探討2014年第8期基于R語言的k-最近鄰法數(shù)字模式識別研究鐘志強(鞍山師范學院物理科學與技術(shù)學院,遼寧鞍山114007)[摘要]k-最近鄰法是常見的機器學習算法,R語言中通過kknn包完成算法實現(xiàn),但其無法實現(xiàn)圖像文件的處理。為此,本文先將圖像文件轉(zhuǎn)換成文本文件,再結(jié)合KNN算法對文件中數(shù)字圖像進行模式識別。實驗得出其判斷結(jié)果達到了預(yù)期指標。[關(guān)鍵詞]k-最近鄰法;模式識別;R語言現(xiàn)以著名鳶尾花(iris)數(shù)據(jù)集實現(xiàn)算例:包含五個指標1.k-最近鄰法原理花瓣長度(Petal.Length)、萼片寬度(S

2、epal.Width)、花瓣寬度k-最近鄰法(k-nearestneighbor,KNN)是最簡單的機器學(Petal.Width)、萼片長度(Sepal.Length)、三種花類型(Species:習算法之一,可以用于分類和回歸。KNN認為,待分類對象setosa,versicolor,virginica)150筆記錄。其結(jié)果見表1和圖的類別可以通過在它附近的訓練數(shù)據(jù)的類別來確定,所以采1。取的策略就是找到離待分類對象最近的K個鄰居進行分析data(iris);m<-dim(iris)[1];val<-sample(1:

3、m,size=round[1]。將樣本特征空間中的k個最相似的樣本中的大多數(shù)劃屬(m/3),replace=FALSE,prob=rep(1/m,m));iris.learn<-iris[-某一個類別。KNN方法主要靠周圍有限的鄰近的樣本,而val,];iris.valid<-iris[val,];iris.kknn<-kknn(Species~.,iris不是靠判別類域的方法來確定所屬類別。KNN方法雖然從.learn,iris.valid,distance=1,kernel="triangular");summary原

4、理上也依賴于極限定理,但在類別決策時,只與極少量的(iris.kknn);fit<-fitted(iris.kknn);table(iris.valid$Species,相鄰樣本有關(guān)。因此對于類域的交叉或重疊采用較多的待fit)分樣本集更為適合。搜索k個近鄰算法的偽算法表示為:pcol<-as.character(as.numeric(iris.valid$Species));KNN(A[n],k),輸入:A[n]為N個訓練樣本在空間中的坐標,kpairs(iris.valid[1:4],pch=pcol,col=c("g

5、reen3","red")[(iris為近鄰數(shù);輸出:x所屬的類別。取A[1]~A[k]作為x的初始.valid$Species!=fit)+1])近鄰,for(i=k+1;i<=n;i++)計算a[i]與x間的距離d(x,A[i]);if(d(x,A[i]))

6、j=1,..setosaversicolorvirginica.,i};計算前k個樣本

7、A[i]),i=1,2,...,k所屬類別的概率,setosa1600versicolor0122具有最大概率的類別即為樣本x的類。virginica01192.R語言KNN實現(xiàn)基本實例R是GNU系統(tǒng)的一個自由、免費、源代碼開放的軟件,主2.53.50.51.52.533333335.要用于統(tǒng)計分析與數(shù)據(jù)可視化。R語言使用起來簡潔、直333333333722223332332223333222333335.23332333233336Sepal.Length322332223323232332觀、靈活,隨著大量新興研究領(lǐng)域

8、算法不斷更新,R語言在機33221123312335.2211111122111225221111111122111112211111111115.器學習領(lǐng)域有廣泛的應(yīng)用。R語言中k-最近鄰法常用包是11114111kknn。其使用函數(shù)為:kknn(formula=formula(train),train,113111311135.1111113111112332Sepal.Width111111223311112233322232231333333313333313333test,na.action=na.omit(),

9、k=7,distance=2,kernel="optimal",122232331222333122233335.323332333233223322322332122122122222ykernel=NULL,scale=TRUE,contrasts=c('unordered'="contr33333

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。