資源描述:
《基于自組織特征映射網(wǎng)絡(luò)(som)的聚類分析方法》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、基于自組織特征映射網(wǎng)絡(luò)(SOM)的聚類分析方法 摘要:介紹了自組織映射網(wǎng)絡(luò)聚類分析方法,以2012年以來全世界女子排球最重要的七次大賽成績?yōu)橐罁?jù),提高世錦賽、世界杯、奧運會權(quán)重,建立了相應(yīng)的神經(jīng)網(wǎng)絡(luò)模型,并對世界九支女排強隊成績進行6個級別分類。在訓(xùn)練過程中減小關(guān)聯(lián)度較小的樣本影響,提高了預(yù)測精度、訓(xùn)練速度。使用Matlab工具箱函數(shù)進行仿真,面對網(wǎng)絡(luò)媒體中眾多的世界排名,推測預(yù)知,提出了相對科學(xué)的數(shù)據(jù)分析方法?! £P(guān)鍵詞:女子排球;SOM自組織特征映射;聚類分析 DOIDOI:10.11907/rjdk.162467 中圖分類號:T
2、P391 文獻標(biāo)識碼:A文章編號:1672-7800(2016)012-0133-03 0引言 2016年8月21日里約奧運女排決賽,中國女排終于不負眾望,逆轉(zhuǎn)塞爾維亞隊獲勝。中國女排的比賽一直牽動著廣大球迷的心,中國女排起步于20世紀50年代,到了60至70年代有著東洋魔女”之稱的日本女排取代蘇聯(lián)女排獲得了世界皇者地位。然而在90年代時候中國女排成績一直不夠理想,縱觀世界女排的風(fēng)云變幻,輝煌與失落并舉,在智能算法高速發(fā)展的今天有必要科學(xué)統(tǒng)計世界女排各隊的比賽數(shù)據(jù),如實展示各國女排強隊水平和實力?! ?神經(jīng)網(wǎng)絡(luò)建模6 聚類不需要預(yù)先
3、知道部分球隊的水平和實力,只需要給定分類的類別數(shù)量N,算法就會將所有樣本按照相似性的原則劃分為N類[1]。當(dāng)訓(xùn)練結(jié)束時,同一個競爭層的輸入樣本就被歸為同一類別,自組織神經(jīng)網(wǎng)絡(luò)模型如圖1所示?! ∫@得較準確的聚類結(jié)果,關(guān)鍵在于以下兩點: ?。?)選擇恰當(dāng)?shù)臉颖咎卣?。將國際性正式大賽的表現(xiàn)納入考慮范疇,并提高高級別比賽的權(quán)重[2]。本文選取近年來的七場世界級大賽――2012年奧運會、2013年大獎賽、2014年錦標(biāo)賽、2015年大獎賽、2015年世界杯、2016年大獎賽、2016年奧運會的參賽成績作為衡量實際水平的依據(jù)。 選擇9支球隊進行聚
4、類,分別為中國、塞爾維亞、美國、俄羅斯、日本、意大利、荷蘭、巴西、德國。每個球隊用一個七維向量x=[x1,x2,x3,x4,x5,x6,x7],向量的各分量分別表示2012年奧運會成績、2013年大獎賽成績、2014年錦標(biāo)賽成績、2015年大獎賽成績、2015年世界杯成績、2016年大獎賽成績、2016年奧運會成績?! 〕煽兊木唧w編碼如下:①對于奧運會參賽隊12支,如果取得四強,則取其最終排名(1~4),如果進入八強編碼為5,排名9和10,編碼為9;排名11、12,編碼是11;②對于世界杯參賽隊固定為12支,如果取得四強,則取其最終排名(1
5、~4),如果進入八強編碼為5,排名9和10,編碼為9;排名11、12,編碼是11,未獲得世界杯參賽資格的隊伍編碼是14;③6對于世錦賽參賽隊固定為24支,如果取得四強,則取其最終排名(1~4),如果進入八強編碼為5,八強往后依次按照獲得的名次為編碼,對于未獲得世界杯參賽資格的隊伍編碼為26;④對于大獎賽賽參賽隊為28支,如果取得四強,則取其最終排名(1~4),如果進入八強編碼為5,八強往后依次按照獲得的名次為編碼,對于未獲得大獎賽參賽資格的隊伍編碼為30。注:大獎賽每年舉辦一次,較前面的世錦賽、世界杯、奧運會四年舉辦一次而言,大獎賽分量稍輕
6、故在權(quán)值上面乘以系數(shù)0.5,特此說明?! ∫虼?,對于這9支球隊,求其特征向量如表1所示,數(shù)字越小表示成績越好[3]?! 。?)選擇適當(dāng)?shù)木垲悈?shù),這里的參數(shù)主要是聚類的類別個數(shù)。采用自組織特征映射網(wǎng)絡(luò)進行聚類時,設(shè)置競爭層為2*3結(jié)構(gòu),即類別數(shù)為6類。組線條的分類意義并不大,會把很多隊分為一類,為了區(qū)別開來選擇相對細一些的分類。 由于向量維數(shù)為7,因此網(wǎng)絡(luò)的輸入層包含7個神經(jīng)元節(jié)點。競爭層也包含7個節(jié)點,訓(xùn)練完畢后,每一個輸入向量屬于一個競爭層節(jié)點?! ?排球水平聚類實現(xiàn) 排球水平可抽象為對9個7維向量聚類的問題。使用Matlab工具箱
7、函數(shù)SELFFORG,流程如圖2所示[4]?! 。?)定義樣本。聚類共涉及9個國家,每個國家的球員成績(大獎賽加權(quán)重)用一個七維向量表示?! 。?)創(chuàng)建網(wǎng)絡(luò)?! 。?)網(wǎng)絡(luò)訓(xùn)練。 ?。?)測試。當(dāng)測試數(shù)據(jù)6和訓(xùn)練數(shù)據(jù)相同時,為了得到每個樣本的分類標(biāo)簽需要將用于訓(xùn)練的矩陣輸入到網(wǎng)絡(luò)中?! 。?)顯示聚類結(jié)果。聚類完成時,分為同一類的樣本被賦予相同的分類標(biāo)簽,但不同類別使用什么數(shù)字作為分類標(biāo)簽則是隨機的。為了得到正確結(jié)果,統(tǒng)計每個聚類類別的特征向量數(shù)值之和,由于數(shù)值越低表示水平越高,因此根據(jù)統(tǒng)計結(jié)果就可以判斷不同類別孰優(yōu)孰劣[5]?! ∮脠D例說
8、明如下:圖3為自組織網(wǎng)絡(luò)結(jié)構(gòu)圖,圖4為7個權(quán)值的輸入值,圖5為SOM相鄰權(quán)重值,圖6為SOM的權(quán)重位置,圖7為Matlab仿真計算結(jié)果。 Matlab仿真結(jié)果: 分析:球隊分