資源描述:
《基于kohonen神經(jīng)網(wǎng)絡(luò)的用戶(hù)訪問(wèn)模式挖掘模型的研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、摘要摘要Kohone神經(jīng)網(wǎng)絡(luò)是一個(gè)無(wú)監(jiān)督、自組織特征映射網(wǎng)絡(luò)。由于它通過(guò)競(jìng)爭(zhēng)學(xué)習(xí)訓(xùn)練權(quán)系數(shù),并自動(dòng)得出各聚類(lèi)的中心,因此在模式識(shí)別、模式控制等領(lǐng)域得到廣泛應(yīng)用。本文基于其在模式聚類(lèi)中的優(yōu)點(diǎn),將其應(yīng)用于用戶(hù)訪問(wèn)模式挖掘。用戶(hù)訪問(wèn)模式代表了用戶(hù)訪問(wèn)網(wǎng)站的興趣。通過(guò)挖掘用戶(hù)訪問(wèn)模式,可以改進(jìn)Web服務(wù)器的性能、改善網(wǎng)站結(jié)構(gòu)、識(shí)別電子商務(wù)中潛在的客戶(hù),提高對(duì)用戶(hù)服務(wù)的質(zhì)量。然而,Kohonen神經(jīng)網(wǎng)絡(luò)用于用戶(hù)訪問(wèn)模式挖掘時(shí)還存在一些不足。由于Kohonen神經(jīng)網(wǎng)絡(luò)只輸出輸入樣本和輸出神經(jīng)元之間歐氏距離最小的神經(jīng)元,即最優(yōu)匹配的輸出神經(jīng)元,將
2、其應(yīng)用到用戶(hù)訪問(wèn)模式挖掘中,也就是僅反映出了用戶(hù)的一個(gè)興趣,而將用戶(hù)其他的興趣忽略了,因此它不適合用戶(hù)多種興趣的挖掘。鑒于此,本文引入三角形隸屬函數(shù)對(duì)KOhonen神經(jīng)網(wǎng)絡(luò)算法進(jìn)行改進(jìn),輸出若干個(gè)隸屬度大于閉值的神經(jīng)元,從而解決了該問(wèn)題。應(yīng)用改進(jìn)的算法,本文設(shè)計(jì)和實(shí)現(xiàn)了用戶(hù)訪問(wèn)模式挖掘模型。在設(shè)計(jì)過(guò)程中,如何將網(wǎng)絡(luò)日志數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò)輸入數(shù)據(jù)這兩種格式完全不同的數(shù)據(jù)聯(lián)系起來(lái)是一個(gè)難點(diǎn)。本文采取以數(shù)據(jù)庫(kù)為數(shù)據(jù)中轉(zhuǎn)緩存區(qū)的方法,實(shí)現(xiàn)了這兩種不同格式數(shù)據(jù)之間的轉(zhuǎn)換。本文最后用江西省新華書(shū)店用戶(hù)訪問(wèn)日志對(duì)該模型的性能進(jìn)行測(cè)試,并和其它用戶(hù)訪問(wèn)
3、模式挖掘方法進(jìn)行比較。實(shí)驗(yàn)表明,本模型能較好的挖掘用戶(hù)訪問(wèn)模式。關(guān)鍵詞:W七b挖掘;用戶(hù)訪問(wèn)模式:聚類(lèi);Kohone神經(jīng)網(wǎng)絡(luò):隸屬函數(shù)AbstraCtABSTRACTKohoneneuralnetwork(KNN)isaself-organizingfeaturem叩誡thoutsuPervisionKNNfeatilrestrainingweightsthroughcompetitiveleaming,andobtainingcenterPointsofclustersinanautomaticmaner.Duetothesetw
4、ocharacteristics,itiswidelyusedinPatemreco,itio氏pattemcontrol,andetc.Bythesametoken,itisen1Ployedintheuser即cessPaternmining·UseraccessPatternrePresents瞇rs,interestsinwebsitesRelyingonana1ysisanddiscoveryofthePatem1I1roughuserlogfiles,itcanimProvethePerfonllanceoftheweb
5、server,reconstnIctthewebsite,findthepotentialcustomersofe一c0Inlnerceandell】1田Icetheqllalityofwebservices·However,KNNisnotgoodenoughwhendirectlyusedinuseraccessPattemmining.KNNProducesonlythebestmatchingnode,whoseEuclideandistancefiomeachweightvectortothechosensamP1evec
6、torisminimalal11ongalloutPutnodes.Thatistosay,oulyoneinterest誠(chéng)llbefoundifitisaPP1iedinuseraCcessPatiern·0bvious1ythisresuhma11yotherusers,interestsbeingneglected.APossiblesolutionaroundthisProb1emistousetriang1emembershiP九Ilctioninsteadofchoosingoniy山ebestmatchingnodeW
7、iththeimProvedalgoril腸m,auseraccesspattemmini雌modelwasdesi,edalld油Plemenied.Onedificultis:howcanthelogfilesbeconvertedtosamPlevectorsastl1eyaretwodiferenidatafonnat?ThisProblemcanbeaddressedbyintroducingadatabaseasbufer’Finall蘇someexPerimentsare往山entochecktheefectivens
8、softheProPosedmodelandcon1P而sonswithothermodelsaremade.TheexPenmentsshowthatourmodelisefectiveinmininguseraccessPatem