資源描述:
《基于某聚類(lèi)地推薦算法》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、曲靖師范學(xué)院本科生畢業(yè)論文論文題目:一種基于項(xiàng)目聚類(lèi)的推薦算法作者、學(xué)號(hào):何蕓娜2010112142學(xué)院、年級(jí):數(shù)學(xué)與信息科學(xué)學(xué)院2010級(jí)學(xué)科、專(zhuān)業(yè):數(shù)學(xué)信息與計(jì)算科學(xué)指導(dǎo)教師:劉永財(cái)完成日期:2014年5月27日曲靖師范學(xué)院教務(wù)處一種基于項(xiàng)目聚類(lèi)的推薦算法摘要推薦系統(tǒng)是幫助用戶(hù)評(píng)估他沒(méi)有發(fā)現(xiàn)的內(nèi)容,從而克服信息超載的一種有效工具.對(duì)于推薦系統(tǒng)的研究,既有重大的社會(huì)意義,又有重大的經(jīng)濟(jì)價(jià)值.推薦系統(tǒng)早在上世紀(jì)九十年代就已經(jīng)被提出并進(jìn)行了廣泛的研究.在現(xiàn)代信息爆炸的年代,用戶(hù)在網(wǎng)上留下的評(píng)分?jǐn)?shù)據(jù)成了一個(gè)很大的數(shù)據(jù)庫(kù).本文介紹了一種基于項(xiàng)目聚類(lèi)的協(xié)同過(guò)濾推薦算法及比較簡(jiǎn)單實(shí)用的聚類(lèi)分析算法—
2、k-means算法,利用該推薦算法合理開(kāi)發(fā)并利用這些資源.主要通過(guò)k-means算法求出根據(jù)項(xiàng)目相似性度量,從而對(duì)項(xiàng)目進(jìn)行聚類(lèi).文中介紹的推薦算法,其核心目的在于解決數(shù)據(jù)稀疏性?xún)?yōu)勢(shì)的基礎(chǔ)上,使用聚類(lèi)分析技術(shù)對(duì)原始信息進(jìn)行處理,通過(guò)簡(jiǎn)單實(shí)用的k-means聚類(lèi)算法將用戶(hù)的行為模型轉(zhuǎn)化為興趣模型從而實(shí)現(xiàn)了更精準(zhǔn)的推薦.關(guān)鍵詞:推薦系統(tǒng);聚類(lèi)分析;相似性度量;k-means算法BasedontheprojectclusteringrecommendationalgorithmAbstract:Recommendationsystemistohelpusersassessthecontenthed
3、idnotfoundaneffectivetooltoovercometheinformationoverload.Recommendationsystemforthestudyofbothmajorsocialsignificance,butalsoofgreateconomicvalue.Recommendationsystemearlyinthelastcenturyninetyyearshasbeenproposedandcarriedoutextensiveresearch.Inthemoderneraofinformationexplosion,leavingthescorei
4、ntheonlineuserdataintoalargedatabase.Thispaperdescribesaproject-basedclusteringcollaborativefilteringalgorithmisrelativelysimpleandpracticalclusteringalgorithm-k-meansalgorithm,usingtherecommendedalgorithmdevelopmentandrationaluseoftheseresources.mainlydeterminedbyk-meansalgorithmbasedonprojectsim
5、ilaritymeasure,sotheprojectcluster.Thisarticledescribestherecommendationalgorithm,itscorepurposeistosolvethedatasparsity-basedadvantages,theuseofclusteranalysistechniquestoprocesstheoriginalinformationthroughsimpleandpracticalk-meansclusteringalgorithmtomodelthebehavioroftheuserinterestmodelthustr
6、ansformedintotoachieveamoreaccuraterecommendations.Keyword:recommendationsystemclusteringanalysissimilaritymeasurementk-meansarithmetic目錄1引言12聚類(lèi)分析33基于項(xiàng)目聚類(lèi)的推薦算法53.1ISODATA算法53.2k-means聚類(lèi)算法63.3k-means聚類(lèi)算法的算法步驟73.4k-means算法和ISODATA算法83.5簡(jiǎn)單推薦過(guò)程的實(shí)現(xiàn)94k-means聚類(lèi)算法的實(shí)現(xiàn)104.1k-means聚類(lèi)算法模型建立104.2k-means聚類(lèi)算法的性能
7、分析114.3MovieLens電影評(píng)分?jǐn)?shù)據(jù)集124.4k-means聚類(lèi)算法實(shí)驗(yàn)過(guò)程及結(jié)果13總結(jié)16參考文獻(xiàn)17致謝18附錄191引言文獻(xiàn)[1]“互聯(lián)網(wǎng)信息環(huán)境中信息超載問(wèn)題研究”中介紹了計(jì)算機(jī)及互聯(lián)網(wǎng)的飛速發(fā)展而使得人類(lèi)從信息貧乏時(shí)代進(jìn)入了信息超載時(shí)代.在這個(gè)信息爆炸[1]的時(shí)代,無(wú)論對(duì)于作為信息消費(fèi)者的用戶(hù)和信息生產(chǎn)者的媒體與商家都受到了海量信息帶來(lái)的新挑戰(zhàn).一方面,普通用戶(hù)很難從海量信息中發(fā)現(xiàn)自己感興趣的部分;