資源描述:
《基于物品屬性聚類的融合協(xié)同過濾算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、基于物品屬性聚類的融合協(xié)同過濾算法//.paper.edu-1-中國科技論文在線基于物品屬性聚類的融合協(xié)同過濾算法梁佳男,張華**作者簡介:梁佳男(1989-),男,碩士研究生,推薦系統(tǒng),信息安全通信聯(lián)系人:張華(1983-),女,副教授,密碼協(xié)議、物聯(lián)網(wǎng)和云計(jì)算安全、工業(yè)控制系統(tǒng)安全、移動(dòng)互聯(lián)網(wǎng)安全(北京郵電大學(xué)網(wǎng)絡(luò)與交換國家重點(diǎn)實(shí)驗(yàn)室,北京100876)5摘要:隨著信息技術(shù)的發(fā)展,各式各樣的推薦系統(tǒng)早已廣泛地應(yīng)用在電子商務(wù)、新聞推薦等領(lǐng)域。協(xié)同過濾可以算是推薦系統(tǒng)眾多推薦算法中,使用頻率最高的一種。但其往往存在數(shù)據(jù)稀疏性問題和冷啟動(dòng)等缺點(diǎn)。為了減少推薦系統(tǒng)計(jì)算
2、的時(shí)間,提高推薦準(zhǔn)確率,本文提出一種基于物品標(biāo)簽聚類和slope-one協(xié)同過濾的融合推薦算法。在算法中,通過利用用戶對(duì)物品的評(píng)分行為和物品的屬性標(biāo)簽,計(jì)算出用戶對(duì)物品屬性的偏好向量。然后利用該向量對(duì)10用戶進(jìn)行聚類,將用戶分成多個(gè)相似偏好用戶組。最后,再使用slope-one算法對(duì)未評(píng)分的物品進(jìn)行打分。屬性標(biāo)簽的使用,減少了用戶特征向量的維度,部分解決了矩陣稀疏的問題,而通過聚類和slope-one算法的融合,在保留了slope-one算法計(jì)算模型簡單優(yōu)點(diǎn)的同時(shí),也提高了打分的準(zhǔn)確性。最后,通過MovieLens上的數(shù)據(jù)集驗(yàn)證,相比于slope-one算法,該融
3、合算法確實(shí)能夠提高推薦系統(tǒng)的準(zhǔn)確性。15關(guān)鍵詞:推薦系統(tǒng);協(xié)同過濾;聚類;標(biāo)簽中圖分類號(hào):TP311HybridcollaborativefilteringalgorithmbasedonItemTagclustering20LIANGJianan,ZHANGHua(StateKeyLaboratoryofNetworkingandSwitchingTechnology,BeijingUniversityofPostsandTelecommunications,Beijing100876)Abstract:Withthedevelopmentofinformati
4、ontechnology,alotofrecommendationsystemshavebeenwidelyusedine-commerce,newsrecommendationetc.Collaborativefilteringisoneof25themostimportantrecommendationalgorithmsamongrecommendationsystem.Howeverit'salsosufferingsomeproblemssuchasdatasparsityandcoldstart.Inordertoreducecomputin
5、gtimeforrecommendationandimprovetheaccuracy,anewcollaborativefilteringrecommendationsystemcombiningitem-tagclusteringandslope-onealgorithmisproposed.Inthisalgorithm,userswereclusteredaccordingtousers'preferenceontagsofitems.Propertytagswereuserdto30reduceusers'featurevector,
6、whichsolveddatasparsitypartially.Bycombiningbothclusteringandslope-onealgorithm,therecommendationsystemretainedtheadvantageofslope-onealgorithmwhileimprovingaccuracyaswell.TheexperimentwereappliedtoMovieLensdataset,whichshowedthattheaccuracyofthiscombinedalgorithmisinadvanceofna??vesl
7、ope-one.Keywords:Recommendationsystem;Collaborativefiltering;Clustering;Tag350引言隨著互聯(lián)網(wǎng)的不斷發(fā)展,其承載的信息數(shù)量也越來越大。過量信息的出現(xiàn),導(dǎo)致用戶無法能夠簡單快速的從中獲取對(duì)自己有效的信息。而且,隨著電子商務(wù)的發(fā)展,在某些場(chǎng)合下,用戶需求往往具有不確定性和模糊性。根據(jù)亞馬遜網(wǎng)站的統(tǒng)計(jì),在其網(wǎng)站購物的客戶中,有40明確購買意向的僅占16%。如果商家能夠從海量的商品中把滿足用戶模糊需求的商品主動(dòng)推薦給用戶,則有望將用戶潛在需求轉(zhuǎn)化為實(shí)際需求,不僅能夠提高網(wǎng)站的銷售量,還有助于提高用
8、戶對(duì)網(wǎng)站的