資源描述:
《基于在線社交網絡的個性化推薦算法研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、分類號:TP391密級:公開UDC:004學校代碼:11065碩士學位論文基于在線社交網絡的個性化推薦算法研究王靜指導教師邵峰晶教授學科專業(yè)名稱計算機科學與技術論文答辯日期2016年6月2日摘要隨著互聯網的迅速發(fā)展,數據指數型的增長超出了用戶的處理能力,我們逐漸步入了“信息爆炸”的時代,海量數據的產生帶來了嚴重的信息過載問題。如何從海量數據中快速挖掘出用戶感興趣的產品,推動了個性化推薦技術的發(fā)展。個性化推薦技術主要是利用用戶歷史數據來構建用戶興趣模型來預測用戶感興趣的產品或項目,為用戶提供個性化推薦。
2、推薦算法包括協同過濾算法,基于內容的推薦算法,基于網絡結構的推薦算法等。本文主要的研究內容和成果分以下幾個方面:(1)詳細分析了個性化推薦研究意義和目的,介紹了目前比較流行的推薦算法,并分析了各種算法存在的優(yōu)缺點,為本文研究內容打下了堅實的理論基礎。(2)以現有推薦算法存在的不足作為本文研究問題的出發(fā)點,通過有效地融合用戶多種信息來提高推薦算法的性能。(3)考慮現有基于網絡結構的資源擴散模型忽略了用戶-產品評分信息對推薦結果產生的影響,本文提出了基于用戶評分偏見的加權二分網絡的資源擴散模型,為了更好地
3、挖掘用戶的偏好和厭惡,考慮了用戶-產品評分等級對推薦產生的差異。首先,通過半累積分布方法將用戶評分進行規(guī)整,把用戶顯示評分轉化為用戶偏好評分,重新構建了加權的用戶-產品二分網絡,然后利用資源擴散算法計算出產品間的相似性,利用評價指標獲得每個產品推薦給用戶可能性值,將排在Top_n的產品推薦給目標用戶。最后本文在真實數據集MovieLens上進行了驗證,證實了新算法對推薦模型的準確度和多樣性上有很大的提高。(4)考慮僅采用用戶-產品之間的二元關系會給推薦帶來的冷啟動或數據稀疏性問題,如何有效地融合用戶個
4、人屬性,興趣標簽信息,交互行為等多種屬性信息是本文研究的重點。本文將給目標用戶推薦其他用戶的可能性值轉化為邏輯回歸求概率預測的問題,首先從微博數據中抽取能反映用戶間相關性的特征向量,然后通過梯度下降法訓練獲取最優(yōu)回歸參數來構建微博用戶推薦模型,為目標用戶推薦Top_n個用戶。最后在KDDCup2012的騰訊微博數據上做了驗證算法的有效性。關鍵詞:個性化推薦;加權二分網絡;多樣性;邏輯回歸;微博AbstractWiththerapiddevelopmentoftheInternet,wegraduall
5、ystepintotheeraof‘dataexplosion’duethattheexponentiallygrowingofdatahadgonebeyondourprocessingability.Theoverwhelminginformationbroughttheinformationoverloadproblem.Sohowtorapidlyminevaluableinformationfromthemassivedataisanurgentproblemforus.Meanwhile,
6、itpromotedthedevelopmentofpersonalizedrecommendationtechnology.Personalizedrecommendationmainlyusedtobuildthemodelofusers’preferencesbyutilizingthehistoricalactivitiesandpersonalinterests.Themodelwasabletopredicttheusers’favoriteproductsorprojects,andco
7、nsequentlyprovidethepersonalizedserviceforusers.Currently,themorepopularrecommendedalgorithmsincludedthecollaborativefilteringalgorithm,content-basedalgorithm,network-basedalgorithmandsoon.Inthispaper,themainlyresearchcontentsandachievementswereasfollow
8、s:(1)Thispaperparticularlyanalyzedtheresearches’significanceandpurposeforpersonalizedrecommendation.Andweintroducedthemorepopularrecommendedalgorithmsandanalyzedtheadvantagesanddisadvantagesfordifferentalgorithms.Itwaslaidasolidt