資源描述:
《基于冷啟動混合聚類的協(xié)同過濾推薦算法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、工程碩士學(xué)位論文基于冷啟動混合聚類的協(xié)同過濾推薦算法研究作者姓名林茂杰工程領(lǐng)域控制工程校內(nèi)指導(dǎo)教師彭云建副教授校外指導(dǎo)教師唐勇高級工程師所在學(xué)院自動化科學(xué)與工程學(xué)院論文提交日期2018年3月ResearchonCollaborativeFilteringRecommendationSystemBasedonClusteringAlgorithmforColdStartProblemADissertationSubmittedfortheDegreeofMasterCandidate:MaojieLinSupervisor:YunjianPengSouthChinaUniversi
2、tyofTechnologyGuangzhou,China分類號:TP301學(xué)校代號:10561學(xué)號:201521013375華南理工大學(xué)碩士學(xué)位論文基于冷啟動混合聚類的協(xié)同過濾推薦算法研究作者姓名:林茂杰指導(dǎo)教師姓名、職稱:彭云建副教授申請學(xué)位級別:工程碩士工程領(lǐng)域名稱:控制工程論文形式:□產(chǎn)品研發(fā)□工程設(shè)計□√應(yīng)用研究□工程/項目管理□調(diào)研報告研究方向:信息系統(tǒng)論文提交日期:2018年3月12日論文答辯日期:2018年3月20日學(xué)位授予單位:華南理工大學(xué)學(xué)位授予日期:年月日答辯委員會成員:主席:鄧飛其委員:田森平、康文雄、趙學(xué)艷、曠世芳摘要隨著信息技術(shù)和互聯(lián)網(wǎng)的快速發(fā)展,人類
3、社會已經(jīng)進(jìn)入了高度信息化的時代。網(wǎng)絡(luò)世界的不斷豐富給人們帶來了諸多便利的同時,也帶來了信息過載的問題。目前網(wǎng)絡(luò)信息量已經(jīng)遠(yuǎn)遠(yuǎn)超過了人們所能接受和處理的數(shù)量,人們需要花費大量的時間和精力去尋找自己需要的內(nèi)容。在這樣的背景之下,個性化推薦系統(tǒng)應(yīng)運而生。協(xié)同過濾推薦算法自20世紀(jì)90年代問世便成為了一個重要的研究領(lǐng)域,盡管這種技術(shù)已經(jīng)取得了許多成功的應(yīng)用,但在實際應(yīng)用也存在如冷啟動、數(shù)據(jù)稀疏性、實時性和用戶隱私等問題。為了解決這些問題,學(xué)者提出了基于聚類的協(xié)同過濾推薦算法?;诰垲惖耐扑]算法通過先對用戶或者項目進(jìn)行聚類劃分,使相似度較高的對象聚集到同一個類群中,從而簡化查找最近鄰居的過
4、程,大大減小了整體計算復(fù)雜度和時間消耗。另外由于聚類算法可以在離線完成,所以大大提升了推薦系統(tǒng)的實時響應(yīng)性。本文對推薦系統(tǒng)和聚類技術(shù)做了一定的理論研究,提出了一種基于聚類的協(xié)同過濾推薦算法,并通過實驗驗證了改進(jìn)的有效性。本文的主要內(nèi)容為:(1)比較了傳統(tǒng)相似度計算方法,分析出其中的缺點和不足,并針對性地提出了一種改進(jìn)的相似度計算方法。該方法考慮了用戶屬性、個人評分傾向和置信度,提高了相似度計算的合理性和準(zhǔn)確度,同時對于冷啟動問題也有一定的緩解作用。(2)將改進(jìn)的相似度計算方法與K-means聚類算法相結(jié)合,并使用果蠅優(yōu)化算法對聚類算法進(jìn)行優(yōu)化,提出了改進(jìn)的基于聚類的推薦算法FKC
5、R算法。借助于聚類算法和果蠅優(yōu)化算法,F(xiàn)KCR算法在查找用戶相似鄰居集時有更高的效率和準(zhǔn)確度。最后,本文通過實驗驗證了所提算法在推薦準(zhǔn)確性和時效性上的改進(jìn)效果,以及在冷啟動環(huán)境下的推薦質(zhì)量。關(guān)鍵詞:推薦系統(tǒng),協(xié)同過濾,冷啟動,聚類,果蠅優(yōu)化IAbstractWiththerapiddevelopmentofinformationtechnologyandtheInternet,humansocietyhasenteredanewinformationera.Althoughthecontinuousenrichmentofthenetworkworldhasbroughtmany
6、conveniencestous,italsoleadstotheproblemofinformationoverload.Atpresent,theamountofInternetinformationhasfarexceededtheamountthatwecandealwithsothatwehavetospendalotoftimeandenergytofindtheinformationweneed.Undersuchabackground,personalizedrecommendationsystemcameintobeing.Collaborativefilter
7、ingrecommendationalgorithmhasbecomeanimportantresearchfieldsince1990s.Althoughthistechnologyhasachievedalotofsuccessfulapplications,therearealsomanyproblemsneedtobeconsiderd.Suchasthecoldstartproblem,thedatasparsityproblem,thereal-timerespons