資源描述:
《基于屬性和隱式社交信息的協(xié)同過濾算法研究及應用》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。
1、:10335分類號:單位代碼學號:21535031密級:公開碩士學位論文中文論文題目:基于屬性和隱式社交信息的協(xié)同過濾算法研究及應用r-英文論文題目earchoncollaborativefilteinal:Resg?orithmscombiningattributesandimglicitsocialinformationp:姜海楠申請人姓名:吳慶標教授指導教師:計算數(shù)學專業(yè)名稱、研究方向:數(shù)據(jù)挖掘機器學習所在學院:數(shù)學科學學院論文提交日期2018年1月9日
2、基于屬性和隱式社交信息的協(xié)同過濾算法研究及應用論文作者簽名:指導教師簽名:論文評閱人1:評閱人2:評閱人3:評閱人4:評閱人5:答辯委員會主席:委員1:委員2:委員3:委員4:委員5:答辯日期:2018年3月3日浙江大學研究生學位論文獨創(chuàng)性聲明本人聲明所呈交的學位論文是本人在導師指導下進行的研究工作及取得的研究成果。除了文中特別加以標注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得浙江大學或其他教育機構的學位或證書而使
3、用過的材料。與我一同工作的同志對本研究所做的任何貢獻均已在論文中作了明確的說明并表示謝意。:學位論文作者簽名:I裔楠簽字曰期丨&年多月曰4學位論文版權使用授權書本學位論文作者完全了解浙江大學有權保留并向國家有關部門或機構送交本論文。的復印件和磁盤,允許論文被查閱和借閱本人授權浙江大學可以將學位論文的全部、或部分內(nèi)容編入有關數(shù)據(jù)庫進行檢索和傳播,可以采用影印縮印或掃描等復制手段保、匯編學位論文存。(保密的學位論文在解密后適用本授權書)^'?學位論文作者簽名:i海掬丨:>〇:簽字曰期丨?年2月1曰簽字曰期?年}月曰|摘
4、要、隨著互聯(lián)網(wǎng)的高速增長,用戶要從海量數(shù)據(jù)當中找到自己感興趣的有用的東西非常一,的困難。推薦系統(tǒng)應運而生,因其廣泛的應用前景和研究價值推薦算法直備受關注。近年來各種在線推薦服務的興起對推薦算法提出了很多新的挑戰(zhàn),例如冷啟動問題,傳統(tǒng)基于歷史行為記錄的推薦算法無法為新注冊的用戶或新上架的物品產(chǎn)生精準推薦;可拓展性,,不,用戶和物品數(shù)量迅速增長時基于內(nèi)存的方法無法實現(xiàn)良好的在線預測具備可拓展性推薦精度。,推薦精度影響用戶體驗,良好的推薦精度才能增加用戶的粘性針;些挑戰(zhàn)上可以分為以下幾點:對這,本論文的創(chuàng)新點總體?—基于用戶屬性耦合的協(xié)同過濾改
5、進算法提出了用戶端冷啟動的改進算法,該改進算法在基于內(nèi)存的協(xié)同過濾框架的基礎上,用改進的耦合相似度捕獲類別型數(shù)據(jù)。之間的真正關系,在用戶屬性上構建相似度模型改進的耦合相似度能更好地捕獲用戶之間的相似關系,在此基礎上的基于用戶屬性耦合的改進算法在用戶端冷啟動階段也能為新用戶提供物品集合,實現(xiàn)較好的推薦精度。?提出了物品端冷啟動和具備可拓展性的兩種改進算法—基于平均內(nèi)容屬性耦合的協(xié)同過濾改進算法和基于個體內(nèi)容屬性耦合的協(xié)同過濾改進算法。改進算法通過在矩陣分解大框架中分別引入平均內(nèi)容屬性信息、個體內(nèi)容屬性信息的正則化項來約束矩陣分解過程,使得內(nèi)
6、容屬性相似的物品學習到的物品隱特征向量也相似?;冢崳妭€體內(nèi)容屬性耦合的協(xié)同過濾改進算法相比基于平均內(nèi)容屬性耦合的算法而言構建一,了信任傳播,且避免了其平均化忽視個體多樣性的缺點進步提升了推薦性能?;崳娪趦?nèi)容屬性耦合的協(xié)同過濾改進算法因引入物品端內(nèi)容信息和矩陣分解框架,既具備可拓展性又能在物品冷啟動階段將物品推送給用戶,且這種額外信息的引入還能提升推薦精度。?提出了提升推薦精度的改進算法—基于內(nèi)容和隱式社交信息的協(xié)同過濾改進算法CBNMF,繼續(xù)引入隱(算法)。該改進算法在矩陣分解大框架耦合內(nèi)容信息的情況下式社交信息正則化項來約束矩陣分解過程以改
7、進推薦精度。用戶評分行為相當于用戶在社交中的表現(xiàn),因此隱式社交信息中的用戶信任用基于評分的用戶相似度間接。該思想來源于社交網(wǎng)絡用戶信任傳播,代替,最相似的用戶代表用戶越信任該用戶一眾朋友的意見即用戶在選擇物品時會考慮身邊,越信任的朋友給出的意見采納率I浙江大學碩士學位論文摘要越高。CBNMF算法構建了信任傳播,約束了如果用戶A信任B,B信任C,那么矩陣分解學習到的A和B、B和C、A和C的用戶隱特征向量也會盡可能相似。實驗說明,本章提出的CBNMF算法能準確學習用戶和物品的隱特征向量,在精確度上優(yōu)于其