資源描述:
《基于時空上下文感知的移動推薦模型研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、中圖分類號:TP311論文編號:102871616-SZ020學科分類號:085211碩士學位論文基于時空上下文感知的移動推薦模型研究研究生姓名陳圣楠專業(yè)類別工程碩士專業(yè)領域計算機技術指導老師錢紅燕副教授南京航空航天大學研究生院計算機科學與技術學院二О一六年一月NanjingUniversityofAeronauticsandAstronauticsTheGraduateSchoolCollegeofComputerScienceandTechnologyResearchonMobileRecommenderSystembasedonSpatial-temporalContext
2、AwarenessAThesisinComputerTechnologybyChenShengnanAdvisedbyAssociateProf.QianHongyanSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringJanuary,2016南京航空航天大學全日制專業(yè)碩士學位論文摘要伴隨著通信技術的快速發(fā)展,人們已經邁入了移動互聯(lián)網(wǎng)時代。這意味著人們可使用移動設備隨時隨地接入互聯(lián)網(wǎng)。在中國,強大的手機用戶群體不僅決定了移動互聯(lián)網(wǎng)的市場潛力,而且就移動互聯(lián)網(wǎng)的有關領域也有非常
3、光明的研究前景。面對龐大的用戶行為數(shù)據(jù),研究移動互聯(lián)網(wǎng)不論對于推動市場經濟還是改變互聯(lián)網(wǎng)格局都有重大意義。論文從移動互聯(lián)網(wǎng)商務的真實用戶-商品行為數(shù)據(jù)出發(fā),同時加入了移動時代特有的地理位置信息,通過挖掘用戶數(shù)據(jù)發(fā)現(xiàn)數(shù)據(jù)背后的豐富內容,利用隨機森林和梯度漸進回歸樹組合算法,搭建商品推薦模型,為處在移動環(huán)境下的用戶在合適的時間、地點精準推薦商品。本文首先對移動推薦系統(tǒng)的產生背景做了介紹,再對比了移動推薦與傳統(tǒng)推薦在技術層面上的不同,并概述了移動推薦的研究框架和移動推薦在實際生活中的應用。針對移動推薦精確度不足的問題,本文從兩個角度進行優(yōu)化。1)預處理階段。本文對數(shù)據(jù)中的異常點進行檢測
4、,排除異常點,提出了一個基于角度方差的多層次高維數(shù)據(jù)異常檢測算法HODA。算法運用粗糙集理論計算屬性權重降維;利用數(shù)據(jù)分布劃分并對網(wǎng)格進行分類,篩選出可能存在異常點的網(wǎng)格,降低計算數(shù)據(jù)量。最后利用角度方差因子計算候選網(wǎng)格中數(shù)據(jù)點的異常值,判斷數(shù)據(jù)的異常情況。實驗表明算法在運行時間上有明顯優(yōu)勢,且能有效識別高維數(shù)據(jù)集中的異常點。2)預測階段。針對正負樣本極不平衡的問題,采用聚類加權降采樣的方式增加樣本抽取的典型性。通過分析時間和空間兩方面因素構建特征工程,并用隨機森林算法篩選有效特征。組合隨機森林算法和梯度漸進回歸樹兩種算法搭建基分類器與組合模型,提高模型推薦精度。在國內某真實電商
5、數(shù)據(jù)集下,模型表現(xiàn)良好,保證了推薦精度和召回率。關鍵詞:推薦系統(tǒng),移動環(huán)境,預處理,異常檢測,隨機森林,GBDT,模型組合I基于時空上下文感知的移動推薦模型研究ABSTRACTThedevelopmentofcommunicationtechnologyhasmadeitpossibleforpeopletogointointernetage.Thisalsomeanspeoplehavemoreaccesstotheinternetregardlessofthetimeandlocationbyusingmobiledevices.InChina,thegreatsizeofm
6、obilephoneuserscanreflectnotonlythepotientialofmobileinternetmarket,butalsothebrightresearchprospectofrelatedfield.Duetothelargesizeofusers’behaviorrecords,itmakessensetopromptthemarketecnomyandchangethesituationoftheinternetbydoingresearchinmobileinternetfield.Thispaperisbasedonthetrueuser-i
7、temrecordsprovidedbyAlibabaGroup.Itincludesgeographicalinformationthatcanonlybefoundinmobileage.Miningtheuserdatahelpstofindtherichinformationhiddenbehindthedata.Applyingrandomforestandgradientdescendregressiontreetothisdatasetallowspeopletoa