資源描述:
《基于機(jī)器學(xué)習(xí)融合算法的網(wǎng)絡(luò)購買行為預(yù)測研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、基于機(jī)器學(xué)習(xí)融合算法的網(wǎng)絡(luò)購買行為預(yù)測研究纖陳樹廣繡張?zhí)煊畋本┐髮W(xué)經(jīng)濟(jì)學(xué)院安財經(jīng)學(xué)院管理學(xué)院中國(西安)絲綢之路研宄院選擇適合的機(jī)器學(xué)習(xí)算法是在社會經(jīng)濟(jì)研宄領(lǐng)域進(jìn)行大數(shù)據(jù)分析及提高預(yù)測效果的關(guān)鍵。在很多情況下,通過融合訓(xùn)練兩種或兩種以上有差異的算法,能夠顯著提高算法的泛化能力以提高預(yù)測效果?;诎⒗锇桶碗娮由虅?wù)平臺購物行為數(shù)據(jù),分別應(yīng)用Logistic回歸、支持向量機(jī)以及這兩種算法的融合構(gòu)建丫預(yù)測模型。實證結(jié)果表明,融合后模型比單一模型具備更好的預(yù)測效果。關(guān)鍵詞:機(jī)器學(xué)融合算法;購買行為;基金:中國(丙安)絲綢之路研究院科學(xué)研究項目《統(tǒng)計數(shù)據(jù)資源共享中元數(shù)
2、據(jù)管理體系研究》(2016syl8)ResearchonNetworkPurchaseBehaviorPredictionBasedonMachineLearningFusionAlgorithmZHUXinLIUXiao-manCHENShu-guangLIJingZHANGTian-yuSchoolofEconomics,BeijingUniversity;SchoolofEconomicsandManagement,BeijingJiaotongUniversity;SchoolofManagement,Xi'AnUniversityofFinanc
3、eandEconomics;China(Xi'an)SilkRoadResearchInstitute;Abstract:Predictionisveryimportanttomanyareasofeconomy.Machinelearningisplayingakeyroleintheresearchofpredictionincreasingly.Bypredictingthepurchasebehaviorofusersine-commerce,weusetwoalgorithmsofmachinelearningtoconstructthefore
4、castingmodelanddiscusstheensemblemodelbasedontheabovethesetwoalgorithms,throughtherealshoppingdatafromAlibaba.Empiricalevidenceshowsthatthepredictionscoreoftheensemblemodelisbetterthananysinglemodel's.Keyword:machinelearning;fusionalgorithm;purchasebehavior;一、引言在經(jīng)濟(jì)社會發(fā)展的各個方面都需要進(jìn)行各類
5、問題的預(yù)測研宄。從宏觀整體上來看,如一個國家的宏觀經(jīng)濟(jì)預(yù)測,人口出生率預(yù)測;從微觀個體上來看,如一輛公交車的發(fā)動機(jī)故障率的預(yù)測,一家銀行客戶的信用評級預(yù)測,一只股票漲跌可能性的預(yù)測。尤其是當(dāng)前全球已進(jìn)入數(shù)字經(jīng)濟(jì)的時代,隨著存儲資源和計算資源成本的大幅下降和性能的大幅提升,各類數(shù)字技術(shù)如物聯(lián)網(wǎng)、云技術(shù)使得數(shù)據(jù)的采集、存儲、分析和共享變得愈加可行且易于進(jìn)行。經(jīng)濟(jì)社會屮的預(yù)測問題成為了學(xué)術(shù)界和工業(yè)界研宄和資源投放的熱點。預(yù)測在電子商務(wù)領(lǐng)域被更加廣泛深入地應(yīng)用。電商企業(yè)通過追蹤和分析用戶留在網(wǎng)站上的購物行為記錄,可以為每個用戶提供個性化的服務(wù),從而獲得較高的轉(zhuǎn)化率
6、并不斷吸引新用戶。通過預(yù)測分析發(fā)現(xiàn)用戶的行為特征、偏好與興趣,了解顧客的需求,實現(xiàn)精準(zhǔn)營銷,提高運營效率,以進(jìn)一步獲取老客戶的保有價值、新客戶的提升價值、潛在客戶的挖掘價值、競爭對手客戶的轉(zhuǎn)移價值、流失客戶的挽回價值。阿里巴巴的天貓商城“雙十一”銷售額從2009年的0.5億元開始,每年節(jié)節(jié)攀升,不斷刷新記錄,并于2016年突破1207億元。這與阿里在業(yè)務(wù)發(fā)展過程中高度重視分析挖掘消費者購物行為數(shù)據(jù)是密不可分的。電商在發(fā)展屮追求獲得更高的轉(zhuǎn)化率,即以可能把每一個訪問者轉(zhuǎn)化為購買者。阿里巴巴每年舉辦大數(shù)據(jù)競賽,讓參賽選手在阿里的開放數(shù)據(jù)集上設(shè)計、運行算法模型以
7、不斷解決轉(zhuǎn)化率問題。本文以該比賽為背景,嘗試通過機(jī)器學(xué)習(xí)的方法構(gòu)建預(yù)測消費者在線購物行為的融合算法模型,挖掘網(wǎng)絡(luò)購物行為數(shù)據(jù)背后的深層次關(guān)系,探討并分析使用融合算法構(gòu)建預(yù)測模型的優(yōu)勢和特點。二、研宄方法綜述目前,各種預(yù)測算法己被大量用于對廣告點擊率的預(yù)測。其中,SMC模型認(rèn)為每個消費者都具有購買率和流失率兩個互和獨立的特征變量,并且它們都服從gamma分布Ul。BG/NBD模型在客戶離開點上對SMC模型進(jìn)行了改進(jìn),其認(rèn)為客戶在某次交易后有可能立刻變得不活躍。這兩個模型關(guān)注消費者的購買率和流失率兩個隨機(jī)變量,使用顧客在一段時間的交易次數(shù)來表示顧客的活躍度從而
8、預(yù)測其未來交易的次數(shù)和每次交易的金額。國內(nèi)的相關(guān)研宄,如陳潔提出使