基于機(jī)器學(xué)習(xí)融合算法的網(wǎng)絡(luò)購買行為預(yù)測研究

基于機(jī)器學(xué)習(xí)融合算法的網(wǎng)絡(luò)購買行為預(yù)測研究

ID:9129190

大?。?02.52 KB

頁數(shù):12頁

時間:2018-04-18

基于機(jī)器學(xué)習(xí)融合算法的網(wǎng)絡(luò)購買行為預(yù)測研究_第1頁
基于機(jī)器學(xué)習(xí)融合算法的網(wǎng)絡(luò)購買行為預(yù)測研究_第2頁
基于機(jī)器學(xué)習(xí)融合算法的網(wǎng)絡(luò)購買行為預(yù)測研究_第3頁
基于機(jī)器學(xué)習(xí)融合算法的網(wǎng)絡(luò)購買行為預(yù)測研究_第4頁
基于機(jī)器學(xué)習(xí)融合算法的網(wǎng)絡(luò)購買行為預(yù)測研究_第5頁
資源描述:

《基于機(jī)器學(xué)習(xí)融合算法的網(wǎng)絡(luò)購買行為預(yù)測研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。

1、基于機(jī)器學(xué)習(xí)融合算法的網(wǎng)絡(luò)購買行為預(yù)測研究纖陳樹廣繡張?zhí)煊畋本┐髮W(xué)經(jīng)濟(jì)學(xué)院安財經(jīng)學(xué)院管理學(xué)院中國(西安)絲綢之路研宄院選擇適合的機(jī)器學(xué)習(xí)算法是在社會經(jīng)濟(jì)研宄領(lǐng)域進(jìn)行大數(shù)據(jù)分析及提高預(yù)測效果的關(guān)鍵。在很多情況下,通過融合訓(xùn)練兩種或兩種以上有差異的算法,能夠顯著提高算法的泛化能力以提高預(yù)測效果?;诎⒗锇桶碗娮由虅?wù)平臺購物行為數(shù)據(jù),分別應(yīng)用Logistic回歸、支持向量機(jī)以及這兩種算法的融合構(gòu)建丫預(yù)測模型。實證結(jié)果表明,融合后模型比單一模型具備更好的預(yù)測效果。關(guān)鍵詞:機(jī)器學(xué)融合算法;購買行為;基金:中國(丙安)絲綢之路研究院科學(xué)研究項目《統(tǒng)計數(shù)據(jù)資源共享中元數(shù)

2、據(jù)管理體系研究》(2016syl8)ResearchonNetworkPurchaseBehaviorPredictionBasedonMachineLearningFusionAlgorithmZHUXinLIUXiao-manCHENShu-guangLIJingZHANGTian-yuSchoolofEconomics,BeijingUniversity;SchoolofEconomicsandManagement,BeijingJiaotongUniversity;SchoolofManagement,Xi'AnUniversityofFinanc

3、eandEconomics;China(Xi'an)SilkRoadResearchInstitute;Abstract:Predictionisveryimportanttomanyareasofeconomy.Machinelearningisplayingakeyroleintheresearchofpredictionincreasingly.Bypredictingthepurchasebehaviorofusersine-commerce,weusetwoalgorithmsofmachinelearningtoconstructthefore

4、castingmodelanddiscusstheensemblemodelbasedontheabovethesetwoalgorithms,throughtherealshoppingdatafromAlibaba.Empiricalevidenceshowsthatthepredictionscoreoftheensemblemodelisbetterthananysinglemodel's.Keyword:machinelearning;fusionalgorithm;purchasebehavior;一、引言在經(jīng)濟(jì)社會發(fā)展的各個方面都需要進(jìn)行各類

5、問題的預(yù)測研宄。從宏觀整體上來看,如一個國家的宏觀經(jīng)濟(jì)預(yù)測,人口出生率預(yù)測;從微觀個體上來看,如一輛公交車的發(fā)動機(jī)故障率的預(yù)測,一家銀行客戶的信用評級預(yù)測,一只股票漲跌可能性的預(yù)測。尤其是當(dāng)前全球已進(jìn)入數(shù)字經(jīng)濟(jì)的時代,隨著存儲資源和計算資源成本的大幅下降和性能的大幅提升,各類數(shù)字技術(shù)如物聯(lián)網(wǎng)、云技術(shù)使得數(shù)據(jù)的采集、存儲、分析和共享變得愈加可行且易于進(jìn)行。經(jīng)濟(jì)社會屮的預(yù)測問題成為了學(xué)術(shù)界和工業(yè)界研宄和資源投放的熱點。預(yù)測在電子商務(wù)領(lǐng)域被更加廣泛深入地應(yīng)用。電商企業(yè)通過追蹤和分析用戶留在網(wǎng)站上的購物行為記錄,可以為每個用戶提供個性化的服務(wù),從而獲得較高的轉(zhuǎn)化率

6、并不斷吸引新用戶。通過預(yù)測分析發(fā)現(xiàn)用戶的行為特征、偏好與興趣,了解顧客的需求,實現(xiàn)精準(zhǔn)營銷,提高運營效率,以進(jìn)一步獲取老客戶的保有價值、新客戶的提升價值、潛在客戶的挖掘價值、競爭對手客戶的轉(zhuǎn)移價值、流失客戶的挽回價值。阿里巴巴的天貓商城“雙十一”銷售額從2009年的0.5億元開始,每年節(jié)節(jié)攀升,不斷刷新記錄,并于2016年突破1207億元。這與阿里在業(yè)務(wù)發(fā)展過程中高度重視分析挖掘消費者購物行為數(shù)據(jù)是密不可分的。電商在發(fā)展屮追求獲得更高的轉(zhuǎn)化率,即以可能把每一個訪問者轉(zhuǎn)化為購買者。阿里巴巴每年舉辦大數(shù)據(jù)競賽,讓參賽選手在阿里的開放數(shù)據(jù)集上設(shè)計、運行算法模型以

7、不斷解決轉(zhuǎn)化率問題。本文以該比賽為背景,嘗試通過機(jī)器學(xué)習(xí)的方法構(gòu)建預(yù)測消費者在線購物行為的融合算法模型,挖掘網(wǎng)絡(luò)購物行為數(shù)據(jù)背后的深層次關(guān)系,探討并分析使用融合算法構(gòu)建預(yù)測模型的優(yōu)勢和特點。二、研宄方法綜述目前,各種預(yù)測算法己被大量用于對廣告點擊率的預(yù)測。其中,SMC模型認(rèn)為每個消費者都具有購買率和流失率兩個互和獨立的特征變量,并且它們都服從gamma分布Ul。BG/NBD模型在客戶離開點上對SMC模型進(jìn)行了改進(jìn),其認(rèn)為客戶在某次交易后有可能立刻變得不活躍。這兩個模型關(guān)注消費者的購買率和流失率兩個隨機(jī)變量,使用顧客在一段時間的交易次數(shù)來表示顧客的活躍度從而

8、預(yù)測其未來交易的次數(shù)和每次交易的金額。國內(nèi)的相關(guān)研宄,如陳潔提出使

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。