資源描述:
《基于時間序列的網(wǎng)約車在線司機(jī)與乘客發(fā)單的供需預(yù)測》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、分類號學(xué)號M201676155學(xué)校代碼10487密級碩士學(xué)位論文基于時間序列的網(wǎng)約車在線司機(jī)與乘客發(fā)單的供需預(yù)測學(xué)位申請人:朱本常學(xué)科專業(yè):軟件工程指導(dǎo)教師:沈剛教授答辯日期:2018.12.27AThesisSubmittedinPartialFulfillmentoftheRequirementsfortheDegreefortheMasterofEngineeringSupplyandDemandForecastofOnlineDriverandPassengerBillingBasedonTimeSeriesCandidate:ZhuBenchangMajor:Softwar
2、eEngineeringSupervisor:Prof.ShenGangHuazhongUniversityofScience&TechnologyWuhan430074,P.R.ChinaDecember,2018華中科技大學(xué)碩士學(xué)位論文摘要隨著移動互聯(lián)網(wǎng)的興起,網(wǎng)約車應(yīng)運(yùn)而生。在網(wǎng)約車的業(yè)務(wù)場景里面,特定城市的不同區(qū)域的在線司機(jī)數(shù)差異很大,乘客發(fā)單量差異也很大。為了解決區(qū)域之間供需不平衡的問題,首先就要對每個區(qū)域的供需比有一個準(zhǔn)確的預(yù)測。而特定區(qū)域的供需比隨時間變化而變化,與很多外界因數(shù)相關(guān),具有周期性,且會因?yàn)楣?jié)假日、惡劣天氣等極端事件使得序列出現(xiàn)異常值。用傳統(tǒng)的三階指數(shù)平滑處
3、理時不能很好的對異常點(diǎn)做出預(yù)測。因此兼顧極端事件的發(fā)單量和接單量的預(yù)測具有重大的意義。傳統(tǒng)的機(jī)器學(xué)習(xí)模型和循環(huán)神經(jīng)網(wǎng)絡(luò)在時間序列預(yù)測的研究方面都取得了一定的成果。本文基于這兩個方向,結(jié)合具體的業(yè)務(wù)背景設(shè)計(jì)出了一種組合預(yù)測模型,并且相對現(xiàn)存的方法取得了很大提高。首先我們獲取多個城市多個區(qū)域在不同時間點(diǎn)的供需比以及區(qū)域位置,天氣等的歷史信息。并對相應(yīng)特征做了異常值處理、歸一化、one-hot、連續(xù)特征離散化等初級處理。然后對處理后的特征分別用兩種方案做進(jìn)一步的處理。方案一中,我們分別把供需比序列輸入到三階指數(shù)平滑和一階指數(shù)平滑的holt-winter模型里,分別求解模型參數(shù)。然后把兩個模
4、型線性加權(quán)的結(jié)果作為一個最終特征。方案二中,我們首先把包含區(qū)域特征、天氣特征、節(jié)氣特征、窗口序列特征等的數(shù)據(jù)整合成[batch,sequence,feature]的形式,把整合的數(shù)據(jù)同時作為輸入和輸出去訓(xùn)練一個由五層LSTM構(gòu)成的自編碼器。LSTM包括輸入門、輸出門和遺忘門。通過前向和后向傳播算法迭代到參數(shù)收斂得到最佳模型。然后取模型的編碼器部分對序列特征進(jìn)行編碼,并把編碼器的輸出作為最終的多個特征。把前面兩個方案輸出的數(shù)據(jù)concat成完整向量,再聯(lián)合其他特征,一起輸入到xgboost模型,并迭代得到最終的模型參數(shù)。最后,在測試集上用smape指標(biāo)度量模型對供需的預(yù)測效果。采集前后
5、幾個月關(guān)于供需的所有數(shù)據(jù),輸入到上述模型,并訓(xùn)練模型到參數(shù)收斂。實(shí)驗(yàn)結(jié)果表明,通過把一階指數(shù)平滑和三階指數(shù)平滑做加權(quán)平均,且融合自編碼器,并結(jié)合xgboost做預(yù)測的方法。比之前傳統(tǒng)單一的時間序列預(yù)測方法有了顯著提高。關(guān)鍵詞:時間序列供需預(yù)測指數(shù)平滑xgboost長短時間記憶I華中科技大學(xué)碩士學(xué)位論文AbstractWiththeriseofthemobileInternet,thenetworkcarcameintobeing.Inthebusinessscenarioofthenetworkcar,thenumberofonlinedriversindifferentareaso
6、faparticularcityvariesgreatly,andtheamountofpassengersissuedisalsoverydifferent.Inordertosolvetheproblemofimbalancebetweensupplyanddemandbetweenregions,itisfirstnecessarytohaveanaccuratepredictionofthesupply-demandratioofeachregion.Thesupply-demandratioofaparticularareachangeswithtime,isrelated
7、tomanyexternalfactors,hasperiodicity,andcausesabnormalvaluesinthesequenceduetoextremeeventssuchasholidaysandbadweather.Whenusingthetraditionalthird-orderexponentialsmoothing,theabnormalpointsarenotwellpredicted.Therefore,itisofgre