資源描述:
《基于模糊時(shí)間序列的車輛檢測器數(shù)據(jù)修補(bǔ)方法研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、基于模糊時(shí)間序列的車輛檢測器數(shù)據(jù)修補(bǔ)方法研究 摘要:車輛檢測器是交通管理中重要的數(shù)據(jù)采集工具,但在實(shí)際運(yùn)用過程中,數(shù)據(jù)丟失問題往往影響其作用的發(fā)揮。本研究旨在建立一個可實(shí)用于交通控制中心的車檢器缺失數(shù)據(jù)修補(bǔ)模型,嘗試以不同模型來預(yù)測并修補(bǔ)車輛檢測器缺失的數(shù)據(jù),并對比各種模型的修補(bǔ)效果。文中提出了以ARIMA結(jié)合模糊時(shí)間序列的交通流量預(yù)測方法以及使用ARIMA進(jìn)行短時(shí)間實(shí)時(shí)修補(bǔ)的方法,并獲得了不錯的效果。 關(guān)鍵詞:交通流量預(yù)測;ARIMA;模糊時(shí)間序列;車輛檢測器 中圖分類號:TP274文獻(xiàn)標(biāo)識碼:A文
2、章編號:2095-1302(2016)06-00-04 0引言 車輛檢測器是交通管理者掌握道路交通運(yùn)行狀況的重要工具。但是,在實(shí)際運(yùn)用過程中,車輛檢測器常因環(huán)境、維護(hù)、性能等原因發(fā)生數(shù)據(jù)丟失的現(xiàn)象。車輛檢測器數(shù)據(jù)的丟失使得基于其所產(chǎn)生的控制和決策方案產(chǎn)生偏差甚至失效,無法彰顯投資車輛檢測器的應(yīng)用價(jià)值。車檢器數(shù)據(jù)修補(bǔ)算法是輔助提高車檢器檢測穩(wěn)定性與準(zhǔn)確性的途徑之一。 本研究利用時(shí)間序列以及模糊時(shí)間序列的相關(guān)理論,根據(jù)交通流運(yùn)行特征在工作日和假日的差異將車檢器數(shù)據(jù)分成工作日和假日兩種模式進(jìn)行預(yù)測分析,使其
3、能夠?qū)Χ虝r(shí)間內(nèi)缺失的數(shù)據(jù)進(jìn)行及時(shí)修補(bǔ)。并對比時(shí)間序列以及模糊時(shí)間序列兩種方式進(jìn)行數(shù)據(jù)修復(fù)的效果差異。7 1模型建立 數(shù)據(jù)為西安繞城高速單臺車檢器2014年全年數(shù)據(jù),數(shù)據(jù)接收頻率為每5分鐘一次,理論上一天共288條數(shù)據(jù)記錄?! ?.1數(shù)據(jù)預(yù)處理 數(shù)據(jù)預(yù)處理分為如下幾項(xiàng): ?。?)首先將數(shù)據(jù)分為工作日和假日兩種模式,再分別以ARIMA、混合模式以及傳統(tǒng)平均法進(jìn)行修補(bǔ)效率的比較?! 。?)因車檢器數(shù)據(jù)常發(fā)生缺漏和異常值,本研究采用6sigma理論對數(shù)據(jù)進(jìn)行離群值判定,即先計(jì)算同一模式(工作日、假日模式)下同
4、一時(shí)刻流量均值,將平均值正負(fù)6倍標(biāo)準(zhǔn)差范圍外的流量數(shù)據(jù)判為異常值?! 。?)本研究將進(jìn)行ARIMA即時(shí)動態(tài)修補(bǔ),以t-1時(shí)數(shù)據(jù)來預(yù)測t時(shí)的流量,持續(xù)驗(yàn)證峰值1小時(shí)內(nèi)12條記錄并計(jì)算絕對平均誤差(MAPE)。 ?。?)本研究所使用的ARIMA模型由SPSS18.0建立,模糊時(shí)間序列由Matlab編寫而成?! 。?)模型以2/3的真實(shí)數(shù)據(jù)來建立(采用車檢器2014年1~9月數(shù)據(jù),剩下10~12月數(shù)據(jù)用來驗(yàn)證模式的準(zhǔn)確性)?! ?.2ARIMA的建立 本研究使用SPSS18.0的ARIMA預(yù)測模型,將西安繞城高
5、速車檢器2014年1月1日至8月31日的流量數(shù)據(jù)切分為工作日與假日兩種模式,具體研究步驟如下: ?。?)利用自相關(guān)圖(ACF)來判斷是否為平穩(wěn)數(shù)列?! 。?)圖71所示為工作日模式下交通流量的自相關(guān)圖,由圖可見,滯后階數(shù)為5時(shí),才進(jìn)入置信界內(nèi),表示流量數(shù)據(jù)并非為一個平穩(wěn)的時(shí)間序列,需要對數(shù)據(jù)進(jìn)行差分處理?! D2所示為假日模式下交通流量的自相關(guān)圖,在其滯后階數(shù)為7時(shí)才進(jìn)入了置信界限內(nèi),數(shù)據(jù)亦需要差分處理。具體操作如下: (1)使用SPSS18.0中的ExpertModeler選出最佳ARIMA(p,d,q
6、)模型,工作日模式下的最佳ARIMA(p,d,q)模型為ARIMA(0,1,1),假日模式下的最佳模型是ARIMA(1,1,1)?! 。?)檢查模型的R2與MAPE值是否能夠充分解釋變異數(shù),BIC值是否最低并且殘差是否符合白噪聲的假設(shè)?! ∫勒战y(tǒng)計(jì)學(xué)的衡量標(biāo)準(zhǔn),MAPE值小于20%時(shí)為優(yōu)良的修補(bǔ)模型,而模型的BIC值則越小越好;R2表示模型的解釋程度,R2值越高則解釋變數(shù)的能力越高,表1所列為工作日模式的挑選準(zhǔn)則,可以看出由ExpertModeler所得的模型四項(xiàng)準(zhǔn)則皆為最優(yōu),比較的模型為符合殘差接收白噪聲
7、假設(shè)的模型,其MAPE值為16.91%(越低越好),是三個模型里最好的,R2=0.938是最高的,代表可解釋變數(shù)的程度最高,BIC值越小表示模型為最佳估計(jì)模型,其BIC值=4.92為三個模型中最低。而表2所示為假日模式的挑選準(zhǔn)則,同樣是由ExpertModeler挑選出最適模型為最優(yōu)模型,ARIMA(1,1,1)各個適合度指標(biāo)皆為最適,也都有符合殘差接收白噪聲,由此可知,可直接由ExpertModeler選取ARIMA的最適模型,不需要采用傳統(tǒng)的方式將所有模型進(jìn)行測試。7 將建立好的工作日與假日流量ARI
8、MA模型,選擇輸出一個完整日的流量數(shù)據(jù)來進(jìn)行實(shí)際驗(yàn)證。工作日模式下ARIMA預(yù)測結(jié)果如圖3所示。假日模式下ARIMA預(yù)測結(jié)果如圖4所示?! ?.3結(jié)合模糊時(shí)間序列的ARIMA模型 首先建立一個將max-min簡化的模糊時(shí)間序列模型,以車檢器數(shù)據(jù)中9月1日17:00至19:00每5min流量為例,預(yù)測一個小時(shí)的流量數(shù)據(jù)。示例流量數(shù)據(jù)表如表3所列?! 。?)將時(shí)間分為24個子集合(A1、A2、…、A24)并計(jì)算各個