資源描述:
《基于改進(jìn)k-means算法的交叉口影響路段行程速度估計》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、基于改進(jìn)K-Means算法的交叉口影響路段行程速度估計錢蕾韓印姚佼上海理工大學(xué)管理學(xué)院棊于低頻、低覆蓋率、數(shù)據(jù)來源多樣的GPS浮動車數(shù)據(jù),在現(xiàn)有數(shù)據(jù)預(yù)處理方法的基礎(chǔ)上,以交叉口影響路段數(shù)據(jù)點(diǎn)為研宂對象,研宂出更合理且準(zhǔn)確獲得交通參數(shù)的技術(shù)方案。GPS浮動車數(shù)據(jù)由于其具有全天候、多覆蓋等特性,能夠?qū)崟r監(jiān)測交通參數(shù),估計交通狀態(tài)。為克服數(shù)據(jù)木身缺陷,使數(shù)據(jù)能有效利用,精確得到交通參數(shù),本研宄獲取短時內(nèi)路段所有數(shù)據(jù)點(diǎn)代表整體狀態(tài)。首先基于數(shù)據(jù)的特性和在路段分布的節(jié)律,利用曲線擬合及拉格朗口屮值定理確定交叉門的影響范圍;其次在該范圍內(nèi)利用
2、改進(jìn)K-Means聚類方法,確定初始聚類中心,并以有效性指數(shù)作為優(yōu)化目標(biāo)確定聚類數(shù);在此基礎(chǔ)上分配權(quán)重,結(jié)合交叉口影響范圍外的數(shù)據(jù)點(diǎn),對整個交叉口影響路段的行程速度進(jìn)行估計。用杭州市局部路網(wǎng)中GPS數(shù)據(jù)進(jìn)行案例分析,驗(yàn)證技術(shù)方案。通過實(shí)地調(diào)查獲取實(shí)驗(yàn)真實(shí)值,分別討論了在主、次干路路段本方案估計差異,并與傳統(tǒng)模型進(jìn)行了對比分析。分析表明,該方法得到的路段行程速度估計值與真實(shí)值較為接近,誤差較小,在城市主干路和次干路中的誤差分別為4.1%和9.5%,比傳統(tǒng)模型誤差更小更穩(wěn)定,能較好地滿足城市智能交通控制系統(tǒng)對于交通參數(shù)的精度要求。關(guān)鍵
3、詞:交通工程;路段行程速度;K-Means聚類;低頻浮動車數(shù)據(jù);聚類有效性指數(shù);其中,低頻浮動車數(shù)據(jù)分析是在交通大數(shù)據(jù)背景下重要的微觀小樣本機(jī)理分析,與交通大數(shù)據(jù)態(tài)勢分析相互嵌套m。雖然采樣頻率較低,但是由于浮動車數(shù)量大和不間斷運(yùn)營,能在滿足對車輛安全監(jiān)控、對數(shù)據(jù)存儲成本降低的同時,進(jìn)行城市路網(wǎng)中全天時天候的信息采集。在交通信息中,路段平均行程速度是路段交通狀態(tài)判定的重要指標(biāo),更是整個智能交通系統(tǒng)中重要的基礎(chǔ)參數(shù)。基于浮動車數(shù)據(jù),在道路參數(shù)估計方面如路段平均行程速度的估計一直不乏研究者探討。傳統(tǒng)的對浮動車數(shù)據(jù)的處理研宂多針對理想的
4、高頻采樣數(shù)據(jù),或僅對車列數(shù)據(jù)進(jìn)行處理[2-10],運(yùn)用的方法有:均值法、積分模型法、神經(jīng)網(wǎng)絡(luò)、模糊推理等方法。積分模型法研究較多,分為速度-時間積分模型和坐標(biāo)-時間內(nèi)插模型[5-6]。隨著人工智能算法的應(yīng)用,對單一浮動車交通參數(shù)估計出現(xiàn)了利用BP神經(jīng)網(wǎng)絡(luò)、模糊推理M等方法。但是,高頻數(shù)據(jù)不易得到;而II盡管為高頻數(shù)據(jù),但在單列數(shù)據(jù)點(diǎn)屮仍存在著需要分類討論匹配后的數(shù)據(jù)點(diǎn)個數(shù)、位置與不同交叉口路段的兒何關(guān)系,需要考慮的情形多且易疏漏。近些年,隨著大數(shù)據(jù)的研宄與應(yīng)用,聚類分析在決策精細(xì)化中越來越重要。短時交通流通常研宄在5~30min內(nèi)
5、交通流狀態(tài)的變化情況UU,應(yīng)用聚類方法對短時交通流中的浮動車數(shù)據(jù)提取交通參數(shù),更為貼近實(shí)際交通情況[12-15],而H浮動車的數(shù)據(jù)點(diǎn)數(shù)量大大增加更有利于聚類分析:把雜亂的數(shù)據(jù)點(diǎn)集分組為由類似的對象組成的多個類,可以使數(shù)據(jù)更具代表性,更好地利用數(shù)據(jù)特征,更及時準(zhǔn)確地表征短時交通狀態(tài)。但目前研究中處理浮動車數(shù)據(jù)時較少考慮不同聚類算法存在的弊端,較少把路段交通特征和數(shù)據(jù)點(diǎn)特征結(jié)合起來。因此本研宄沿用短時交通流背景下的聚類分析處理,并加以改進(jìn)。以短時間(5min)為研究單位,對短時內(nèi)所有有效數(shù)據(jù)點(diǎn)進(jìn)行累積曲線擬合后聚類處理,成為能快速準(zhǔn)確
6、計算出實(shí)時路段行程速度的方法。在聚類分析時,考慮初始聚類中心重耍性、聚類有效性評價、聚類個數(shù)的最優(yōu)選取等問題進(jìn)行研究。最后,以杭州城市交通為例,利用低頻采樣(^30s)的混合車輛(能釆集到GPS數(shù)據(jù)的所有車輛,以出祖車為主,包括公交車、客貨運(yùn)車以及部分私人小汽車)浮動車數(shù)據(jù)進(jìn)行試驗(yàn)驗(yàn)證。1交叉口影響路段中交叉口多響范交叉UI影響路段,如圖1所示,通過路段劃分和子路段劃分后II虹,大多數(shù)路段都受到交叉口上游的影響,車輛行駛過程中表現(xiàn)出來“平穩(wěn)行駛-交叉口排隊(duì)”節(jié)律,故把交叉門影響路段劃分為交叉門影響范圍和平穩(wěn)行駛范圍。并對5min內(nèi)
7、所有數(shù)據(jù)點(diǎn)進(jìn)行地閣匹配。從中不難看出,對于數(shù)據(jù)點(diǎn)的數(shù)量和密度,在交義口影響范圍內(nèi)明顯大于不受影響的車輛平穩(wěn)行駛范圍。以距交叉口的距離為x軸,自交叉U附近第一個數(shù)據(jù)點(diǎn)算起的數(shù)據(jù)點(diǎn)累積數(shù)量為y軸建立路段數(shù)據(jù)累積圖(如圖2所示),更為直觀體現(xiàn)該規(guī)律。另外,通過觀察數(shù)據(jù)集瞬吋速度發(fā)現(xiàn),在車輛平穩(wěn)行駛范圍內(nèi)數(shù)據(jù)點(diǎn)較少但是和對穩(wěn)定,但在交義口影響范圍內(nèi),受交叉U信控的影響,GPS返回的瞬時速度變化很大,經(jīng)常出現(xiàn)速度為0的情況,數(shù)據(jù)點(diǎn)多而復(fù)雜,需要對其進(jìn)行聚類處理。圖1交叉口上游影響范圍示意圖圖Fig.1Influencingrangeofin
8、tersectionupstream在聚類處理之前,首先要確定交叉U影響的具體范圍長度:利用樣木數(shù)據(jù)特性,通過浮動車數(shù)據(jù)量隨距離的累積過程,用TBMSPSS22.0數(shù)據(jù)分析軟件中幾種常用擬合模型UZ1分別擬合后發(fā)現(xiàn)擬合效果最好的模型。經(jīng)過多個交叉門