資源描述:
《基于網(wǎng)絡(luò)搜索量的世園會(huì)客流量預(yù)測(cè)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、基于網(wǎng)絡(luò)搜索量的世園會(huì)客流量預(yù)測(cè)[]信息技術(shù)的飛速發(fā)展,X絡(luò)已經(jīng)深入到人們生活中的每個(gè)角落,各大搜索引擎記錄了數(shù)以億計(jì)的搜索關(guān)注和需求,隱含了大量的有價(jià)值的信息和數(shù)據(jù)。本文以世園會(huì)為例,充分挖掘X絡(luò)搜索數(shù)據(jù),揭示了X絡(luò)搜索和世園會(huì)客流量之間存在的關(guān)系。以西安世園會(huì)為實(shí)例,建立回歸模型,運(yùn)用EvieetricsVieeseries)以及橫截面數(shù)據(jù)(cross-sectionaldata)分析。EVie-Pesaran-Shin,F(xiàn)isher和[]信息技術(shù)的飛速發(fā)展,X絡(luò)已經(jīng)深入到人們生活中的每個(gè)角落,各大搜索引擎記錄了數(shù)以億計(jì)的搜索關(guān)注和需求,隱含了大量的有價(jià)值
2、的信息和數(shù)據(jù)。本文以世園會(huì)為例,充分挖掘X絡(luò)搜索數(shù)據(jù),揭示了X絡(luò)搜索和世園會(huì)客流量之間存在的關(guān)系。以西安世園會(huì)為實(shí)例,建立回歸模型,運(yùn)用EvieetricsVieeseries)以及橫截面數(shù)據(jù)(cross-sectionaldata)分析。EVie-Pesaran-Shin,F(xiàn)isher和Hadri),協(xié)整檢驗(yàn)(帶有MacKinnon-Haug-Michelis關(guān)鍵值和p值),因果關(guān)系檢驗(yàn),自相關(guān)和部分自相關(guān)函數(shù),Q統(tǒng)計(jì)和互相關(guān)函數(shù)。與其他統(tǒng)計(jì)軟件(如Excel、SAS、SPSS)相比,EvieentedDickey-Fullertest(增項(xiàng)DF單位根檢驗(yàn))
3、進(jìn)行檢驗(yàn),判斷是否平穩(wěn)的標(biāo)準(zhǔn)是檢驗(yàn)統(tǒng)計(jì)量大于臨界值則拒絕原假設(shè),即序列式不平穩(wěn);反之,序列式平穩(wěn)。通過(guò)平穩(wěn)性檢驗(yàn),得出各關(guān)鍵詞組成的時(shí)間序列二階差分在各個(gè)顯著性水平下都是平穩(wěn)的,結(jié)果如表3所示?! ?.4回歸模型的建立和協(xié)整檢驗(yàn) 根據(jù)以上分析,確定出可以用于模型建立的關(guān)鍵詞,運(yùn)用Eviews用最小二乘法建立回歸模型,得出因變量系數(shù)、殘差以及殘差和真實(shí)數(shù)據(jù)之間的關(guān)系圖,由于自變量較多、各自變量的系數(shù)也較大,具體的回歸模型用圖2顯示;圖3為所建模型與世園會(huì)真實(shí)客流量之間的擬合關(guān)系圖。 由上可知,所建模型的擬合度是88%,具有較高的準(zhǔn)確度,可以用于預(yù)測(cè)。為了使模
4、型更具有說(shuō)服力,驗(yàn)證因變量和自變量之間具有長(zhǎng)期穩(wěn)定性,即協(xié)整性檢驗(yàn),具體方法是檢驗(yàn)回歸方程的殘差是否平穩(wěn)序列,如果是平穩(wěn)序列則說(shuō)明是具有長(zhǎng)期穩(wěn)定性;反之則沒(méi)有,結(jié)果如表4所示?! ∮杀?分析可知?dú)埐钍瞧椒€(wěn)序列,所以存在協(xié)整關(guān)系?! ?.5模型預(yù)測(cè) 青島世園會(huì)與西安世園會(huì)的相似之處: ?。?)級(jí)別都是A2+B1。 ?。?)在第六次人口普查時(shí),青島常住人口871.51萬(wàn),西安常住人口846.78萬(wàn),常住人口數(shù)量基本持平?! 。?)西安的景點(diǎn)共有20處,青島的景點(diǎn)共有16處,在總數(shù)上接近?! 。?)2011年西安GDP3864.21億元人民幣,常住人口846萬(wàn),人
5、均GDP:45676.24元人民幣;青島GDP5666億元,常住人口872萬(wàn),人均GDP:64977元人民幣。 綜上所述,西安和青島都是旅游城市,人口數(shù)量,經(jīng)濟(jì)發(fā)展總量基本相當(dāng),世園會(huì)級(jí)別相同。因此,可以把上面建立的模型用于青島世園會(huì)的客流量預(yù)測(cè)。具體的方法是:找到與西安世園會(huì)相類似的關(guān)鍵詞,比如用青島代替西安、棧橋代替兵馬俑、青島天氣代替西安天氣等,把這些與青島有關(guān)的關(guān)鍵詞的搜索量作為模型中相對(duì)應(yīng)的自變量的數(shù)值,代入模型求值即可得出搜索量一定時(shí)青島世園會(huì)的客流量?! ?結(jié)論 本文提出了一種基于X絡(luò)搜索數(shù)據(jù)進(jìn)行青島世園會(huì)客流量預(yù)測(cè)模型,根據(jù)西安和青島兩個(gè)城
6、市的諸多相似之處,通過(guò)使用西安世園會(huì)的數(shù)據(jù)進(jìn)行實(shí)例驗(yàn)證,把建立好的模型用于青島世園會(huì)的預(yù)測(cè)。該模型采用X絡(luò)數(shù)據(jù)作為分析的依據(jù),避免了傳統(tǒng)數(shù)據(jù)的弊端,同時(shí)使用簡(jiǎn)單的回歸模型,避免了灰色理論、神經(jīng)X絡(luò)等方法的繁瑣的計(jì)算,取得了較高的擬合度和準(zhǔn)確度。另外,該方法具有較高的時(shí)效性,能夠更早地被相關(guān)的人員利用,提早為各項(xiàng)工作做好準(zhǔn)備?! ≈饕?/p>