資源描述:
《云計(jì)算環(huán)境下物流路徑數(shù)據(jù)挖掘研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、云計(jì)算環(huán)境下物流路徑數(shù)據(jù)挖掘研究DataMiningofLogisticalPathundertheCloudComputing1n●EnVlrOnment2013年4月合肥工業(yè)大學(xué)本論文經(jīng)答辯委員會(huì)全體委員審查,確認(rèn)符合合肥工業(yè)大學(xué)碩士學(xué)位論文質(zhì)量要求。答辯委員會(huì)簽名:(工作單位、職稱)主席:j;沙中(日哳極乞}翻缸殷委貝[c:zl:書域吳鋌兮肥L業(yè)大孚酬數(shù)櫪愛暉導(dǎo)師:鉚巴礎(chǔ)戈皆引杈掘明∥0獨(dú)創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。據(jù)我所知,除了文中特別
2、加以標(biāo)志和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過(guò)的研究成果,也不包含為獲得金目曼王些太堂或其他教育機(jī)構(gòu)的學(xué)位或證書而使用過(guò)的材料。與我一同工作的同志對(duì)本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說(shuō)明并表示謝意。學(xué)位論文作者簽字:何袖襄簽字日期:加圬年甲月刁日學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解金g巴王些太堂有關(guān)保留、使用學(xué)位論文的規(guī)定,有權(quán)保留并向國(guó)家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和磁盤,允許論文被查閱或借閱。本人授權(quán)金月曼王些厶堂可以將學(xué)位論文的全部或部分論文內(nèi)容編入有關(guān)數(shù)據(jù)庫(kù)進(jìn)
3、行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。(保密的學(xué)位論文在解密后適用本授權(quán)書)學(xué)位論文作者簽名l何栩燙簽字日期:2。7;年十fiJ刁日學(xué)位論文作者畢業(yè)后去向:工作單位:通訊地址:?名:印丑記簽字日期.≯f;年。月刁日電話:郵編:云計(jì)算環(huán)境下物流路徑數(shù)據(jù)挖掘研究摘要隨著企業(yè)物流信息化水平不斷提高,互聯(lián)網(wǎng)的普遍運(yùn)用,產(chǎn)生了海量的物流數(shù)據(jù),大量的數(shù)據(jù)中隱藏著重要的信息。為了提高企業(yè)的核心競(jìng)爭(zhēng)力,給客戶提供更優(yōu)質(zhì)的物流服務(wù),物流企業(yè)需要不斷提高決策效率,因此如何從大量的物流數(shù)據(jù)中獲取
4、有價(jià)值的信息,輔助企業(yè)日常經(jīng)營(yíng)活動(dòng)中的決策,成為企業(yè)面臨的一個(gè)重要問(wèn)題。通過(guò)對(duì)物流的路徑數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘分析,發(fā)現(xiàn)頻繁移動(dòng)的路徑模式,從而獲取關(guān)于貨物流向的知識(shí),預(yù)測(cè)貨物的移動(dòng)信息,找出異常的移動(dòng)貨物。通過(guò)頻繁的路徑模式,還可以深入了解物品在移動(dòng)過(guò)程中的詳細(xì)情況,以及這些頻繁的路徑隱含著的一些移動(dòng)趨勢(shì)信息。通過(guò)發(fā)現(xiàn)的頻繁路徑模式,可以為企業(yè)物流業(yè)務(wù)經(jīng)營(yíng)提供有力的決策支持,從而優(yōu)化物流環(huán)節(jié),從而降低整個(gè)物流成本。本文在系統(tǒng)的介紹了數(shù)據(jù)挖掘、云計(jì)算和物流路徑相關(guān)理論基礎(chǔ)上,闡述了物流路徑頻繁模式挖掘理
5、論知識(shí),并針對(duì)物流路徑數(shù)據(jù)特點(diǎn),采用云計(jì)算的MapReduce模型對(duì)數(shù)據(jù)挖掘的序列模式基本算法進(jìn)行并行化改進(jìn),最后用改進(jìn)的算法對(duì)物流路徑進(jìn)行挖掘分析,發(fā)現(xiàn)頻繁路徑模式。在相關(guān)研究理論的基礎(chǔ)上,本文首先對(duì)物流路徑頻繁模式挖掘進(jìn)行了相關(guān)研究。先闡述了物流路徑頻繁模式應(yīng)用,接著,由于物流路徑是一種序列數(shù)據(jù),參考序列模式的相關(guān)定義,定義了物流路徑頻繁模式挖掘的相關(guān)概念,并采用序列模式挖掘算法中的基于Apriori思想的算法發(fā)現(xiàn)物流路徑頻繁模式。接著針對(duì)物流路徑數(shù)據(jù)的特點(diǎn),采用了MapReduce并行計(jì)算模
6、型,對(duì)序列模式挖掘的基本算法AprioriAll進(jìn)行改進(jìn)。由于基于Apriori思想的序列模式挖掘算法對(duì)物流路徑數(shù)據(jù)進(jìn)行分析時(shí),需要多次掃描數(shù)據(jù)庫(kù),并且會(huì)產(chǎn)生大量無(wú)用的候選序列,當(dāng)數(shù)據(jù)量很大時(shí),會(huì)占用大量的計(jì)算資源。MapReduce是云計(jì)算環(huán)境的并行計(jì)算模型,本文將序列模式挖掘的算進(jìn)進(jìn)行并行化改進(jìn),使之能適用于MapReduce計(jì)算模型。最后將改進(jìn)的算法用于物流路徑頻繁模式發(fā)現(xiàn),研究結(jié)果表明本文的研究思想是可行的。關(guān)鍵詞:物流路徑;云計(jì)算;數(shù)據(jù)挖掘;序列模式DataMiningofLogisti
7、calPathundertheCloudComputingEnvironmentABSTRACTWiththeimprovementoftheenterprise’slogisticsinformationtechnologyandthewidespreaduseoftheInternet,amassivelogisticsdatahasbeenproduced,andthereisimportantinformationhiddeninthedata.Inordertoimprovethecor
8、ecompetitivenessandtoprovidecustomerswithmorequalitylogisticsservices,thelogisticsenterpriseneedtoconstantlyimprovetheefficiencyofdecision‘making,SOhowtoobtainvaluableinformationfromalargenumberoflogisticsdatatosupportthedailydecision—makingbe