資源描述:
《基于分布式爬蟲的云健康資訊平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、密級(jí):碩士學(xué)位論文基于分布式爬蟲的云健康資訊平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)作者姓名:向中希指導(dǎo)教師:陶耀東研究員中國科學(xué)院沈陽計(jì)算技術(shù)研究所學(xué)位類別:工學(xué)碩士學(xué)科專業(yè):計(jì)算機(jī)科學(xué)與技術(shù)培養(yǎng)單位:中國科學(xué)院沈陽計(jì)算技術(shù)研究所2016年4月DesignandImplementationofHealthInformationPlatformBasedonDistributedCrawlerByZhongxiXiangADissertationSubmittedtoUniversityofChineseAcademyofScien
2、cesInpartialfulfillmentoftherequirementForthedegreeofMasterofComputerScienceandTechnologyShenyangInstituteofComputingTechnology,ChineseAcademyofSciencesApril,2016獨(dú)創(chuàng)性聲明本人鄭重聲明:所提交的學(xué)位論文,是本人在指導(dǎo)教師的指導(dǎo)下,獨(dú)立進(jìn)行研究工作所取得的研究成果。盡我所知,文中除特別標(biāo)注和致謝的地方外,學(xué)位論文中不包含其他人或集體已經(jīng)發(fā)表或撰寫過的
3、研究成果,也不包含為獲得中國科學(xué)院大學(xué)或其它教育機(jī)構(gòu)的學(xué)位或證書所使用過的材料。對(duì)本文的研究做出重要貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。本人完全意識(shí)到本聲明的法律結(jié)果由本人承擔(dān)。簽名:日期:關(guān)于學(xué)位論文使用授權(quán)的說明本人完全了解中國科學(xué)院大學(xué)有關(guān)保管、使用學(xué)位論文的規(guī)定,其中包括:①學(xué)校有權(quán)保管、并向有關(guān)部門送交學(xué)位論文的原件與復(fù)印件;②學(xué)??梢圆捎糜坝?、縮印或其它復(fù)制手段復(fù)制并保存學(xué)位論文;③學(xué)??稍试S學(xué)位論文被查閱或借閱;④學(xué)校可以公布學(xué)位論文的全部或部分內(nèi)容。(涉密的學(xué)位論文在解密后應(yīng)遵守此規(guī)
4、定)簽名:導(dǎo)師簽名:日期:摘要摘要借助移動(dòng)互聯(lián)網(wǎng)的迅速普及與云計(jì)算技術(shù)的迅猛發(fā)展,云健康理念于2009年被提出。它指的是在醫(yī)療專家、機(jī)構(gòu)、廠商的協(xié)助下,以物聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)為載體,利用云計(jì)算、云存儲(chǔ)、云服務(wù)等手段,為醫(yī)療患者和健康需求用戶提供健康管理和疾病診療等服務(wù)和設(shè)備上的支持。本文依托已有的中科慧康云健康平臺(tái),通過分布式爬蟲采集互聯(lián)網(wǎng)上的健康資訊,給該平臺(tái)的2萬多用戶提供最新的健康資訊信息服務(wù)。本文實(shí)現(xiàn)的基于分布式爬蟲的健康資訊平臺(tái)主要分為兩個(gè)部分,一部分是分布式爬蟲采集信息,通過調(diào)研主要的分布式爬蟲的
5、架構(gòu),借鑒對(duì)等網(wǎng)絡(luò)(Peer2Peer)的思想,改進(jìn)Kademlia協(xié)議,最終設(shè)計(jì)并實(shí)現(xiàn)了一種去中心化的全分布式架構(gòu)的爬蟲;另一部分是將分布式爬蟲采集到的信息通過提供統(tǒng)一的API接口的方式實(shí)現(xiàn)在Web端和移動(dòng)端的健康資訊的瀏覽。經(jīng)過實(shí)際實(shí)驗(yàn)檢驗(yàn),本文提出的分布式爬蟲架構(gòu)能夠有效的避免以往的主從式架構(gòu)局部負(fù)載高、擴(kuò)展相對(duì)困難、廣域網(wǎng)成本高等問題,具備較好的擴(kuò)展能力和較高的容錯(cuò)能力,能夠?yàn)閯e的分布式系統(tǒng)提供新的思路?!娟P(guān)鍵詞】云健康分布式爬蟲去中心化Kademlia協(xié)議I基于分布式爬蟲的云健康資訊平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)
6、ABSTRACTWiththepopularityofmobileInternetandcloudcomputingtechnology,cloud-basedhealthcarehasbeenproposedin2009,itusestechnologiessuchascloudcomputing,cloudstorage,cloudservices,networking,mobileInternet,alongwiththeassistfrommedicalinstitutions,experts,me
7、dicalresearchinstitutions,medicalmanufacturerstoprovidereal-time,on-line,latestbodydatacollection,healthmanagement,diseasetreatment,diseasediagnosisandothermedicalservicesanddataacquisitionequipmentformedicalpatientsorpeoplewithsimilarneeds.RelyingontheZho
8、ngKeHuiKanghealthcareplatform,thispaperaimstodevelopasystemthatcollectshealthinformationontheInternetthroughadistributedcrawlerandprovidethelatesthealthnewsandinformationformorethan20,000usersontheplatform.Im