資源描述:
《基于Hadoop2.0的數(shù)據(jù)挖掘算法并行化研究.pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、..?,:一:::?、:3V.〕.:、,:V*:.?V,m臂:-,:£f&-.等;p¥J.,?p/,..t%,,■.<j:.,^x、..^/-r^,.i-翁-:-等.:\0.v,...:.::.-:^馬i’:一Y/?■l?>.:--u上^知我.l:.^:.1-’秘J代y:.費(fèi)-^.,g:奶\v..vc‘-lr:v_,.:.ir.;士^文.:)廣v、v,/:.-."■H.,^七..“:/::?;._、^”;暴r”..】..l:‘二,y,..、V#囊:5_-i-Vi.4、"^‘;H_■■;r"」丨:
2、:..,"..,:S于H^ooi&.■的撤家e?.^^:卞-〕xr”.并七研::/.、讀f"'一,.:-私"f、"■1..-各-i-,、、:■:;,:-:,|.,、In.幾...^^x.士.^“,,M.i3v‘.善..免,“^I^.;f,,-..:^管J/if3rt..V.■.?。ⅲ?、.:-.&...?.,.,.-::■,:\.u.?|/(r:,#::‘.;,,.,..y::.:、“‘?:viA義.…■.v二.;‘^?、碎..\:::,.-w:s.:_.、>i纖
3、二.*.Mr:,k..:T..1讀.>7^錢.fM-^Hx'M.:.5l/Sr::l%T:;參...v.v(f.;、/.」.>d4,r£.■.-.梟,藝■?>?。骸桑牐牐牐?、■;”:/J、',;v、...』資,;;.餐.s:”、.:f,■’■::.c沒,:-I.v.歲、T,-、.,1,..卞:-德.4、f、/...,廣、.VK樓,二....?k”.i.:■:ki/f.、r/V,'‘rA.f澤.‘*在f-/”:.:.,...s.■iil、1l/f3,:>^lI,
4、B./--.,。vt〈l”./,.¥:fi5>.r.辨“:五,:M^.h■:.:.n..^?l、,?...■■K■i..f.’.:S,上.:::一,..l權(quán)x.:..K、■s「.p‘-l?.:麟.、—.VJ廠..“...s“‘。:i:v”土.、1.(.T..”一"l,.,纖>aki::_)分類號(hào):學(xué)校代號(hào):11845UDC:密級(jí):學(xué)號(hào):2111204201廣東工業(yè)大學(xué)碩士學(xué)位論文(工程碩士)基于Hadoop2.0的數(shù)據(jù)挖掘算法并行化研
5、究瞿卓指導(dǎo)教師姓名、職稱:章云教授專業(yè)或領(lǐng)域名稱:控制工禾呈學(xué)生所屬學(xué)院:自動(dòng)化學(xué)院論文答辯日期一:二〇五年五月ADissertationSubmittedtoGuandonUniversitofTechnologgygyfortheDereeofMastergMasterofEnineerin(gg)T'heresearchonDataMininAlorithmsggParalleliationBasedonHadoo2.0pCandidate:QuZhuoSupervisor:Prof
6、.ZhangYunMa2015ySchoolofAutomationGuangdongUniversityofTechnologyGuanzhouGuandon,.R.China,510006g,ggP^摘要當(dāng)今社會(huì)正在經(jīng)歷一場(chǎng)重大的時(shí)代變革,以互聯(lián)網(wǎng)行業(yè)為代表的各行各業(yè)正被鋪天蓋地的龐大數(shù)據(jù)所覆蓋,尤其是社交網(wǎng)絡(luò)、電子商務(wù)和移動(dòng)通信將人們帶入了“”一個(gè)以PB級(jí)為單位的數(shù)據(jù)信息新時(shí)代。在這個(gè)大規(guī)模生產(chǎn)、分享和應(yīng)用數(shù)據(jù)的"”云計(jì)算一時(shí)代里,以技術(shù)為核心結(jié)合了數(shù)據(jù)挖掘、人工智能等系列技術(shù)的整體“”方案成為了我們解決大數(shù)據(jù)難題
7、。、發(fā)掘數(shù)據(jù)價(jià)值、征服數(shù)據(jù)海洋的巨大動(dòng)力H一^adoop平臺(tái)是ApacheSoftwareFoundation旗下的開源分布式系統(tǒng)。它的軟件庫是一個(gè)允許使用簡(jiǎn)單的編程模型對(duì)集群計(jì)算機(jī)內(nèi)的大數(shù)據(jù)集進(jìn)行分布式處理的一框架,它設(shè)計(jì)成可以從單服務(wù)器縱向擴(kuò)展到成千上萬的服務(wù)器,而其中的每個(gè)服務(wù)器都提供本地計(jì)算及存儲(chǔ)。它不依靠硬件來提供高可用性,軟件庫本身具有能夠檢測(cè)和處理應(yīng)用層的錯(cuò)誤的能力,因此