資源描述:
《gpu上并行數(shù)據(jù)操作技術(shù)優(yōu)化》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、申請(qǐng)上海交通大學(xué)碩士學(xué)位論文GPU上并行數(shù)據(jù)操作技術(shù)優(yōu)化學(xué)校:上海交通大學(xué)院系:電子信息與電氣工程學(xué)院班級(jí):B0803391學(xué)號(hào):1080339014碩士生:鄭超專業(yè):高性能并行計(jì)算導(dǎo)師:鄧倩妮(副教授)上海交通大學(xué)電子信息與電氣工程學(xué)院2010年12月ADissertationSubmittedtoShanghaiJiaoTongUniversityfortheMasterDegreeofComputerScienceandTechnologyOPTIMIZATIONFORPARALLELDATAOPERATIONONGPUAuthor:ZhengChaoS
2、pecialty:ComputerSystemandArchitectureAdvisor:Asso.Prof.DengQianniSchoolofElectronicsandElectricEngineeringShanghaiJiaoTongUniversityShanghai,P.R.ChinaDecember,2010上海交通大學(xué)碩士學(xué)位論文摘要GPU上并行數(shù)據(jù)操作技術(shù)優(yōu)化摘要近年來,隨著多核技術(shù)與GPU(GraphicsProcessingUnits)技術(shù)的發(fā)展和成熟,GPU以其強(qiáng)大的并行計(jì)算能力越來越成為研究領(lǐng)域中的熱點(diǎn)。人們已經(jīng)開始研究使用GPU
3、對(duì)多種數(shù)據(jù)操作進(jìn)行加速。其中在數(shù)據(jù)庫操作中最常用最耗時(shí)的連接操作成為人們研究的重點(diǎn)。本文研究了三個(gè)經(jīng)典的連接算法(嵌套連接算法,排序-歸并算法和哈希算法)的串行實(shí)現(xiàn)和并行實(shí)現(xiàn),在GPU平臺(tái)上實(shí)現(xiàn)了它們的并行化算法,并根據(jù)它們各自的特點(diǎn)做了一些優(yōu)化。同時(shí),鑒于GPU平臺(tái)和多核處理器系統(tǒng)的相似性,本文把應(yīng)用在計(jì)算機(jī)集群上的CMD(CoordinateModuleDistribution)數(shù)據(jù)劃分算法移至到了GPU平臺(tái)上,并比較了兩個(gè)并行連接算法(排序-歸并算法和哈希算法)和CMD連接算法的性能。另外,本文也比較了以上算法在處理數(shù)據(jù)偏斜時(shí)的性能。為了和CPU多核進(jìn)行
4、比較,本文還使用了OpenMP實(shí)現(xiàn)了排序-歸并和哈希連接算法,并把它們同GPU上的版本進(jìn)行了比較。本文的貢獻(xiàn)在于,在GPU平臺(tái)上實(shí)現(xiàn)了排序-歸并和哈希連接算法,并根據(jù)各個(gè)算法的特點(diǎn)進(jìn)行了優(yōu)化,同時(shí)把CMD算法移植到了GPU平臺(tái)。本文比較了這些算法在處理數(shù)據(jù)偏斜時(shí)的性能,實(shí)驗(yàn)表第I頁上海交通大學(xué)碩士學(xué)位論文摘要明,哈希算法具有很好的表現(xiàn),CMD連接算法次之,排序-歸并算法最差。但是在處理均勻分布的數(shù)據(jù)表時(shí),CMD連接算法要明顯遜色于其它兩個(gè)算法。而在同OpenMP的版本比較中發(fā)現(xiàn),兩個(gè)版本的性能不相上下。關(guān)鍵字:GPU,并行關(guān)系連接算法,CMD算法,數(shù)據(jù)偏斜第I
5、I頁上海交通大學(xué)碩士學(xué)位論文ABSTRACTOptimizationforparalleldataoperationonGPUABSTRACTInrecentyears,withthedevelopmentandmaturityofmulticoretechnology,GPU(GraphicsProcessingUnits)hasincreasinglybecometheresearchhotspotbyitspowerfulparallelcomputingcapacity.ResearchershavebeenusingGPUtoaccelerateva
6、riouskindsofdataoperations,amongwhichrelationaljoinisthemostcommonlyusedandmosttime-consumingoperation.Thispaperhasstudiedthethreeclassicrelationaljoinalgorithms(nested-loopjoin,sort-mergejoinandhashjoin),bothserialandparallelversion.TheirparallelversionshavebeenimplementedonGPUando
7、ptimizedaccordingtotheircharacteristics.Atthemeantime,duetothesimilaritybetweenclustersandmulticoresystem,thispaperhasmigratedCMD(CoordinateModuleDistribution)algorithm,originallydesignedforclusters,ontoGPUandcompareditsperformancewiththosetwoclassicalgorithmsonGPU.Wealsocomparedthe
8、irperformanceswhenp