資源描述:
《基于cpu-gpu異構(gòu)并行系統(tǒng)的smithwaterman及hevc加速技術(shù)研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、摘要近年來(lái),隨著GPU的不斷更新發(fā)展,CPU-GPU異構(gòu)系統(tǒng)逐漸為人們所使用,其中CPU主要負(fù)責(zé)高復(fù)雜度的邏輯運(yùn)算,GPU則負(fù)責(zé)計(jì)算密集型的大規(guī)模數(shù)據(jù)并行工作,二者相輔相成,將系統(tǒng)整體計(jì)算能力最大化的利用?;贑PU-GPU異構(gòu)系統(tǒng)加速的應(yīng)用研究也越來(lái)越多,但是其程序移植過(guò)程較為復(fù)雜且結(jié)果不夠準(zhǔn)確,距離真正的將CPU-GPU異構(gòu)系統(tǒng)應(yīng)用于大規(guī)模程序加速還有一段距離。因此,本課題在原有的GPU加速研究的基礎(chǔ)上,總結(jié)了當(dāng)前GPU程序移植的兩種方法RPA和MOL,并提出了全新一種程序移植方法ISC。應(yīng)用此方法實(shí)際移植了生物序列比對(duì)工具SmithWater
2、man和BLAST。論文首先介紹了當(dāng)前GPU的硬件結(jié)構(gòu)及其編程模型CUDA(ComputeUnifiedDeviceArchitecture)的架構(gòu),并詳細(xì)的介紹了CPU-GPU異構(gòu)并行系統(tǒng)的組成。由此提出了程序移植的一般步驟,總結(jié)目前已經(jīng)存在的兩種代碼移植方法RPA和MOL,這兩種方法要求編程者對(duì)原始CPU版代碼有深入的了解,而且是對(duì)原始代碼的修改,不僅耗費(fèi)時(shí)間而且不保證結(jié)果的準(zhǔn)確性。本文提出了全新的代碼移植方法ISC,該方法不需要對(duì)原始的算法和數(shù)據(jù)結(jié)構(gòu)做任何更改,不僅節(jié)省時(shí)間精力更能保證移植后的程序結(jié)果與CPU版本結(jié)果一致。然后利用ISC方法實(shí)
3、際移植了生物序列比對(duì)工具并給出加速結(jié)果。本文的最后部分介紹了最新的視頻編碼標(biāo)準(zhǔn)HEVC及其CUDA加速版本的移植思路和系統(tǒng)框架。CUDA-SWfr和CUDA-BLASTN的加速結(jié)果顯示,利用ISC方法,CPU-GPU異構(gòu)并行系統(tǒng)可以有效的對(duì)計(jì)算密集型軟件工具進(jìn)行加速,大大的縮短計(jì)算時(shí)間。關(guān)鍵詞:GPU生物序列比對(duì)SmithWatermanBLASTHEVCABSTRACTInrecentyears,withthedevelopmentofGPU,theCPU-GPUheterogeneoussystemisgraduallyusedbypeople
4、.TheCPUisresponsibleforthehighcomplexityofthelogicaloperationandGPUisresponsibleforthecalculationoflargedataparallelwork.Thetwosystemscooperatewitheachother,andthesystem'soverallcomputingpowermakesthemostuse.TheapplicationsbasedonCPU-GPUheterogeneoussystemcomemore,buttheproces
5、sofportingiscomplexandtheresultisnotaccurate.It`sstillalongwaybeforetheCPU-GPUheterogeneoussystemcouldbeusedinportinglargescaleprograms.Therefore,basedontheoriginalGPUaccelerationresearch,thispapersummarizethecurrenttwoportingmethodscalledMOLandRPA.Andthenthispaperproposeanewp
6、ortingmethodcalledISC.Withthisnewmethod,thebiologicalsequencealignmenttools,SmithWatermanandBLAST,havebeenportedtoGPU.Firstly,thepaperintroducesthehardwarestructureofGPUandthearchitectureofCUDA,andintroducesthecompositionofCPU-GPUheterogeneousparallelsystem.Thispaperputsforwar
7、dthegeneralstepsoftheportingmethod,andsummarizestwokindsofcodeportingmethods,MOLandRPA.Thetwomethodsrequireprogrammerstohaveanin-depthunderstandingoftheoriginalCPUcode,andbecauseofthemodificationoftheoriginalcode,it`snotonlytimeconsumingbutalsocan`tguarantetheresult.Inthispape
8、r,anewmethodofcodeportingISCisproposed.Themethoddoesnotneedto