基于gpu和多核cpu的并行高階矩量法的實(shí)現(xiàn)

基于gpu和多核cpu的并行高階矩量法的實(shí)現(xiàn)

ID:33547897

大小:12.98 MB

頁數(shù):72頁

時(shí)間:2019-02-27

基于gpu和多核cpu的并行高階矩量法的實(shí)現(xiàn)_第1頁
基于gpu和多核cpu的并行高階矩量法的實(shí)現(xiàn)_第2頁
基于gpu和多核cpu的并行高階矩量法的實(shí)現(xiàn)_第3頁
基于gpu和多核cpu的并行高階矩量法的實(shí)現(xiàn)_第4頁
基于gpu和多核cpu的并行高階矩量法的實(shí)現(xiàn)_第5頁
資源描述:

《基于gpu和多核cpu的并行高階矩量法的實(shí)現(xiàn)》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、隸韻大·璺碩士學(xué)位論文基于GPU禾I多核CPU的并行高階矩量法的實(shí)現(xiàn)專業(yè)名稱:電磁場與微波技本研究生姓名:陳康導(dǎo)師姓名:周后型教授本論文獲國家公益性行業(yè)科研專項(xiàng)(201110046—2)和國家基礎(chǔ)科學(xué)研究項(xiàng)目(2010CB327400,2013CB329002)的資助。REALIZATIoNoFPARALLELHIGHER.oRDERMETHoDoFMOMENTSBASEDONGPUANDMULTI—CORECPUADissertationSubmittedtoSoutheastUniversityFortheAcademicDegreeofMasterofScience

2、ByCHENKangSupervisedbyProfessorZHOUHou--XingStateKeyLaboratoryofMillimeterWavesSchoolofInformationScienceandEngineeringSoutheastUniversityJanuary10,2014東南大學(xué)學(xué)位論文獨(dú)創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是我個(gè)人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得東南大學(xué)或其它教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同

3、志對本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說明并表示了謝意。研究生簽名:日期:2壁經(jīng)!墨:;東南大學(xué)學(xué)位論文使用授權(quán)聲明東南大學(xué)、中國科學(xué)技術(shù)信息研究所、國家圖書館有權(quán)保留本人所送交學(xué)位論文的復(fù)印件和電子文檔,可以采用影印、縮印或其他復(fù)制手段保存論文。本人電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相一致。除在保密期內(nèi)的保密論文外,允許論文被查閱和借閱,可以公布(包括以電子信息形式刊登)論文的全部內(nèi)容或中、英文摘要等部分內(nèi)容。論文的公布(包括以電子信息形式刊登)授權(quán)東南大學(xué)研究生院辦理。研究生簽名:導(dǎo)師簽名:麴日期:摘要電大目標(biāo)電磁散射特性的快速分析方法一直是計(jì)算電磁學(xué)界的一個(gè)熱點(diǎn)

4、。在早期的矩量法中,局域基函數(shù)是低階基函數(shù)(主要是RWG基函數(shù)),產(chǎn)生的未知量個(gè)數(shù)比較多,特別是對于電大目標(biāo)問題?;诜e分方程和矩量法的快速算法是目前求解電大目標(biāo)電磁散射問題的常用算法,并采用迭代求解器求解矩量法矩陣方程??焖偎惴軌蝻@著地降低每次迭代的計(jì)算復(fù)雜度和存儲復(fù)雜度,但以適當(dāng)犧牲數(shù)值精度為代價(jià)。近些年來,高階基函數(shù)(特別是Legendre準(zhǔn)正交基函數(shù))被引入矩量法,以大幅度減少未知量個(gè)數(shù),并適當(dāng)提高數(shù)值精度。在大面片上采用高階基函數(shù)的矩量法(高階矩量法)已經(jīng)成為電磁學(xué)界的一個(gè)熱點(diǎn)。本文研究基于GPU和多核CPU的并行高階矩量法的實(shí)現(xiàn),重點(diǎn)在于高階矩量法矩陣的快速

5、生成方法。本文主要工作如下:1.提出了兩個(gè)加速方法:一是將現(xiàn)有的共用Green函數(shù)法擴(kuò)展為“共用Green函數(shù)與共用方向向量相互作用法”;二是將高階基函數(shù)按階數(shù)高低進(jìn)行分組積分的方法,即“基函數(shù)按階分組法”。在這兩個(gè)方法以及現(xiàn)有的高階基函數(shù)積分表法基礎(chǔ)上,研究7"OpenMP控制多核CPU生成高階矩量法矩陣的并行計(jì)算程序的實(shí)現(xiàn)方法;2.提出了將高階矩量法的CPU串行程序直接向GPU環(huán)境移植的方法。高階矩量法矩陣的生成是一項(xiàng)計(jì)算密集型的工作,特別適合用眾核GPU來提速。但是,在基于GPU的編程中要處理各種存儲器之間的關(guān)系,比在基于多核CPU的情形復(fù)雜得多。文獻(xiàn)中給出的是直接

6、將針對采用RWG基函數(shù)的矩量法的GPU實(shí)現(xiàn)演變?yōu)獒槍Ω唠A矩量法的,僅獲得3倍左右的加速。本文的GPU程序?qū)崿F(xiàn)是優(yōu)化的,達(dá)到了20倍以上的加速;3.提出了高階矩量法矩陣在并行環(huán)境中高效計(jì)算的一種分塊方法,非常匹配從GPU高效顯存蛩]CPU主內(nèi)存的連續(xù)拷貝機(jī)制,避免YGPU與CPU間反復(fù)多次的小內(nèi)存交互。該方法不僅可以基于內(nèi)存來擴(kuò)大計(jì)算規(guī)模(核內(nèi)存儲版本),還可以讓內(nèi)存結(jié)合硬盤來進(jìn)一步擴(kuò)大計(jì)算規(guī)模,即演變?yōu)閹Ш送獯鎯Φ腉PU力I速程序(核外存儲版本)。關(guān)鍵詞:電磁散射,高階基函數(shù),高階矩量法,快速算法,并行算法,OpenMP,GPU,CUDA,核內(nèi)存儲,核外存儲。Abstra

7、ctFastanalyzingelectromagneticscatteringcharacteristicsofelectricallylargeobjectshavebeenahottopicinthecomputationalelectromagnetism.Intheearlymethodofmoments,localbasisfunctionsarelower-orderbasisfunctions(mainlyRWGbasisfunctions)thenumberofunknownvariablesproduced

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時(shí)可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。