資源描述:
《基于CPU2fGPU異構(gòu)并行系統(tǒng)的大規(guī)模人工社會仿真計算加速方法分析》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、-國防科學(xué)技術(shù)大學(xué)研究生院碩士學(xué)位論文摘要人工社會是進(jìn)行社會科學(xué)研究的有效手段,其核心方法是基于Agent的建模、仿真和實驗分析。隨著仿真應(yīng)用需求的發(fā)展,人工社會規(guī)模逐漸增大,Agent模型及其行為規(guī)則日益復(fù)雜、交互關(guān)系網(wǎng)絡(luò)越來越龐大。為了滿足人工社會仿真計算實驗實時性、高效性的要求,提高大規(guī)模人工社會仿真執(zhí)行效率就成為了亟待解決的問題。隨著GPU等異構(gòu)處理器的發(fā)展,CPU/GPU異構(gòu)并行系統(tǒng)在合理功耗下能夠獲得強(qiáng)大的計算性能,已經(jīng)成為高性能計算機(jī)發(fā)展的方向,也逐漸應(yīng)用于仿真領(lǐng)域的計算加速中。面對日益增長的人工社會仿真規(guī)模和復(fù)雜度,利用CPU/GPU異
2、構(gòu)并行系統(tǒng)計算優(yōu)勢進(jìn)行仿真性能優(yōu)化,就成為了提升人工社會仿真執(zhí)行效率的有效途徑。在上述問題背景下,本文基于單進(jìn)程、多線程的保守并行仿真引擎框架,提出了基于三層引擎管理的CPU/GPU異構(gòu)并行仿真引擎架構(gòu),同時針對大規(guī)模Agent仿真特點(diǎn),對GPU仿真內(nèi)核的數(shù)據(jù)結(jié)構(gòu)和調(diào)度算法進(jìn)行了設(shè)計和優(yōu)化。為了彌補(bǔ)并行仿真內(nèi)核對人工社會不同應(yīng)用領(lǐng)域的性能加速局限,本文提出了面向領(lǐng)域的GPU仿真計算服務(wù)組件思想。主要研究工作和成果如下:(1)提出了面向大規(guī)模人工社會的CPU/GPU異構(gòu)并行系統(tǒng)計算加速方法和實現(xiàn)框架。CPU/GPU異構(gòu)并行系統(tǒng)計算加速方法將GPU的兩種仿
3、真應(yīng)用方式(協(xié)處理器與主處理器)共同應(yīng)用于大規(guī)模Agent仿真的計算加速中。GPU主處理器方式與CPU一起構(gòu)成異構(gòu)仿真引擎,負(fù)責(zé)Agent仿真的底層驅(qū)動計算加速,同時GPU協(xié)處理器方式以計算組件的方式接入仿真引擎,將人工社會模型中的大規(guī)模并發(fā)計算剝離,載入GPU中實現(xiàn)并行計算加速。在基于三層引擎管理的引擎架構(gòu)下,異構(gòu)仿真內(nèi)核和計算組件可以實現(xiàn)靈活拓展。(2)實現(xiàn)了面向大規(guī)模Agent仿真的GPU仿真內(nèi)核。根據(jù)Agent仿真特點(diǎn)和GPU硬件執(zhí)行特點(diǎn),對Agent模型和事件隊列數(shù)據(jù)結(jié)構(gòu)進(jìn)行優(yōu)化設(shè)計,并基于此數(shù)據(jù)結(jié)構(gòu)設(shè)計了基于同步保守并行策略的GPU內(nèi)核調(diào)度
4、算法。針對GPU內(nèi)核運(yùn)行時的并發(fā)事件操作,提出了GPU消息輸出算法;為了進(jìn)一步提升同步保守并行仿真算法的性能,提出了基于GPU的大規(guī)模時間歸約算法。在GameOfLife測試模型中,相對單核CPU,GPU仿真內(nèi)核獲得了11.2倍的性能加速。(3)提出了基于GPU的計算服務(wù)組件,并實現(xiàn)了在公共衛(wèi)生事件仿真中基于GPU的社會關(guān)系網(wǎng)絡(luò)查詢組件。與CPU查詢算法相比,不僅減少了Agent模型的內(nèi)存占用,而且在并發(fā)查詢數(shù)量較大時也能夠獲得較大的性能加速。關(guān)鍵詞:人工社會;大規(guī)模Agent仿真;CPU/GPU;并行離散事件仿真;計算服務(wù)組件第i頁----萬方數(shù)據(jù)-
5、---國防科學(xué)技術(shù)大學(xué)研究生院碩士學(xué)位論文ABSTRACTArtificialsocietyisaneffectivewayforsocialscienceresearch,anditscoremethodsareAgent-basedmodeling,simulationandexperimentalanalysis.Withthedevelopingrequirementofapplications,thescaleofartificialsocietyraisesgradually,Agentmodelandbehaviorrulesisgett
6、ingcomplex,andinter-relationshipamongnetworksisbecomingbiggerandbigger.Inordertomeetefficiencyandtimelinessrequirementofcomputationalexperiment,theexecutionefficiencyoflarge-scaleartificialsocietythenbecomestheburningquestion.Withthedevelopmentofheterogeneouscomputationaldevices
7、likeGPU,heterogeneousparallelsystemofCPU/GPUcangettremendouscomputationalperformanceunderrationalpowerconsumption,whichhasbecomedirectionofthehighperformancecomputersandalsoappliedinthesimulationforhighperformance.Facingtheever-increasingscaleandcomplexityofartificialsociety,tom
8、akeuseoftheCPU/GPUheterogeneousparallelsystemsi