資源描述:
《基于hadoop的分布式雜交水稻算法研究》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。
1、分類號密級UDC學校代碼10500碩士學位論文(全日制學術學位)題目:基于hadoop的分布式雜交水稻算法研究英文題目:ResearchondistributedhybridricealgorithmbasedonHadoop學位申請人姓名:鄧興鵬申請學位學科專業(yè):計算科學與技術指導教師姓名:陳宏偉二○一八年五月分類號密級UDC學校代碼10500碩士學位論文題目基于hadoop的分布式雜交水稻算法研究英文題目ResearchondistributedhybridricealgorithmbasedonHadoop研究生姓名(簽名)指導教師姓
2、名(簽名)職稱教授申請學位學科名稱計算機科學與技術學科代碼論文答辯日期學位授予日期學院負責人(簽名)評閱人姓名評閱人姓名年月日學位論文原創(chuàng)性聲明和使用授權說明原創(chuàng)性聲明本人鄭重聲明:所呈交的學位論文,是本人在導師指導下,獨立進行研究工作所取得的研究成果。除文中已經(jīng)標明引用的內(nèi)容外,本論文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫過的研究成果。對本文的研究做出貢獻的個人和集體,均已在文中以明確方式標明。本聲明的法律結(jié)果由本人承擔。學位論文作者簽名:日期:年月日學位論文版權使用授權書本學位論文作者完全了解學校有關保留、使用學位論文的規(guī)定,即:學校有
3、權保留并向國家有關部門或機構(gòu)送交論文的復印件和電子版,允許論文被查閱和借閱。本人授權湖北工業(yè)大學可以將本學位論文的全部或部分內(nèi)容編入有關數(shù)據(jù)庫進行檢索,可以采用影印、縮印或掃描等復制手段保存和匯編本學位論文。學位論文作者簽名:指導教師簽名:日期:年月日日期:年月日摘要雜交水稻優(yōu)化算法(HybridRiceOptimizationAlgorithm,HRO)是一種受三系雜交水稻(hybridrice)的育種方式啟發(fā),經(jīng)過一系列的研究,進而提出的一種新的啟發(fā)式進化計算的群智能優(yōu)化算法。即保持系,恢復系以及不育系。通過保持系與不育系的雜交生成新的
4、雜交水稻個體?;謴拖低ㄟ^自交保持良好的屬性。雜交過程是一個演化過程,自交過程是群體搜索的過程。這兩個過程相互影響,并以適當比例組合。該算法參數(shù)較少,原理易理解,容易實現(xiàn)。與其他的算法相比穩(wěn)定性好,尋優(yōu)能力強,計算復雜度低,計算速度快,適用于多種優(yōu)化問題。然而,隨著互聯(lián)網(wǎng)信息技術的飛速發(fā)展,直接或者間接產(chǎn)生的信息數(shù)據(jù)也在呈指數(shù)級增長,這對傳統(tǒng)的數(shù)據(jù)挖掘算法提出了新的挑戰(zhàn)。在這樣的情況之下,大數(shù)據(jù)云計算的概念也應運而生,研究人員將傳統(tǒng)數(shù)據(jù)挖掘算法與新興技術相融合,利用分布式計算的思想與力量來對算法進行合理優(yōu)化,使算法的綜合性能有了顯著改進。其中
5、Hadoop計算框架成為大數(shù)據(jù)處理的主要框架平臺。本文在前人的工作及經(jīng)驗基礎之上,設計并實現(xiàn)了一種基于Hadoop的分布式雜交水稻算法,旨在解決在大規(guī)模數(shù)據(jù)量時如何提升HRO算法性能的問題。通過對SVM的核函數(shù)核參數(shù)進行優(yōu)化,進一步的驗證基于Hadoop的分布式雜交水稻算法在參數(shù)優(yōu)化上也有較好的效果。本文的主要工作如下:1.通過研究學習雜交水稻優(yōu)化算法的算法模型、實現(xiàn)原理等理論知識,結(jié)合查閱大量的關于分布式群智能優(yōu)化算法解決方案的國內(nèi)外文獻資料,設計并實現(xiàn)了基于Hadoop的分布式雜交水稻算法,提出了兩種分布式方案,通過實驗驗證選擇了其中較
6、優(yōu)的解決方案對算法進行深入的研究。通過設置種群規(guī)模的大小分別對基于Hadoop的分布式雜交水稻算法和單機版雜交水稻算法進行比對實驗,通過增加Hadoop集群中HadoopNode數(shù)量分別對上述兩種算法進行比對實驗。實驗結(jié)果表明在其它條件一定的情況下,當種群規(guī)模增大時,基于Hadoop的分布式雜交水稻算法比單機雜交水稻算法性能更好,并且隨著Hadoop集群節(jié)點數(shù)量的增加,其優(yōu)勢越來越明顯。2.論文研究了優(yōu)化SVM參數(shù)的問題,使用基于Hadoop的分布式雜交水稻算法優(yōu)化SVM參數(shù)的方法。由于雜交水稻優(yōu)化算法、GA、PSO、ACO等較為成熟的群智
7、能優(yōu)化算法都是概率算法,所以,在設計實驗時,用經(jīng)過大量實驗得出的平均值進行比對,這樣更能說明問題。在優(yōu)化SVM參數(shù)時,通過雜交水稻種群數(shù)量的I變化對基于Hadoop的分布式雜交水稻算法優(yōu)化SVM和傳統(tǒng)串行雜交水稻算法優(yōu)化SVM在運行時間和分類精度上進行實驗比對,實驗結(jié)果表明,隨著種群數(shù)量的增加,基于Hadoop的分布式雜交水稻算法優(yōu)化SVM在分類精度上基本與傳統(tǒng)串行雜交水稻算法優(yōu)化SVM持平,但在運行時間上明顯優(yōu)于傳統(tǒng)串行HRO-SVM。關鍵詞:雜交水稻算法,分布式,Hadoop,SVM,參數(shù)優(yōu)化IIAbstractHybridRiceOp
8、timizationAlgorithm(HRO)isanewheuristicevolutionarycomputationalswarmintelligenceoptimiza