資源描述:
《基于圖形表示dna相似性分析及進化樹構(gòu)建算法的研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、●TheResearchonSimilarityofDNASequencesandAlgorithmforConstructingPhylogeneticTreeBasedonGraphicalRepresentationbyGUOJiachenB.E.(HunanUniVersity)2007AthesissubmittedinpartialsatisfactionoftheRequirementsfIorthedegreeofMasterofEngineeringlnComputerApplicationintheGraduateSchoolofHun
2、anUniversitySuperVisorProfessorLUOJiaweiMay,2010湖南大學(xué)學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨立進行研究所取得的研究成果。除了文中特別加以標(biāo)注引用的內(nèi)容外,本論文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫的成果作品。對本文的研究做出重要貢獻的個人和集體,均已在文中以明確方式標(biāo)明。本人完全意識到本聲明的法律后果由本人承擔(dān)。作者簽名:奄9移。匠日期:勁忉年‘月3日學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件
3、和電子版,允許論文被查閱和借閱。本人授權(quán)湖南大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。本學(xué)位論文屬于1、保密口,在年解密后適用本授權(quán)書。2、不保密回。(請在以上相應(yīng)方框內(nèi)打“√”)作者簽名:導(dǎo)師簽名:赫’日期:力/9年6月3.日日期:鈔∥年莎月多日碩士學(xué)位論文摘要隨著人類基因組計劃(HumanGenomeProject,HGP)的完成以及模式生物基因組計劃的蓬勃發(fā)展,產(chǎn)生了越來越多的分子序列數(shù)據(jù)。對這些序列數(shù)據(jù)進行科學(xué)的分析、處理、研究不僅推動了生物信息學(xué)研究方法和技術(shù)的發(fā)展,而且在
4、人類疾病及重大疫情的預(yù)防、診斷、治療、新藥開發(fā)等領(lǐng)域也有著廣闊的應(yīng)用背景。如何給出有效的基因序列圖形表達方式并在此基礎(chǔ)上對基因進行相似性分析及進化關(guān)系分析已成為生物信息學(xué)中一個熱門的課題。本文著重研究基因序列的圖形表達,基于圖形表達的基因序列的相似性分析以及采用聚類技術(shù)分析基因序列的進化關(guān)系。本文的主要工作有:(1)提出一種新的DNA序列的圖形表示一一JZ曲線組。在Z曲線的基礎(chǔ)上結(jié)合廖波3D圖形表達方法給出了一種新的圖形曲線——JZ曲線組,證明了JZ曲線組中沒有回路,同時JZ曲線組包含部分的生物特性。(2)構(gòu)造了DNA序列間相似性度量的特征矩陣一一J/J矩
5、陣。結(jié)合JZ曲線組的J/J矩陣不僅描述了序列堿基的化學(xué)性質(zhì),而且提取了基因序列的生物意義。并通過對11種生物的∥球蛋白基因的第一外顯子的編碼序列進行相似性分析,實驗結(jié)果表明,在JZ曲線組的基礎(chǔ)上結(jié)合J/J矩陣可以簡單有效的分析DNA序列的相似性。.(3)基于JZ曲線組,提出一種基于譜圖理論的模糊聚類的傳遞算法構(gòu)造進化樹。對序列的進行聚類,以聚類結(jié)果指導(dǎo)構(gòu)建進化樹,確定序列間的進化關(guān)系。同時,聚類算法不僅考慮了類與類之間的分散程度,而且考慮了同一類的緊湊程度,提高了結(jié)果的準(zhǔn)確性。通過對11種生物的∥球蛋白基因的第一外顯子的編碼序列以及HlNl病毒的NA基因序
6、列構(gòu)建進化樹,實驗結(jié)果表明該算法的有效性。關(guān)鍵詞:DNA序列;圖形表達;特征矩陣;進化樹構(gòu)建算法AbstractWiththerapiddevelopmentofHGP(HumanGenomeProject,HGP)andmodelorganismgenome-sequencingprojects,moreandmoremolecularsequencesdatahaVebeengenerated.Thescientificanalysis,processandresearchofthesedatanotonlyacceleratesthedevelopm
7、entofBioinformatics,butalsohasbroadapplicationbackgroundintheneldsofhumandiseasepreVention,diagnosis,treatlnentandnewdrugdevelopment.Howtogiveef-fectiVegraphicalrepresentationofthegenesequences,analysisofgeneticsimilarityandeVolutionaryrelationshlpotbioinformaticshavebecomeahottop
8、ic.Thisdissertationmainlystudysth