資源描述:
《基于圖形表示dna相似性分析及進化樹的構(gòu)建算法地地研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、●TheResearchonSimilarityofDNASequencesandAlgorithmforConstructingPhylogeneticTreeBasedonGraphicalRepresentationbyGUOJiachenB.E.(HunanUniVersity)2007AthesissubmittedinpartialsatisfactionoftheRequirementsfIorthedegreeofMasterofEngineeringlnComputerApplicat
2、ionintheGraduateSchoolofHunanUniversitySuperVisorProfessorLUOJiaweiMay,2010湖南大學學位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導師的指導下獨立進行研究所取得的研究成果。除了文中特別加以標注引用的內(nèi)容外,本論文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫的成果作品。對本文的研究做出重要貢獻的個人和集體,均已在文中以明確方式標明。本人完全意識到本聲明的法律后果由本人承擔。作者簽名:奄9移。匠日期:勁忉年‘月3日學位論文版權(quán)使用授權(quán)
3、書本學位論文作者完全了解學校有關(guān)保留、使用學位論文的規(guī)定,同意學校保留并向國家有關(guān)部門或機構(gòu)送交論文的復印件和電子版,允許論文被查閱和借閱。本人授權(quán)湖南大學可以將本學位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索,可以采用影印、縮印或掃描等復制手段保存和匯編本學位論文。本學位論文屬于1、保密口,在年解密后適用本授權(quán)書。2、不保密回。(請在以上相應(yīng)方框內(nèi)打“√”)作者簽名:導師簽名:赫’日期:力/9年6月3.日日期:鈔∥年莎月多日碩士學位論文摘要隨著人類基因組計劃(HumanGenomeProject,HG
4、P)的完成以及模式生物基因組計劃的蓬勃發(fā)展,產(chǎn)生了越來越多的分子序列數(shù)據(jù)。對這些序列數(shù)據(jù)進行科學的分析、處理、研究不僅推動了生物信息學研究方法和技術(shù)的發(fā)展,而且在人類疾病及重大疫情的預防、診斷、治療、新藥開發(fā)等領(lǐng)域也有著廣闊的應(yīng)用背景。如何給出有效的基因序列圖形表達方式并在此基礎(chǔ)上對基因進行相似性分析及進化關(guān)系分析已成為生物信息學中一個熱門的課題。本文著重研究基因序列的圖形表達,基于圖形表達的基因序列的相似性分析以及采用聚類技術(shù)分析基因序列的進化關(guān)系。本文的主要工作有:(1)提出一種新的DNA序列的圖形
5、表示一一JZ曲線組。在Z曲線的基礎(chǔ)上結(jié)合廖波3D圖形表達方法給出了一種新的圖形曲線——JZ曲線組,證明了JZ曲線組中沒有回路,同時JZ曲線組包含部分的生物特性。(2)構(gòu)造了DNA序列間相似性度量的特征矩陣一一J/J矩陣。結(jié)合JZ曲線組的J/J矩陣不僅描述了序列堿基的化學性質(zhì),而且提取了基因序列的生物意義。并通過對11種生物的∥球蛋白基因的第一外顯子的編碼序列進行相似性分析,實驗結(jié)果表明,在JZ曲線組的基礎(chǔ)上結(jié)合J/J矩陣可以簡單有效的分析DNA序列的相似性。.(3)基于JZ曲線組,提出一種基于譜圖理論的
6、模糊聚類的傳遞算法構(gòu)造進化樹。對序列的進行聚類,以聚類結(jié)果指導構(gòu)建進化樹,確定序列間的進化關(guān)系。同時,聚類算法不僅考慮了類與類之間的分散程度,而且考慮了同一類的緊湊程度,提高了結(jié)果的準確性。通過對11種生物的∥球蛋白基因的第一外顯子的編碼序列以及HlNl病毒的NA基因序列構(gòu)建進化樹,實驗結(jié)果表明該算法的有效性。關(guān)鍵詞:DNA序列;圖形表達;特征矩陣;進化樹構(gòu)建算法AbstractWiththerapiddevelopmentofHGP(HumanGenomeProject,HGP)andmodelorg
7、anismgenome-sequencingprojects,moreandmoremolecularsequencesdatahaVebeengenerated.Thescientificanalysis,processandresearchofthesedatanotonlyacceleratesthedevelopmentofBioinformatics,butalsohasbroadapplicationbackgroundintheneldsofhumandiseasepreVention,d
8、iagnosis,treatlnentandnewdrugdevelopment.Howtogiveef-fectiVegraphicalrepresentationofthegenesequences,analysisofgeneticsimilarityandeVolutionaryrelationshlpotbioinformaticshavebecomeahottopic.Thisdissertationmainlystudysth