資源描述:
《基于層次聚類進(jìn)化樹的構(gòu)建算法地地研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、基于層次聚類的進(jìn)化樹構(gòu)建算法研究摘要系統(tǒng)發(fā)育分析是生物信息學(xué)研究的重要領(lǐng)域之一,它主要研究同源的DNA或蛋白質(zhì)序列,對這些序列進(jìn)行進(jìn)化分析,從而得到能夠反映蛋白質(zhì)序列或者DNA序列之間進(jìn)化關(guān)系的系統(tǒng)發(fā)育進(jìn)化樹。系統(tǒng)發(fā)育進(jìn)化樹的研究已有很長的歷史了,它在分子進(jìn)化與系統(tǒng)發(fā)育研究中起到了重要的作用。系統(tǒng)進(jìn)化樹直觀的反映了生物進(jìn)化的關(guān)系,有助于了解生物進(jìn)化歷史和進(jìn)化機(jī)制。進(jìn)化樹構(gòu)建方法從不同的角度可以得到不同的分類,可以把進(jìn)化樹構(gòu)建算法分為兩類:基于算術(shù)聚類方法和基于最優(yōu)搜索方法。由于基于最優(yōu)搜索方法常常
2、要比基于算術(shù)聚類方法慢得多,所以基于算術(shù)聚類方法得到了廣泛地應(yīng)用。.·基于算術(shù)聚類方法中層次聚類方法應(yīng)用于進(jìn)化樹構(gòu)建方面最為常用,但是傳統(tǒng)的基于算術(shù)聚類方法中都是建立在序列比對的基礎(chǔ)上的。所以本文為了解決這個問題,提出了兩種新的基于層次聚類方法,這兩種都是不需要進(jìn)行序列比對,而且算法的計算量小,容易實(shí)現(xiàn)。兩種新方法是:基于橫縱建樹法和基于調(diào)整權(quán)重的自組織映射建樹法?;跈M縱建樹法也是一種基于距離矩陣建樹法。它是在距離矩陣基礎(chǔ)上進(jìn)行的,結(jié)合橫向找點(diǎn),縱向找邊的思想得到一棵二叉樹,在此基礎(chǔ)上進(jìn)行聚類。
3、基于調(diào)整權(quán)重的自組織映射建樹法是建立在自組織映射網(wǎng)絡(luò)基礎(chǔ)上提出來的。自組織映射網(wǎng)絡(luò)既可以應(yīng)用于分類和聚類,也可以應(yīng)用于進(jìn)化分析和進(jìn)化樹的構(gòu)造。但是當(dāng)自組織映射網(wǎng)絡(luò)應(yīng)用于進(jìn)化分析和進(jìn)化樹構(gòu)造的研究中,算法比較復(fù)雜,而這種方法降低了算法的復(fù)雜度。這種方法與基于距離矩陣建樹法比較,它不用進(jìn)行相似分析構(gòu)造距離矩陣,而是直接得到一顆最小權(quán)重二叉樹,然后通過聚類進(jìn)行進(jìn)化樹構(gòu)建。評估構(gòu)建進(jìn)化樹的方法可行性,通常是采用PHYLIP軟件中的Neighbor.exe程序來評估的,通過做實(shí)驗(yàn)來驗(yàn)證算法的可行性。關(guān)鍵詞:
4、構(gòu)建進(jìn)化樹;層次聚類;距離矩陣;自組織映射II碩士學(xué)位論文L.L..IIAbstractMolecularphylogeneticanalysisisoneofthemostimportantfieldsinbioinformatics,whichmainlystudieshomologousDNAorproteinsequencesandtheevolutionanalysisforproteinsequencesorDNAsequences.Sothephylogenetietreeisobt
5、ainedwhichisreflectedevolutionaryrelationshipofproteinsequencesorDNAsequences.Theresearchofphylogenetictreereconstructionhasalongtimehistory;itplaysamoreandmoreimportantpartinmolecularevolutionandphylogenetieresearch.Thephylogenetictreereflectsthesequ
6、enceofthespeciesevolution,ithelpsUStofindthehistoryandevolutionmechanismofspecies.Phylogenetictreeconstructionmethodscanbeobtaineddifferentcategoriesofthedifferentviews,SOwecandividethephylogenetietreeconstructionmethodsintotwocategories:basedonmathem
7、aticsclusteringmethodandbasedontheoptimalsearchmethod.Asbasedonoptimalsearchmethodsaremuchslowerthanbasedonmathematicsclusteingmethods,basedonmathematicsclusteringmethodhaswideapplications.Thehierarchicalclusteringmethodofbasedonmathematicsclusteringm
8、ethodisagenerallymethodinphylogenetietreesconstruction,butthetraditionalmathematicsclusteringmethodisbuilttobaseonsequencealignment.Therefore,inordertosolvethisproblem,weproposetwonewmethodsbasedonthehierarchicalclustering,bothofwhicharewithou