資源描述:
《系統(tǒng)發(fā)育樹(shù)-分子進(jìn)化樹(shù)構(gòu)建及數(shù)據(jù)分析的簡(jiǎn)介》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、分子進(jìn)化樹(shù)構(gòu)建及數(shù)據(jù)分析的簡(jiǎn)介mediocrebeing,rodger,lylover[1],klaus,oldfish,yzwpf?一、引言?開(kāi)始動(dòng)筆寫(xiě)這篇短文之前,我問(wèn)自己,為什么要寫(xiě)這樣的文章?寫(xiě)這樣的文章有實(shí)際的意義嗎?我希望能夠解決什么樣的問(wèn)題?帶著這樣的疑惑,我隨手在丁香園(DXY)上以關(guān)鍵字“進(jìn)化?分析?求助”進(jìn)行了搜索,居然有289篇相關(guān)的帖子(2006年9月12日)。而以關(guān)鍵字“進(jìn)化?分析”和“進(jìn)化”為關(guān)鍵字搜索,分別找到2,733和7,724篇相關(guān)的帖子??紤]到有些帖子的內(nèi)容與分子進(jìn)化無(wú)關(guān),這里我
2、保守的估計(jì),大約有3,000~4,000篇帖子的內(nèi)容,是關(guān)于分子進(jìn)化的。粗略地歸納一下,我大致將提出的問(wèn)題分為下述的幾類(lèi):1.涉及基本概念。例如,“分子進(jìn)化與生物進(jìn)化是不是一個(gè)概念”,“關(guān)于微衛(wèi)星進(jìn)化模型有沒(méi)有什么新的進(jìn)展”以及“關(guān)于Kruglyak的模型有沒(méi)有改進(jìn)的出現(xiàn)”,等等。2.關(guān)于構(gòu)建進(jìn)化樹(shù)的方法的選擇。例如,“用boostrapNJ得到XX圖,請(qǐng)問(wèn)該怎樣理解?能否應(yīng)用于文章?用boostraptest中的ME法得到的是XXX樹(shù),請(qǐng)問(wèn)與上個(gè)樹(shù)比,哪個(gè)更好”,等等。3.關(guān)于軟件的選擇。例如,“想做一個(gè)進(jìn)化樹(shù),不
3、知道什么軟件能更好的使用且可以說(shuō)明問(wèn)題,并且有沒(méi)有說(shuō)明如何做”,“拿到了16srRNA數(shù)據(jù),打算做一個(gè)系統(tǒng)進(jìn)化樹(shù)分析,可是原來(lái)沒(méi)有做過(guò)這方面的工作啊,都要什么軟件”,“請(qǐng)問(wèn)各位高手用clustalx做出來(lái)的進(jìn)化樹(shù)與phylip做的有什么區(qū)別”,“請(qǐng)問(wèn)有做過(guò)進(jìn)化樹(shù)分析的朋友,能不能提供一下,做樹(shù)的時(shí)候參數(shù)的設(shè)置,以及代表的意思。還有各個(gè)分支等數(shù)值的意思,說(shuō)明的問(wèn)題等”,等等。4.蛋白家族的分類(lèi)問(wèn)題。例如,“搜集所有的關(guān)于一個(gè)特定domain的序列,共141條,做的進(jìn)化樹(shù)不知具體怎么分析”,等等。5.新基因功能的推斷。例
4、如,“根據(jù)一個(gè)新基因A氨基酸序列構(gòu)建的系統(tǒng)發(fā)生樹(shù),這個(gè)進(jìn)化樹(shù)能否說(shuō)明這個(gè)新基因A和B同源,屬于同一基因家族”,等等。6.計(jì)算基因分化的年代。例如,“想在基因組水平比較兩個(gè)或三個(gè)比較接近物種之間的進(jìn)化年代的遠(yuǎn)近,具體推算出他們之間的分歧時(shí)間”,“如何估計(jì)病毒進(jìn)化中變異所需時(shí)間”,等等。7.進(jìn)化樹(shù)的編輯。例如生成的進(jìn)化樹(shù)圖片,如何進(jìn)行后續(xù)的編輯,比如希望在圖片上標(biāo)注某些特定的內(nèi)容,等等。由于相關(guān)的帖子太多,作者在這里對(duì)無(wú)法閱讀全部的相關(guān)內(nèi)容而致以歉意。同時(shí),作者歸納的這七個(gè)問(wèn)題也并不完全代表所有的提問(wèn)。對(duì)于問(wèn)題1所涉及到
5、的基本的概念,作者推薦讀者可參考由MasatoshiNei與SudhirKumar所撰寫(xiě)的《分子進(jìn)化與系統(tǒng)發(fā)育》(MolecularEvolutionandPhylogenetics)一書(shū),以及相關(guān)的分子進(jìn)化方面的最新文獻(xiàn)。對(duì)于問(wèn)題7,作者之一lylover一般使用Powerpoint進(jìn)行編輯,而Photoshop、Illustrator及Windows自帶的畫(huà)圖工具等都可以使用。這里,作者在這里對(duì)問(wèn)題2-6進(jìn)行簡(jiǎn)要地解釋和討論,并希望能夠初步地解答初學(xué)者的一些疑問(wèn)。?二、方法的選擇?Firstofall,Ihave
6、nointentiontobeoffensive,pleasetakemyapologyifyoufeellikethat.Iamnotsureaboutthepurposeofthisdraft,isitonlyforwateringindxy.cnor??somethingelse?Simplyignoremysuggestionswhenyouthinkit'sreasonable.首先是方法的選擇?;诰嚯x的方法有UPGMA、ME(MinimumEvolution,最小進(jìn)化法)和NJ(Neighbor-Joi
7、ning,鄰接法)等。其他的幾種方法包括MP(Maximumparsimony,最大簡(jiǎn)約法)、ML(Maximumlikelihood,最大似然法)以及貝葉斯(Bayesian)推斷等方法。其中UPGMA法已經(jīng)較少使用。一般來(lái)講,如果模型合適,ML的效果較好。對(duì)近緣序列,有人喜歡MP,因?yàn)橛玫募僭O(shè)最少。MP一般不用在遠(yuǎn)緣序列上,這時(shí)一般用NJ或ML。對(duì)相似度很低的序列,NJ往往出現(xiàn)Long-branchattraction(LBA,長(zhǎng)枝吸引現(xiàn)象),有時(shí)嚴(yán)重干擾進(jìn)化樹(shù)的構(gòu)建。(Alltree-reconstructio
8、nmethodssufferfromlongbranchattractionincludingML,thesituationistheworstforMP.BettermentionitisnotonlyforNJ.)貝葉斯的方法則太慢。(MPcanalsobeextremelyslowifwehavealargenumberofsequenc