進(jìn)化樹分析及相關(guān)軟件使用說明

進(jìn)化樹分析及相關(guān)軟件使用說明

ID:19337593

大?。?31.00 KB

頁數(shù):10頁

時間:2018-10-01

進(jìn)化樹分析及相關(guān)軟件使用說明_第1頁
進(jìn)化樹分析及相關(guān)軟件使用說明_第2頁
進(jìn)化樹分析及相關(guān)軟件使用說明_第3頁
進(jìn)化樹分析及相關(guān)軟件使用說明_第4頁
進(jìn)化樹分析及相關(guān)軟件使用說明_第5頁
資源描述:

《進(jìn)化樹分析及相關(guān)軟件使用說明》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫

1、進(jìn)化樹分析及相關(guān)軟件使用說明我在此介紹幾個進(jìn)化樹分析及其相關(guān)軟件的使用和應(yīng)用范圍。這幾個軟件分別是PHYLIP、PUZZLE、PAUP、TREEVIEW、CLUSTALX和PHYLO-WIN(LINUX)。在介紹軟件之前,我先簡要地敘述一下有關(guān)進(jìn)化樹分析的一些方法學(xué)問題。進(jìn)化樹也稱種系樹,英文名叫“Phyligenetictree”。對于一個完整的進(jìn)化樹分析需要以下幾個步驟:⑴要對所分析的多序列目標(biāo)進(jìn)行排列(Toalignsequences)。做ALIGNMENT的軟件很多,最經(jīng)常使用的有CLUSTALX和CLUSTALW,前者是在WINDOW下的而后者是在DOS下的。⑵要構(gòu)建一個

2、進(jìn)化樹(Toreconstrutphyligenetictree)。構(gòu)建進(jìn)化樹的算法主要分為兩類:獨立元素法(discretecharactermethods)和距離依靠法(distancemethods)。所謂獨立元素法是指進(jìn)化樹的拓?fù)湫螤钍怯尚蛄猩系拿總€堿基/氨基酸的狀態(tài)決定的(例如:一個序列上可能包含很多的酶切位點,而每個酶切位點的存在與否是由幾個堿基的狀態(tài)決定的,也就是說一個序列堿基的狀態(tài)決定著它的酶切位點狀態(tài),當(dāng)多個序列進(jìn)行進(jìn)化樹分析時,進(jìn)化樹的拓?fù)湫螤钜簿陀蛇@些堿基的狀態(tài)決定了)。而距離依靠法是指進(jìn)化樹的拓?fù)湫螤钣蓛蓛尚蛄械倪M(jìn)化距離決定的。進(jìn)化樹枝條的長度代表著進(jìn)化距離

3、。獨立元素法包括最大簡約性法(MaximumParsimonymethods)和最大可能性法(MaximumLikelihoodmethods);距離依靠法包括除權(quán)配對法(UPGMAM)和鄰位相連法(Neighbor-joining)。⑶對進(jìn)化樹進(jìn)行評估。主要采用Bootstraping法。進(jìn)化樹的構(gòu)建是一個統(tǒng)計學(xué)問題。我們所構(gòu)建出來的進(jìn)化樹只是對真實的進(jìn)化關(guān)系的評估或者模擬。如果我們采用了一個適當(dāng)?shù)姆椒ǎ敲此鶚?gòu)建的進(jìn)化樹就會接近真實的“進(jìn)化樹”。模擬的進(jìn)化樹需要一種數(shù)學(xué)方法來對其進(jìn)行評估。不同的算法有不同的適用目標(biāo)。一般來說,最大簡約性法適用于符合以下條件的多序列:i所要比較的

4、序列的堿基差別小,ii對于序列上的每一個堿基有近似相等的變異率,iii沒有過多的顛換/轉(zhuǎn)換的傾向,iv所檢驗的序列的堿基數(shù)目較多(大于幾千個堿基);用最大可能性法分析序列則不需以上的諸多條件,但是此種方法計算極其耗時。如果分析的序列較多,有可能要花上幾天的時間才能計算完畢。UPGMAM(Unweightedpairgroupmethodwitharithmeticmean)假設(shè)在進(jìn)化過程中所有核苷酸/氨基酸都有相同的變異率,也就是存在著一個分子鐘。這種算法得到的進(jìn)化樹相對來說不是很準(zhǔn)確,現(xiàn)在已經(jīng)很少使用。鄰位相連法是一個經(jīng)常被使用的算法,它構(gòu)建的進(jìn)化樹相對準(zhǔn)確,而且計算快捷。其缺點

5、是序列上的所有位點都被同等對待,而且,所分析的序列的進(jìn)化距離不能太大。另外,需要特別指出的是對于一些特定多序列對象來說可能沒有任何一個現(xiàn)存算法非常適合它。最好是我們來發(fā)展一個更好的算法來解決它。但無疑這是非常難的。我想如果有人能建立這樣一個算法的話,那他(她)完全可以在Proc.Natl.Acad.Sci.USA.上發(fā)一篇高質(zhì)量的文章。下面介紹幾個軟件的使用。首先是PHYLIP。其是多個軟件的壓縮包,下載后雙擊則自動解壓。當(dāng)你解壓后就揮發(fā)現(xiàn)PHYLIP的功能極其強(qiáng)大,主要包括五個方面的功能軟件:i,DNA和蛋白質(zhì)序列數(shù)據(jù)的分析軟件。ii,序列數(shù)據(jù)轉(zhuǎn)變成距離數(shù)據(jù)后,對距離數(shù)據(jù)分析的軟

6、件。iii,對基因頻率和連續(xù)的元素分析的軟件。iv,把序列的每個堿基/氨基酸獨立看待(堿基/氨基酸只有0和1的狀態(tài))時,對序列進(jìn)行分析的軟件。v,按照DOLLO簡約性算法對序列進(jìn)行分析的軟件。vi,繪制和修改進(jìn)化樹的軟件。在此,我主要對前兩種功能軟件進(jìn)行說明。我們現(xiàn)在有幾個序列如下:Mo3ATGTATTTCGTACATTACTGCCAGCCACCATGAATATTGCACGGTACCATMo5ATGTATTTCGTACATTACTGCCAGCCACCATGAATATTGTACGGTACCATMo6ATGTATTTCGTACATTACTGCCAGCCACCATGAATATTGTACG

7、GTACCATMo7ATGTATTTCGTACATTACTGCCAGCCACCATGAATATTGTACAGTACCATMo8ATGTATTTCGTACATTACTGCCAGCCACCATGAATATTGTACAGTACCATMo9ATGTATCTCGTACATTACTGCCAGCCACCATGAATATTGTACGGTACCATMo12ATGTATTTCGTACATTACTGCCAGCCACCATGAATATTGTACGGTACCATMo13ATGTATCTCGTA

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。