資源描述:
《系統(tǒng)發(fā)育樹構(gòu)建教程(phylip)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、系統(tǒng)發(fā)育樹構(gòu)建教程(PHYLIP)PHYLIP網(wǎng)址:http://evolution.genetics.washington.edu/phylip.html(一)序列的前期準(zhǔn)備1.用ENTREZ或SRS搜索同源DNA/蛋白質(zhì)序列(samesequenceindifferentorganisms)2.用CLUSTALX進(jìn)行多條序列比對(duì),在outputformatoption選定PHY格式,構(gòu)建進(jìn)化樹需要這個(gè)phy文件。Figure4.1用clustalx進(jìn)行多條序列比對(duì)3.解壓縮phylip-3.68.exe,得到三個(gè)文件夾,do
2、c文件夾里是關(guān)于所有PHYLIP子程序的使用說(shuō)明,exe文件夾里是直接可以使用的各個(gè)子程序,src文件夾里是所有程序的源文件。4.打開exe文件夾,雙擊SEQBOOTt子程序(SEQBOOT是一個(gè)利用bootstrap方法產(chǎn)生偽樣本的程序),輸入剛剛生成的phy文件的路徑,點(diǎn)擊enter。5.所有PHYLIP程序默認(rèn)的輸入文件名為infile,輸出文件名為outfile。如果在exe文件夾里找不到默認(rèn)的輸入文件,會(huì)提示can’tfindinputfile“infile”。Figure4.2seqboot程序起始界面6.進(jìn)入程序參
3、數(shù)選擇頁(yè)面(Figure4.3)。第一列中的D、J、%、B、R、W、C、S等代表可選的參數(shù)。想改變哪個(gè)參數(shù),就鍵入此參數(shù)對(duì)應(yīng)的字母,并點(diǎn)擊回車鍵,對(duì)應(yīng)參數(shù)將會(huì)發(fā)生改變。當(dāng)我們?cè)O(shè)置好所有參數(shù)后,(這里我們可以不做任何修改),鍵入Y,按回車。此時(shí)程序詢問(wèn)“randomnumberseed?”,這是詢問(wèn)生成隨機(jī)數(shù)的種子是多少,輸入一個(gè)4N+1的數(shù),點(diǎn)擊回車程序開始運(yùn)行,輸出結(jié)果到文件outfile,保存在當(dāng)前文件夾里。.5Figure4.3seqboot程序參數(shù)選擇頁(yè)面主要參數(shù)解釋:D:數(shù)據(jù)類型,有Molecul
4、arsequence、discretemorphology、restrictionsites和genefrequencies4個(gè)選項(xiàng)。J:偽樣本產(chǎn)生方法,有Bootstrap,Jackknife,Permute和rewrite4個(gè)選項(xiàng)。B:自舉法窗口大小選擇,可任意給定一個(gè)整數(shù)。R:產(chǎn)生偽樣本的數(shù)目。W:輸入文件為字符還是權(quán)重。S:輸出字符數(shù)據(jù)還是權(quán)重。Figure4.4seqboot程序運(yùn)行過(guò)程頁(yè)面程序默認(rèn)產(chǎn)生100個(gè)偽樣本,點(diǎn)擊回車關(guān)閉seqboot程序后,將outfile更名為seqb,用寫字板打開seqb,可以看到里面是
5、100套多條序列比對(duì)結(jié)果。(Figure4.5)5Figure4.5seqboot運(yùn)行后輸出文件內(nèi)容(二)最大簡(jiǎn)約法建樹(MaximumParsimony)1.打開DNAPARS(PROTPARS,如果序列是蛋白質(zhì)),將剛才生成的seqb文件名輸入。(Figure4.6)如果上一步輸出的outfile文件你忘了更名,將會(huì)有警告,詢問(wèn)你如何處理原來(lái)的outfile,是替換,還是在原文件后面續(xù)寫,或結(jié)果輸出到另一個(gè)文件或退出程序。Figure4.6dnapars程序起始頁(yè)面2.改M選項(xiàng)為分析multipledatasets(多個(gè)數(shù)據(jù)
6、,F(xiàn)igure4.7),其它參數(shù)不變,運(yùn)行將生成兩個(gè)文件outfile和outtree,將outfile更名為mpfile,將outtree更名為mptree。用寫字板打開mpfile(Figure4.8),用TREEVIEW打開mptree(Figure4.9)后,可以看到這兩個(gè)文件都含有100個(gè)進(jìn)化樹。Figure4.7dnapars程序參數(shù)選擇頁(yè)面5主要參數(shù)解釋:U:是否自動(dòng)尋找自佳樹,還是利用使用者所提供的樹S:尋找最佳樹的搜尋方式,morethorough或lessthoroughV:保存多少個(gè)樹numberoftre
7、estosaveJ:是否更改輸入序列的次序,如果選是,會(huì)要求輸入一個(gè)種子,4N+1的數(shù),然后詢問(wèn)打亂次數(shù),隨意給一個(gè)數(shù),不要太大,以免運(yùn)行時(shí)間過(guò)長(zhǎng)。O:外群位置,默認(rèn)不設(shè)外群,可以更改為任意一條序列。N:轉(zhuǎn)移和顛換是否全部計(jì)算在內(nèi)。W:位點(diǎn)之間是否權(quán)重不同M:是否分析多個(gè)數(shù)據(jù)。由于我們第一步seqboot產(chǎn)生了100個(gè)偽樣本,每一步都要更改這個(gè)選項(xiàng)。Figure4.8outfile(更名為mpfile)用寫字板打開Figure4.9outtree(更名為mptree)用treeview打開53.打開CONSENSE(將多個(gè)偽樣本
8、建成的不同樹,根據(jù)majority原則,得出一致樹)軟件,將剛才生成的mptree文件輸入。生成兩個(gè)文件outfile和outtree。Outfile可用記事本打開,outtree可用TREEVIEW打開。將兩個(gè)文件更名為cmpfile和cmptree,這就是我