資源描述:
《多序列比對的原理以及clustal在多序列比對中的應(yīng)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、多序列比對的原理以及clustal在多序列比對中的應(yīng)用中山大學(xué)生科院2003年10月內(nèi)容提要多序列比對的意義多序列比對的方法自動多序列比對的算法Clustalx的使用(clustal法)實例分析序列相似性比較和序列同源性分析序列相似性比較:就是將待研究序列與DNA或蛋白質(zhì)序列庫進行比較,用于確定該序列的生物屬性,也就是找出與此序列相似的已知序列是什么。完成這一工作只需要使用兩兩序列比較算法。常用的程序包有BLAST、FASTA等;序列同源性分析:是將待研究序列加入到一組與之同源,但來自不同物種的序列中進行多序列同時比較,以確定該序列與其它序列間的同源性大小。這是理論
2、分析方法中最關(guān)鍵的一步。完成這一工作必須使用多序列比較算法。常用的程序包有CLUSTAL等;多序列比對的意義用于描述一組序列之間的相似性關(guān)系,以便了解一個基因家族的基本特征,尋找motif,保守區(qū)域等。用于描述一個同源基因之間的親緣關(guān)系的遠近,應(yīng)用到分子進化分析中。其他應(yīng)用,如構(gòu)建profile,打分矩陣等。同源性分析中常常要通過多序列比對來找出序列之間的相互關(guān)系,和blast的局部匹配搜索不同,多序列比對大多都是采用全局比對的算法。這樣對于采用計算機程序的自動多序列比對是一個非常復(fù)雜且耗時的過程,特別是序列數(shù)目多,且序列長的情況下。多序列比對的方法多序列比對的方法
3、基本上多序列比對可以分為1.手工比對(輔助編輯軟件如bioedit,seaview,Genedoc等)通過輔助軟件的不同顏色顯示不同殘基,靠分析者的觀察來改變比對的狀態(tài)。2.計算機程序自動比對通過特定的算法(如同步法,漸進法等),由計算機程序自動搜索最佳的多序列比對狀態(tài)。自動多序列比對的算法1.同步法將序列兩兩比對時的二維動態(tài)規(guī)劃矩陣擴展到三維矩陣。即用矩陣的維數(shù)來反映比對的序列數(shù)目。這種方法的計算量很大,對于計算機系統(tǒng)的資源要求比較高,一般只有在進行少數(shù)的較短的序列的比對的時候才會用到這個方法。自動多序列比對的算法2.步進法最常見的就是clustal所采用的方法。
4、其基本思想就是基于相似序列通常具有進化相關(guān)性的這一假設(shè)。Clustal的漸進比對過程在比對過程中,先對所有的序列進行兩兩比對并計算它們相似性分值,然后根據(jù)相似性分值將它們分成若干組,并在每組之間進行比對,計算相似性分值。根據(jù)相似性分值繼續(xù)分組比對,直到得到最終比對結(jié)果。在比對過程中,相似性程度較高的序列先進行比對而距離較遠的序列添加在后面。多序列比對工具-clustalXClustal是一個單機版的基于漸進比對的多序列比對工具,由HigginsD.G.等開發(fā)。有應(yīng)用于多種操作系統(tǒng)平臺的版本,包括linux版,DOS版的clustlw,windows版本的clust
5、alx等。Clustal簡介CLUSTAL是一種漸進的比對方法,先將多個序列兩兩比對構(gòu)建距離矩陣,反應(yīng)序列之間兩兩關(guān)系;然后根據(jù)距離矩陣計算產(chǎn)生系統(tǒng)進化指導(dǎo)樹,對關(guān)系密切的序列進行加權(quán);然后從最緊密的兩條序列開始,逐步引入臨近的序列并不斷重新構(gòu)建比對,直到所有序列都被加入為止。Clustalx的工作界面(多序列比對模式)Clustalx的工作界面(剖面(profile)比對模式)Clustal的工作原理Clustal輸入多個序列快速的序列兩兩比對,計算序列間的距離,獲得一個距離矩陣。鄰接法(NJ)構(gòu)建一個樹(引導(dǎo)樹)根據(jù)引導(dǎo)樹,漸進比對多個序列。Clustal的
6、應(yīng)用1.輸入輸出格式。輸入序列的格式比較靈活,可以是前面介紹過的FASTA格式,還可以是PIR、SWISS-PROT、GDE、Clustal、GCG/MSF、RSF等格式。輸出格式也可以選擇,有ALN、GCG、PHYLIP和NEXUS等,用戶可以根據(jù)自己的需要選擇合適的輸出格式。2.兩種工作模式。a.多序列比對模式。b.剖面(profile)比對模式。3.一個實際的例子。Clustal的應(yīng)用多序列比對實例輸入文件的格式(fasta):>KCC2_YEASTNYIFGRTLGAGSFGVVRQARKLSTN……>DMK_HUMANDFEILKVIGRGAFSEVAVV
7、KMKQTGQVYAMKIMNK…….>KPRO_MAIZETRKFKVELGRGESGTVYKGVLEDDRHVAVKKLEN……>DAF1_CAEELQIRLTGRVGSGRFGNVSRGDYRGEAVAVKVFNALD……>1CSNHYKVGRRIGEGSFGVIFEGTNLLNN……第一步:輸入序列文件。第二步:設(shè)定比對的一些參數(shù)。參數(shù)設(shè)定窗口。第三步:開始序列比對。第四步:比對完成,選擇保存結(jié)果文件的格式在線的clustalw分析1.EBI提供的在線clustalw服務(wù)http://www.ebi.ac.uk/clustalw/2.我們構(gòu)建的在線clu