資源描述:
《《序列比對》課件》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第三章序列比對為什么要序列比對?基于同源物鑒定的功能預測基本假設(shè):序列的保守性功能的保守性因為:1.蛋白質(zhì)一般在三級結(jié)構(gòu)的層面上執(zhí)行功能;2.蛋白質(zhì)序列的保守性決定于其編碼DNA的保守性。序列比對中的進化假設(shè)1.所有的生物都起源于同一個祖先;2.序列不是隨機產(chǎn)生,而是在進化上,不斷發(fā)生著演變;3.基本假設(shè):序列保守性結(jié)構(gòu)保守性注意:反之并不為真。結(jié)構(gòu)保守性序列保守性contents3.1概述3.2兩條序列比對方法3.3多條序列比對方法3.1概述3.1.1序列比對的概念3.1.2生物序列之間的關(guān)系⑴序列比對(Seq
2、uencealignment)序列比對是序列相似性分析的常用方法,又稱序列聯(lián)配。通過將兩個或多個核酸序列或蛋白序列進行比對,顯示其中相似的結(jié)構(gòu)域,這是進一步相似性分析的基礎(chǔ)。通過比較未知序列與已知序列的一致性或相似性,可以預測未知序列功能。3.1.1序列比對的概念兩條序列比對(pairwisealignment)通過比較兩條序列之間的相似區(qū)域和保守性位點,尋找二者之間可能的進化關(guān)系。多重序列比對(multiplealignment)不同物種中,許多基因的功能保守,序列相似性較高,通過多條序列的比較,發(fā)現(xiàn)保守與變異的部
3、分2.可構(gòu)建HMM模型,搜索更多的同源序列3.構(gòu)建進化的樹的必須步驟4.比較基因組學研究5.兩類:全局或局部的多序列比對⑵同源性和相似性如果兩個序列有一個共同的進化祖先,那么它們是同源的。這里不存在同源性的程度問題。這兩條序列之間要么是同源的,要么是不同源的。所謂同源序列,簡單地說,是指從某一共同祖先經(jīng)趨異進化而形成的不同序列。同源蛋白質(zhì)的氨基酸序列具有明顯的相似性,這種相似性稱為序列同源性。同源性(homology)相似性(similarity)相似性是指序列比對過程中用來描述檢測序列和目標序列之間相同DNA堿基或
4、氨基酸殘基順序所占比例的高低。相似性本身的含義,并不要求與進化起源是否同一,與親緣關(guān)系的遠近、甚至于結(jié)構(gòu)與功能有什么聯(lián)系。當相似程度高于50%時,比較容易推測檢測序列和目標序列可能是同源序列;而當相似性程度低于20%時,就難以確定或者根本無法確定其是否具有同源性。⑶直系同源和旁系同源直系同源(orthology)是指不同物種內(nèi)的同源序列,它們來源于物種形成時的共同祖先基因。(1)在進化上起源于一個始祖基因并垂直傳遞(verticaldescent)的同源基因;(2)分布于兩種或兩種以上物種的基因組;(3)功能高度保守
5、乃至于近乎相同,甚至于其在近緣物種可以相互替換;(4)結(jié)構(gòu)相似;(5)組織特異性與亞細胞分布相似。旁系同源(paralogy)基因是指同一基因組(或同一物種的基因組)中,由于始祖基因的加倍而橫向/水平方向(horizontal)產(chǎn)生的幾個同源基因。即:旁系同源是基因復制的結(jié)果,兩份拷貝在一個物種的歷史上時平行演化的。這樣的基因就被稱為旁系同源基因。直系同源和旁系同源直系與旁系的共性是同源,都源于各自的始祖基因。其區(qū)別在于:在進化起源上,直系同源是強調(diào)在不同基因組中的垂直傳遞,旁系同源則是在同一基因組中的橫向加倍;在功
6、能上,直系同源要求功能高度相似,而旁系同源在定義上對功能上沒有嚴格要求,可能相似,但也可能并不相似(盡管結(jié)構(gòu)上具一定程度的相似),甚至于沒有功能(如基因家族中的假基因)。⑷序列比對的數(shù)學模型對序列從頭到尾進行比較,試圖使盡可能多的字符在同一列中匹配。適用于相似度較高且長度相近的序列如:Needleman-Wunsch算法全局比對局部比對尋找序列中相似度最高的區(qū)域,也就是匹配密度最高的部分。適用于在某些部分相似度較高,而其他部位差異較大的序列。如:Smith-Waterman算法序列比對的數(shù)學模型大體可以分為兩類,一類
7、從全長序列出發(fā),考慮序列的整體相似性,即整體比對;第二類考慮序列部分區(qū)域的相似性,即局部比對。局部相似性比對局部相似性比對的生物學基礎(chǔ)是蛋白質(zhì)功能位點往往是由較短的序列片段組成的,這些部位的序列具有相當大的保守性,盡管在序列的其它部位可能有插入、刪除或突變。此時,局部相似性比對往往比整體比對具有更高的靈敏度,其結(jié)果更具生物學意義。BLAST和FastA等常用的數(shù)據(jù)庫搜索程序均采用局部相似性比對的方法,具有較快的運行速度,而基于整體相似性比對的數(shù)據(jù)庫搜索程序則需要超級計算機或?qū)S糜嬎銠C才能實現(xiàn)。3.2兩條序列比對方法序
8、列兩兩比對分析是最簡單、最基本的對齊分析。三種方法:點陣分析法動態(tài)規(guī)劃法:Needleman-Wunsch算法、Smith-Waterman算法詞或K串法(BLASTorFASTA中應用)3.2.1采用Blast進行序列兩兩對齊分析3.2.2采用本地化軟件進行兩條序列比對3.2.1采用Blast進行序列兩兩對齊分析Blast是一個局部比對搜索工