資源描述:
《序列比對基礎(chǔ)與blast入門打分矩陣》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、序列比對基礎(chǔ)與BLAST入門生物信息學(xué)補(bǔ)充一:打分矩陣序列比對的基本原理提出比對要考慮的問題專業(yè)算法(構(gòu)建打分矩陣)數(shù)學(xué)程序計(jì)算機(jī)搜索數(shù)據(jù)庫計(jì)算機(jī)給出比對結(jié)果(比對分?jǐn)?shù)、顯著性檢驗(yàn))打分一、算法與程序算法是指按照一定的方式描述計(jì)算過程或處理某個問題的一系列步驟。程序則是算法的具體實(shí)現(xiàn),也就是用某種計(jì)算機(jī)語言編寫的實(shí)現(xiàn)某個算法的一組指令集合。一個算法可能會有多種實(shí)現(xiàn)的方法。如果算法的描述或定義明確,那么這些不同的實(shí)現(xiàn)方法,即不同的程序應(yīng)給出同樣的結(jié)果。二、打分矩陣(ScoringMatrix)簡介要對兩個
2、序列進(jìn)行比對,必須首先打出其相似性的定量分值,于是需要一個打分矩陣。矩陣(Matrix):是由m×n個數(shù)組成的一個m行n列的矩形表格。矩陣(Matrix)某公司生產(chǎn)四種產(chǎn)品A、B、C、D,第一季度的銷量分別如下表所示:產(chǎn)品銷量(件)月份ABCD一月300250220180二月320230200200三月310280210220矩陣(Matrix)為了研究方便,在數(shù)學(xué)中常把表中的說明去掉,將上表簡化為如下的矩形數(shù)表:由3×4個數(shù)組成的一個3行4列的矩形表格。此表在數(shù)學(xué)上稱為矩陣(縱橫排列的二維數(shù)據(jù)表格)。
3、核酸打分矩陣----AT--GCAT--GCATGC--ATGCATATATATATAT----ATATAT----GCATGCATGCATGCATGC
4、
5、
6、
7、
8、
9、
10、
11、
12、
13、
14、
15、
16、
17、
18、
19、
20、
21、
22、
23、
24、
25、
26、
27、
28、
29、
30、
31、
32、
33、
34、
35、
36、
37、
38、
39、
40、
41、
42、
43、
44、
45、
46、CGATCG--ATCG--AT--CG--------ATATATATATATGCATATATATGCATGCATGCATGCAT上述序列比對過程中,只考慮了堿基的同一性,即兩個序列之間完全相同的匹配堿基數(shù)目。可以把這種只考慮堿基同一性的矩陣?yán)斫鉃橐粋€分?jǐn)?shù)值為1和0的
47、分?jǐn)?shù)矩陣,即相同殘基的分?jǐn)?shù)值為1,不同殘基的分?jǐn)?shù)值為0。用于核酸比對的簡單打分矩陣ACGTA1000C0100G0010T0001ACGTA5-4-4-4C-45-4-4G-4-45-4T-4-4-45單一打分矩陣BLAST打分矩陣蛋白質(zhì)打分矩陣保守性替換(conservativesubstitution)通常在某些位點(diǎn)上有一些氨基酸被另外一些理化特性相似的氨基酸所代替,這種突變可稱為保守性替換。保守性替換一般不會影響蛋白質(zhì)的結(jié)構(gòu)和功能。與核苷酸序列比對不同,氨基酸序列比對不僅要考慮殘基是否相同,還要考
48、慮殘基是否相似以及相似的不同程度。LAAWAAAERDCRVSSFRVKENFDKARFSGTWYAMAKKDPE
49、
50、.
51、:
52、
53、
54、
55、
56、:ALALTCGAQALIVT..QTMKGLDIQKVAGTWYSLAMAASD1.極性中性氨基酸(親水,含羥基)2.堿性氨基酸氨基酸分類alanine丙氨酸AlaAvaline纈氨酸ValVleucine亮氨酸LeuLisoleucine異亮氨酸IleIphenylalanine苯丙氨酸PheFproline脯氨酸ProPmethionine甲硫氨酸MetMglyci
57、ne甘氨酸GlyGtryptophan色氨酸TrpWserine絲氨酸SerStyrosine酪氨酸TyrYcysteine半胱氨酸CysCasparagine天冬酰氨AsnNglutarmine谷氨酰胺GlnQthreonine蘇氨酸ThrTasparticacid天冬氨酸AspDglutarmicacid谷氨酸GluEarginine精氨酸ArgRhistidine組氨酸HisHlysine賴氨酸LysK非極性疏水性氨基酸極性中性氨基酸酸性氨基酸堿性氨基酸(芳香族氨基酸F、W、Y)(含硫氨基酸C、M
58、)王鏡巖編《生物化學(xué)》(第三版)第127頁果蠅GAKKVIISAPSAD.APM..FVCGVNLDAYKPDMKVVSNASCTTNCLAPLA人類GAKRVIISAPSAD.APM..FVMGVNHEKYDNSLKIISNASCTTNCLAPLA植物GAKKVIISAPSAD.APM..FVVGVNEHTYQPNMDIVSNASCTTNCLAPLA細(xì)菌GAKKVVMTGPSKDNTPM..FVKGANFDKY.AGQDIVSNASCTTNCLAPLA酵母GAKKVVITAPSS.TAPM..FVMG
59、VNEEKYTSDLKIVSNASCTTNCLAPLA古細(xì)GAKKVLISAPPKGDEPVKQLVYGVNHDEYDGE.DVVSNASCTTNSITPVA果蠅KVINDNFEIVEGLMTTVHATTATQKTVDGPSGKLWRDGRGAAQNIIPAST人類KVIHDNFGIVEGLMTTVHAITATQKTVDGPSGKLWRDGRGALQNIIPAST植物KVVHEEFGILEGLMTTVHATTATQKTVDGPSMKDWRG