第六章 蛋白質(zhì)的結(jié)構(gòu)與功能預測new

第六章 蛋白質(zhì)的結(jié)構(gòu)與功能預測new

ID:34447853

大?。?14.49 KB

頁數(shù):6頁

時間:2019-03-06

第六章 蛋白質(zhì)的結(jié)構(gòu)與功能預測new_第1頁
第六章 蛋白質(zhì)的結(jié)構(gòu)與功能預測new_第2頁
第六章 蛋白質(zhì)的結(jié)構(gòu)與功能預測new_第3頁
第六章 蛋白質(zhì)的結(jié)構(gòu)與功能預測new_第4頁
第六章 蛋白質(zhì)的結(jié)構(gòu)與功能預測new_第5頁
資源描述:

《第六章 蛋白質(zhì)的結(jié)構(gòu)與功能預測new》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、www.cab.zju.edu.cn/cab/xueyuanxiashubumen/nx/bioinplant.htm《生物信息學札記》樊龍江第六章蛋白質(zhì)的結(jié)構(gòu)與功能預測隨著人類基因組全序列測定的完成,預示著基因組研究從結(jié)構(gòu)基因組(StructuralGenomics)進入了功能基因組(FunctionalGenomics)研究時代。研究基因組功能當然首先要研究基因表達的模式。當前研究這一問題可以基于核酸技術(shù),也可以基于蛋白質(zhì)技術(shù),即直接研究基因的表達產(chǎn)物。測定一個有機體的基因組所表達的全部蛋白質(zhì)的設(shè)想是由Williams于1994年正式提出的,而“蛋白質(zhì)組”(proteome)一詞是Wilk

2、ins于1995年首次提出。蛋白質(zhì)組是指由一個細胞或組織的基因組所表達的全部相應的蛋白質(zhì)。蛋白質(zhì)組與基因組相對應,均是一個整體概念,但是兩者又有根本的不同:一個有機體只有一個確定的基因組,組成該有機體的所有不同細胞都共享有一個基因組;但是,基因組內(nèi)各個基因表達的條件、時間和部位等不同,因而它們的表達產(chǎn)物(蛋白質(zhì))也隨條件、時間和部位的不同而有所不同。因此,蛋白質(zhì)組又是一個動態(tài)的概念。由于以上原因,再加上由于基因剪接,蛋白質(zhì)翻譯后修飾和蛋白質(zhì)剪接,基因遺傳信息的表達規(guī)律更趨復雜,不再是經(jīng)典的一個基因一個蛋白的對應關(guān)系,而是一個基因可以表達的蛋白質(zhì)數(shù)目大于一。由此可見,蛋白質(zhì)組研究是一項復雜而艱巨

3、的任務。蛋白質(zhì)結(jié)構(gòu)與功能的研究已有相當長的歷史,由于其復雜性,對其結(jié)構(gòu)與功能的預測不論是方法論還是基礎(chǔ)理論方面均較復雜。統(tǒng)計學方法曾被成功地應用于蛋白質(zhì)二級結(jié)構(gòu)預測中,如Chou和Fasman提出的經(jīng)驗參數(shù)法便是最突出的例子。該方法統(tǒng)計分析了各種氨基酸的二級結(jié)構(gòu)分布特征,得出相應參數(shù)(Pа,Pβ和Pt)并用于預測。本章將簡要介紹蛋白質(zhì)結(jié)構(gòu)與功能預測的生物信息學途徑。第一節(jié)蛋白質(zhì)功能預測一、根據(jù)序列預測功能的一般過程如果序列重疊群(contig)包含有蛋白質(zhì)編碼區(qū),則接下來的分析任務是確定表達產(chǎn)物——蛋白質(zhì)的功能。蛋白質(zhì)的許多特性可直接從序列上分析獲得,如疏水性,它可以用于預測序列是否跨膜螺旋(

4、transmenbranehelix)或是前導序列(leadersequence)。但是,總的來說,我們根據(jù)序列預測蛋白質(zhì)功能的唯一方法是通過數(shù)據(jù)庫搜尋,比較該蛋白是否與已知功能的蛋白質(zhì)相似。有2條主要途徑可以進行上述的比較分析:①比較未知蛋白序列與已知蛋白質(zhì)序列的相似性;②查找未知蛋白中是否包含與特定蛋白質(zhì)家族或功能域有關(guān)的亞序列或保守區(qū)段。圖6.1給出了根據(jù)序列預測蛋白質(zhì)功能的大致過程。由于涉及數(shù)條技術(shù)路線,所得出的分析結(jié)果并不會總是相一致。一般來說,數(shù)據(jù)庫相似性搜索獲得的結(jié)果最為可靠,而來自PROSITE的結(jié)果相對不可靠。119www.cab.zju.edu.cn/cab/xueyuan

5、xiashubumen/nx/bioinplant.htm《生物信息學札記》樊龍江是否未知蛋白質(zhì)序列與已知功能的蛋白質(zhì)相似(詳見第2小節(jié))確定跨膜螺旋、卷曲螺旋和前導序列(詳見第3小節(jié))未知序列是否包含保守序列模序(詳見第4小節(jié))查對PROSITE數(shù)據(jù)查對BLOCKS和庫PRINTS數(shù)據(jù)庫整理所有肯定的結(jié)果并核對一致性預測蛋白質(zhì)功能圖6.1根據(jù)序列預測蛋白質(zhì)功能的技術(shù)路線二、通過比對數(shù)據(jù)庫相似序列確定功能具有相似序列的蛋白質(zhì)具有相似的功能。因此,最可靠的確定蛋白質(zhì)功能的方法是進行數(shù)據(jù)庫的相似性搜索。具體的搜索方法可參見第三章,但應記住,一個顯著的匹配應至少有25%的相同序列和超過80個氨基酸的

6、區(qū)段。已有不少種類的數(shù)據(jù)庫搜索工具,它們或者搜索速度慢,但靈敏;或者快速,但不靈敏??焖偎阉鞴ぞ?如BLASTP)很容易發(fā)現(xiàn)匹配良好的序列,所以沒有必要再運行更花時的工具(如FASTA、BLITZ);只有在諸如BLASTP不能發(fā)現(xiàn)顯著的匹配序列時,這些工具才被使用。所以,一般的策略是首先進行BLAST檢索,如果不能提供相關(guān)結(jié)果,運行FASTA;如果FASTA也不能得到有關(guān)蛋白質(zhì)功能的線索,最后可選用完全根據(jù)Smith-Waterman算法設(shè)計的搜索程序,例如BLITZ(www.ebi.ac.uk/searches/blitz.html)。BLITZ不做近似估計(BLAST和FASTA根據(jù)Smi

7、th-Waterman算法做近似估計),所以很花時,但非常靈敏。通常諸如BLITZ的程序能夠發(fā)現(xiàn)超過幾百個殘基但序列相同比率低于20~25%的匹配,這些匹配可能達到顯著,但會被那些應用近似估計的程序錯過。還應注意計分矩陣(scoringmatrix)的重要性。選用不同的計分矩陣有不少重要原因:首先,選用的矩陣必須與匹配水平相一致,例如,PAM250應用于遠距離匹配(<25%相同比率),PAM40應

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。