第六章蛋白質(zhì)的結(jié)構(gòu)與功能預測new

ID：34447853

大?。?14.49 KB

頁數(shù)：6頁

時間：2019-03-06

資源描述：

《第六章蛋白質(zhì)的結(jié)構(gòu)與功能預測new》由會員上傳分享，免費在線閱讀，更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、www.cab.zju.edu.cn/cab/xueyuanxiashubumen/nx/bioinplant.htm《生物信息學札記》樊龍江第六章蛋白質(zhì)的結(jié)構(gòu)與功能預測隨著人類基因組全序列測定的完成，預示著基因組研究從結(jié)構(gòu)基因組(StructuralGenomics)進入了功能基因組(FunctionalGenomics)研究時代。研究基因組功能當然首先要研究基因表達的模式。當前研究這一問題可以基于核酸技術(shù)，也可以基于蛋白質(zhì)技術(shù)，即直接研究基因的表達產(chǎn)物。測定一個有機體的基因組所表達的全部蛋白質(zhì)的設(shè)想是由Williams于1994年正式提出的，而“蛋白質(zhì)組”(proteome)一詞是Wilk

2、ins于1995年首次提出。蛋白質(zhì)組是指由一個細胞或組織的基因組所表達的全部相應的蛋白質(zhì)。蛋白質(zhì)組與基因組相對應，均是一個整體概念，但是兩者又有根本的不同：一個有機體只有一個確定的基因組，組成該有機體的所有不同細胞都共享有一個基因組；但是，基因組內(nèi)各個基因表達的條件、時間和部位等不同，因而它們的表達產(chǎn)物(蛋白質(zhì))也隨條件、時間和部位的不同而有所不同。因此，蛋白質(zhì)組又是一個動態(tài)的概念。由于以上原因，再加上由于基因剪接，蛋白質(zhì)翻譯后修飾和蛋白質(zhì)剪接，基因遺傳信息的表達規(guī)律更趨復雜，不再是經(jīng)典的一個基因一個蛋白的對應關(guān)系，而是一個基因可以表達的蛋白質(zhì)數(shù)目大于一。由此可見，蛋白質(zhì)組研究是一項復雜而艱巨

3、的任務。蛋白質(zhì)結(jié)構(gòu)與功能的研究已有相當長的歷史，由于其復雜性，對其結(jié)構(gòu)與功能的預測不論是方法論還是基礎(chǔ)理論方面均較復雜。統(tǒng)計學方法曾被成功地應用于蛋白質(zhì)二級結(jié)構(gòu)預測中，如Chou和Fasman提出的經(jīng)驗參數(shù)法便是最突出的例子。該方法統(tǒng)計分析了各種氨基酸的二級結(jié)構(gòu)分布特征，得出相應參數(shù)(Pа,Pβ和Pt)并用于預測。本章將簡要介紹蛋白質(zhì)結(jié)構(gòu)與功能預測的生物信息學途徑。第一節(jié)蛋白質(zhì)功能預測一、根據(jù)序列預測功能的一般過程如果序列重疊群(contig)包含有蛋白質(zhì)編碼區(qū)，則接下來的分析任務是確定表達產(chǎn)物——蛋白質(zhì)的功能。蛋白質(zhì)的許多特性可直接從序列上分析獲得，如疏水性，它可以用于預測序列是否跨膜螺旋(

4、transmenbranehelix)或是前導序列(leadersequence)。但是，總的來說，我們根據(jù)序列預測蛋白質(zhì)功能的唯一方法是通過數(shù)據(jù)庫搜尋，比較該蛋白是否與已知功能的蛋白質(zhì)相似。有2條主要途徑可以進行上述的比較分析：①比較未知蛋白序列與已知蛋白質(zhì)序列的相似性；②查找未知蛋白中是否包含與特定蛋白質(zhì)家族或功能域有關(guān)的亞序列或保守區(qū)段。圖6.1給出了根據(jù)序列預測蛋白質(zhì)功能的大致過程。由于涉及數(shù)條技術(shù)路線，所得出的分析結(jié)果并不會總是相一致。一般來說，數(shù)據(jù)庫相似性搜索獲得的結(jié)果最為可靠，而來自PROSITE的結(jié)果相對不可靠。119www.cab.zju.edu.cn/cab/xueyuan

5、xiashubumen/nx/bioinplant.htm《生物信息學札記》樊龍江是否未知蛋白質(zhì)序列與已知功能的蛋白質(zhì)相似(詳見第2小節(jié))確定跨膜螺旋、卷曲螺旋和前導序列(詳見第3小節(jié))未知序列是否包含保守序列模序(詳見第4小節(jié))查對PROSITE數(shù)據(jù)查對BLOCKS和庫PRINTS數(shù)據(jù)庫整理所有肯定的結(jié)果并核對一致性預測蛋白質(zhì)功能圖6.1根據(jù)序列預測蛋白質(zhì)功能的技術(shù)路線二、通過比對數(shù)據(jù)庫相似序列確定功能具有相似序列的蛋白質(zhì)具有相似的功能。因此，最可靠的確定蛋白質(zhì)功能的方法是進行數(shù)據(jù)庫的相似性搜索。具體的搜索方法可參見第三章，但應記住，一個顯著的匹配應至少有25%的相同序列和超過80個氨基酸的

6、區(qū)段。已有不少種類的數(shù)據(jù)庫搜索工具，它們或者搜索速度慢，但靈敏；或者快速，但不靈敏?？焖偎阉鞴ぞ?如BLASTP)很容易發(fā)現(xiàn)匹配良好的序列，所以沒有必要再運行更花時的工具(如FASTA、BLITZ)；只有在諸如BLASTP不能發(fā)現(xiàn)顯著的匹配序列時，這些工具才被使用。所以，一般的策略是首先進行BLAST檢索，如果不能提供相關(guān)結(jié)果，運行FASTA；如果FASTA也不能得到有關(guān)蛋白質(zhì)功能的線索，最后可選用完全根據(jù)Smith-Waterman算法設(shè)計的搜索程序，例如BLITZ(www.ebi.ac.uk/searches/blitz.html)。BLITZ不做近似估計(BLAST和FASTA根據(jù)Smi

7、th-Waterman算法做近似估計)，所以很花時，但非常靈敏。通常諸如BLITZ的程序能夠發(fā)現(xiàn)超過幾百個殘基但序列相同比率低于20～25%的匹配，這些匹配可能達到顯著，但會被那些應用近似估計的程序錯過。還應注意計分矩陣(scoringmatrix)的重要性。選用不同的計分矩陣有不少重要原因：首先，選用的矩陣必須與匹配水平相一致，例如，PAM250應用于遠距離匹配(<25%相同比率)，PAM40應

當前文檔最多預覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 6



此文檔下載收益歸作者所有

當前文檔最多預覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學公式或PPT動畫的文件，查看預覽時可能會顯示錯亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容，確認文檔內(nèi)容符合您的需求后進行下載，若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤，付費完成后未能成功下載的用戶請聯(lián)系客服處理。

第六章蛋白質(zhì)的結(jié)構(gòu)與功能預測new

第六章蛋白質(zhì)的結(jié)構(gòu)與功能預測new

相關(guān)文章

相關(guān)標簽

第六章 蛋白質(zhì)的結(jié)構(gòu)與功能預測new

第六章 蛋白質(zhì)的結(jié)構(gòu)與功能預測new

相關(guān)文章

相關(guān)標簽

第六章蛋白質(zhì)的結(jié)構(gòu)與功能預測new

第六章蛋白質(zhì)的結(jié)構(gòu)與功能預測new