資源描述:
《基因組學和蛋白質(zhì)組學工具》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在行業(yè)資料-天天文庫。
1、基因組學和蛋白質(zhì)組學工具本科08級通信工程1班況玲主要內(nèi)容一、序列組裝二、功能基因組學三、蛋白質(zhì)組學一、序列組裝研究內(nèi)容:1、怎樣將散的序列拼接起來2、如何去掉序列中重復的部分1、怎樣將散的序列拼接起來我們知道,使用鳥槍法的DNA測序提供了成千上百萬個小序列,每一個片段長度有400~500個堿基對。當基因組被提取成限制性片段時,它只是被部分提取。用于DNA樣品的限制性酶數(shù)量只能夠切開50%的酶切位點。這就意味著有些片段會跨過某個特殊的限制性位點,而另一些片段會在那個特定位點切開,而跨過其他的限制性位點。因此,這些限制性片段組成的克隆庫會包含重疊片段。這些重疊片段正是序列拼接的基礎。
2、1、怎樣將散的序列拼接起來在得到了每個片段的序列后,序列拼接(sequenceassembly)的任務就利用這些片段間的重疊,將它們拼接成原來的序列。拼接的關鍵問題是得到每個片段在一個長序列中的位置信息,這種組合的集合稱為contig(contiguoussegment)。序列拼接問題可以抽象為最短超序列問題(ShortestSuperstringProblem,SSP)。假設一個序列片段集合A={a1,a2,?,an},我們希望發(fā)現(xiàn)一個最短的序列S,A中所有的片段都是S的子序列。例如有序列集合:{000,001,010,011,100,101,110,101,111},包括集合中
3、所有序列的最短超序列是:0001110100。1、怎樣將散的序列拼接起來直接鳥槍法序列拼接:從已測序的小片段中尋找彼此重疊的測序克隆,依次向兩側(cè)鄰接的序列延伸,組裝成一個完整的基因組。不需預先了解任何基因組的情況,即使缺少遺傳圖或物理圖也可完成整個基因組順序組裝。優(yōu)點:最大優(yōu)點是經(jīng)濟、快速、高效。缺點:“鳥槍法”對高性能計算的方法和設備要求非常高,且無法測到人類基因組中重復出現(xiàn)的DNA片段,這些片段占到基因組的3%至5%,對于理解遺傳性疾病具有重要意義。1、怎樣將散的序列拼接起來Phrap算法序列拼接:1、找出序列片段間的重疊信息。2、將存在有重疊的片段組合起來,形成一個conti
4、g結(jié)構(gòu)。3、形成Consensus序列(Consensus)。優(yōu)點:精確度較高。缺點:運算時間較長且對存儲空間的需求較大。2、如何去掉序列中重復的部分重復片段是指在目標片段中多次出現(xiàn)的片段。對于小規(guī)模的拼接工作例如細菌的基因組(重復序列約占全序列的1.5%)和果蠅基因組(約占全序列的3%)等,問題不明顯,然而,人類基因組中含有50%以上的重復序列,這就對基因組測序產(chǎn)生了很大的困難。目前已經(jīng)出現(xiàn)的很多用于shotgun片段拼接的工具,在處理重復片段時,都是采用對大量的片段數(shù)據(jù)進行反復迭代的方法,此間還需要加入很多人工的經(jīng)驗分析和干預。一定程度上增加了拼接所花費的時間,降低了機器的使用
5、效率。所以,在使用過程中,我們應該選擇可以屏蔽重復片段的拼接算法。2、如何去掉序列中重復的部分基于特征子串的重復片段屏蔽方法:DNA序列和每一個片段序列都可以看做是字符集{A,C,T,G}上的字符串,每個長為k的字符串稱為k-串;若它是某個片段(或序列)的一部分,則稱它為此片段(或序列)的k-子串.特征子串:當一個k-子串為某個片段的標識性信息時,稱該k-子串為該片段的特征子串。PL條件:兩片段含有至少一個公共的特征子串,稱之滿足可能相鄰(PL)條件。經(jīng)計算,k需滿足條件:其中n為要拼接片段的總數(shù)。2、如何去掉序列中重復的部分算法原理:即使兩個本不相鄰的片段因為重復片段的原因存在很
6、長的重疊,但只要它們的特征子串均不相同,處理時就不會對它們進行比對,也就不會認為它們是相鄰的。這樣就達到了“屏蔽”重復片段干擾的目的,也為后續(xù)的拼接產(chǎn)生了有用的依據(jù)。二、功能基因組學(functionalgenomics)功能基因組學的概念:功能基因組學(Functuionalgenomics)又往往被稱為后基因組學(Postgenomics),它利用結(jié)構(gòu)基因組所提供的信息和產(chǎn)物,發(fā)展和應用新的實驗手段,通過在基因組或系統(tǒng)水平上全面分析基因的功能,使得生物學研究從對單一基因或蛋白質(zhì)得研究轉(zhuǎn)向多個基因或蛋白質(zhì)同時進行系統(tǒng)的研究。功能基因組在評估和檢測新藥時十分有用。二、功能基因組學(
7、functionalgenomics)DNA微陣列——功能基因組中的新興技術(shù)DNA微陣列(DNAmicroarray)又稱DNA陣列或DNA芯片,比較通俗的名字是基因芯片(genechip)。是一塊帶有DNA微陣列(micorarray)涂層的特殊玻璃片,在數(shù)平方厘米之面積上安裝數(shù)千或數(shù)萬個核酸探針,經(jīng)由一次測驗,即可提供大量基因序列相關資訊。它是基因組學和遺傳學研究的工具。研究人員應用基因芯片就可以在同一時間定量的分析大量(成千上萬個)的基因達的水平,具有快速、精確