資源描述:
《全基因組表達(dá)譜分析方法(dge)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、全基因組表達(dá)譜分析方法(DGE)----基于新一代測(cè)序技術(shù)的技術(shù)路線該方法首先從每個(gè)mRNA的3’端酶切得到一段21bp的TAG片段(特異性標(biāo)記該基因);然后通過高通量測(cè)序,得到大量的TAG序列,不同的TAG序列的數(shù)量就代表了相應(yīng)基因的表達(dá)量;通過生物信息學(xué)分析得到TAG代表的基因、基因表達(dá)水平、以及樣品間基因表達(dá)差異等信息。技術(shù)路線如下:1、樣品準(zhǔn)備:a)提供濃度≥300ng/ul、總量≥6ug、OD260/280為1.8~2.2的總RNA樣品;2、樣品制備(見圖1-1):a)類似SAGE技術(shù),通過特異性酶切的方法從每個(gè)mRNA的3’
2、末端得到一段21bp的特異性片段,用來標(biāo)記該基因,稱為TAG;b)在TAG片段兩端連接上用于測(cè)序的接頭引物;3、上機(jī)測(cè)序:a)通過高通量測(cè)序每個(gè)樣品可以得到至少250萬條TAG序列;4、基本信息分析:a)對(duì)原始數(shù)據(jù)進(jìn)行基本處理,得到高質(zhì)量的TAG序列;b)通過統(tǒng)計(jì)每個(gè)TAG序列的數(shù)量,得到該TAG標(biāo)記的基因的表達(dá)量;c)對(duì)TAG進(jìn)行注釋,建立TAG和基因的對(duì)應(yīng)關(guān)系;d)基因在正義鏈和反義鏈上表達(dá)量間的關(guān)系;e)其它統(tǒng)計(jì)分析;5、高級(jí)信息分析:a)基因在樣品間差異表達(dá)分析;b)庫容量飽和度分析;c)其它分析;測(cè)序優(yōu)勢(shì)利用高通量測(cè)序進(jìn)行表達(dá)
3、譜研究的優(yōu)勢(shì)很明顯,具體如下:1.?dāng)?shù)字化信號(hào):直接測(cè)定每個(gè)基因的特異性表達(dá)標(biāo)簽序列,通過計(jì)數(shù)表達(dá)標(biāo)簽序列的數(shù)目來確定該基因的表達(dá)量,大大提高了定量分析的準(zhǔn)確度。整體表達(dá)差異分布符合正態(tài)分布,不會(huì)因?yàn)椴煌螌?shí)驗(yàn)引起不必要的誤差。2.可重復(fù)性高:不同批次的表達(dá)譜度量準(zhǔn)確,能夠更準(zhǔn)確的進(jìn)行表達(dá)差異分析。3.高靈敏度:對(duì)于表達(dá)差異不大的基因能夠靈敏的檢測(cè)其表達(dá)差異;能夠檢測(cè)出低豐度的表達(dá)基因。4.全基因組分析,高性價(jià)比:由于該技術(shù)不用事先設(shè)計(jì)探針,而是直接測(cè)序的方式,因此無需了解物種基因信息,可以直接對(duì)任何物種進(jìn)行包括未知基因在內(nèi)的全基因組表
4、達(dá)譜分析,因此性價(jià)比很高。5.高通量測(cè)序:已有數(shù)據(jù)表明,當(dāng)測(cè)序通量達(dá)到200萬個(gè)表達(dá)標(biāo)簽時(shí),即可得到樣本中接近全部表達(dá)基因的表達(dá)量數(shù)據(jù),而目前每個(gè)樣本分析可以得到300萬~600萬個(gè)表達(dá)標(biāo)簽。6.無需重復(fù)實(shí)驗(yàn)。7.可同時(shí)發(fā)現(xiàn)新的轉(zhuǎn)錄本、基因組表達(dá)調(diào)控區(qū)域等。8.完整深入的生物信息學(xué)分析支持,更有助于進(jìn)行重要的科學(xué)發(fā)現(xiàn),發(fā)高質(zhì)量的文章。表達(dá)譜案例分析肺癌組織的表達(dá)譜分析:選取2個(gè)肺癌病人(5T和10T)的組織提取總RNA,進(jìn)行分析。實(shí)驗(yàn)?zāi)康模簽榱藱z測(cè)兩個(gè)病人中表達(dá)差異較大的基因,以便找出兩個(gè)病人癥狀差異的原因,并進(jìn)行下一步相關(guān)的研究。1、
5、數(shù)據(jù)質(zhì)量的概述通過嚴(yán)格的質(zhì)量標(biāo)準(zhǔn)篩選后,通過率達(dá)到80%,最終得到500萬左右的Tag標(biāo)簽。2、標(biāo)簽的初步分析統(tǒng)計(jì)兩個(gè)樣品中有95%的Tag重復(fù)頻度超過1,73%以上的Tag重復(fù)頻度超過50。3、表達(dá)譜測(cè)序飽和度分析通過對(duì)表達(dá)譜測(cè)序飽和度的分析,通常在表達(dá)譜Tag數(shù)目達(dá)到200萬時(shí),測(cè)序Tag接近飽和。因此,通過Solexa測(cè)序,僅需要1次試驗(yàn),就可以得到足夠后續(xù)進(jìn)行表達(dá)分析的數(shù)據(jù)。4、樣品重復(fù)性。5、Tag標(biāo)簽的注釋(含cDNA,預(yù)測(cè)基因,EST,線粒體基因組,基因組等)本案例中,人的2萬7千個(gè)基因中有50~60%都被Tag所覆蓋。即
6、一般的基因的表達(dá)量差異被檢測(cè)出來。為了提高Tag同基因關(guān)聯(lián)的可信度,我們僅僅選取了在基因序列中唯一定位的Tag。這部分唯一定位的Tag占全部Tag數(shù)目的50%左右。另外,除去上述用于基因表達(dá)量統(tǒng)計(jì)的唯一定位Tag,有大約20%的Tag被定位到了基因組的未注釋區(qū)域,其中大約有10萬個(gè)Tag在基因組上的位置是唯一的。利用這些數(shù)據(jù)我們找到了許多新的轉(zhuǎn)錄本和調(diào)控區(qū)域。同時(shí)發(fā)現(xiàn)了若干潛在的兩個(gè)樣品間顯著差異的區(qū)域。為后續(xù)的實(shí)驗(yàn)提供了可靠的研究目標(biāo)。6、參考Tag標(biāo)簽的統(tǒng)計(jì)分析下表顯示的人的參考Tag的統(tǒng)計(jì)信息,我們可以看到96.53%的基因都擁有
7、Tag。說明Tag-based新一代測(cè)序技術(shù)的方法進(jìn)行表達(dá)譜分析的可行性7、基因表達(dá)量的分布統(tǒng)計(jì)8、樣本間表達(dá)差異基因的相關(guān)分析通過對(duì)表達(dá)差異基因的統(tǒng)計(jì)和分析,我們可以選取樣品間表達(dá)存在差異的基因,反饋給用戶;此外一些已經(jīng)報(bào)道可能相關(guān)的基因,是這一部分研究的重點(diǎn),通過表達(dá)差異,我們可以推測(cè)出相關(guān)基因可能發(fā)生的變化。針對(duì)此例,圖3-3中2個(gè)基因是已經(jīng)報(bào)道的在10T樣品中高表達(dá)的基因。9、樣本間表達(dá)差異基因的信號(hào)通路相關(guān)分析對(duì)差異表達(dá)基因進(jìn)行功能分析和信號(hào)通路分析。結(jié)合樣本性狀差異,鑒定與性狀關(guān)聯(lián)的候選基因,以便通過進(jìn)一步實(shí)驗(yàn)驗(yàn)證。10、根
8、據(jù)Tag距離3’端的位置對(duì)tag和基因數(shù)目進(jìn)行的統(tǒng)計(jì)分析