轉(zhuǎn)錄組測序(RNA-Seq)--楊軍課件.ppt

ID：57375201

大?。?.62 MB

頁數(shù)：26頁

時間：2020-08-13

資源描述：

《轉(zhuǎn)錄組測序(RNA-Seq)--楊軍課件.ppt》由會員上傳分享，免費在線閱讀，更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、轉(zhuǎn)錄組測序(RNA-Seq)JunYangRNA-Seq的技術(shù)背景RNA-Seq又稱轉(zhuǎn)錄組高通量測序(transcriptomesequencing)或稱為全轉(zhuǎn)錄組鳥槍法測序(WholeTranscriptomShotgunSequencingWTSS)2005年以來,以Roche公司的454技術(shù)、Illumina公司的Solexa技術(shù)和ABI公司的SOLiD技術(shù)為標志的新一代測序技術(shù)誕生,之后HelicosBiosciences公司又推出單分子測序(Singlemoleculesequencing,SMS)技術(shù)。新一代測序又稱作深度測序或高通量測序。轉(zhuǎn)錄組是特定組織或細胞在某一功能狀態(tài)下

2、所能轉(zhuǎn)錄出來的所有RNA的總和，包括mRNA和非編碼RNA。轉(zhuǎn)錄組（transcriptome）廣義上指某一生理條件下，細胞內(nèi)所有轉(zhuǎn)錄產(chǎn)物的集合，包括信使RNA、核糖體RNA、轉(zhuǎn)運RNA及非編碼RNA；狹義上指所有mRNA的集合。蛋白質(zhì)是行使細胞功能的主要承擔者，蛋白質(zhì)組是細胞功能和狀態(tài)的最直接描述，轉(zhuǎn)錄組成為研究基因表達的主要手段，轉(zhuǎn)錄組是連接基因組遺傳信息與生物功能的蛋白質(zhì)組的必然紐帶，轉(zhuǎn)錄水平的調(diào)控是目前研究最多的，也是生物體最重要的調(diào)控方式。轉(zhuǎn)錄組？轉(zhuǎn)錄本AlltranscriptsAllmRNAsTotalRNA樣品檢測OD260/280:1.8~2.2；RNA28S:18S

3、≥1.0;RIN≥7；樣品總量不低于15ug；樣品濃度：totalRNA濃度不低于400ng/ul。樣品RNA準備2.測序文庫構(gòu)建?使用oligodT微珠純化mRNA?mRNA片段化處理?反轉(zhuǎn)錄反應(yīng)合成合成雙鏈cDNA?雙鏈DNA末端修復(fù)及3’末端加‘A’?使用特定的測序接頭連接DNA片段兩端?高保真聚合酶擴增構(gòu)建成功的測序文庫3.DNA成簇（Cluster）擴增4.高通量測序（IlluminaGenomeAnalyzerIIx）5.數(shù)據(jù)分析?原始數(shù)據(jù)讀取?與數(shù)據(jù)庫比對并進行注釋?深層次數(shù)據(jù)分析實驗流程標準信息分析流程生物信息分析基本信息分析數(shù)據(jù)量產(chǎn)出：>2Gbpersample測序策略：

4、HiSeq2000,PE91or101插入片段大?。?00bps測序質(zhì)量控制：Q20%>80相關(guān)概念高通量測序中，每測一個堿基會給出一個相應(yīng)的質(zhì)量值，這個質(zhì)量值是衡量測序準確度的。Q20與Q30則表示質(zhì)量值大于等于20或30的堿基所占百分比。Q20值是指的測序過程堿基識別過程中，對所識別的堿基給出的錯誤概率。質(zhì)量值Q20，錯誤識別概率是1%，即正確率是99%；質(zhì)量值Q30，錯誤識別概率是0.1%，即正確率是99.9%；質(zhì)量值Q40，錯誤識別概率是0.01%，即正確率99.99%；Q“N”0的質(zhì)量值，就是正確率有N個9的百分比。N50即覆蓋50%所有核苷酸的最大Unigene長度或覆蓋50%

5、所有核苷酸的最大序列重疊群長度。相關(guān)概念高通量測序時，在芯片上的每個反應(yīng)，會讀出一條序列，是比較短的，叫read，它們是原始數(shù)據(jù)；有很多reads通過片段重疊，能夠組裝成一個更大的片段，稱為contig；多個contigs通過片段重疊，組成一個更長的scaffold；一個contig被組成出來之后，鑒定發(fā)現(xiàn)它是編碼蛋白質(zhì)的基因，就叫singleton；多個contigs組裝成scaffold之后，鑒定發(fā)現(xiàn)它編碼蛋白質(zhì)的基因，叫unigene。Unigene是UniqueGene的英文縮寫，意為廣泛通用的基因數(shù)據(jù)庫，通過電腦對相同基因座(Locus)的收集整理集合形成一個非冗余的基因數(shù)據(jù)庫

6、。相關(guān)數(shù)據(jù)庫概念NR是NCBI里的非冗余蛋白數(shù)據(jù)庫，即NCBI的blastp程序中的NR數(shù)據(jù)庫，我們可以用自己的query序列，blast搜索這個數(shù)據(jù)庫，得到這些query序列的具有序列相似性的蛋白序列。NT：NCBI的blast頁面，選擇nucleotideblast，數(shù)據(jù)庫選others，也就是（nr/nt）.SWISS-PROT是經(jīng)過注釋的蛋白質(zhì)序列數(shù)據(jù)庫，由歐洲生物信息學研究所(EBI)維護。KEGG(KyotoEncyclopediaofGenesandGenomes，京都基因與基因組百科全書)是基因組破譯方面的數(shù)據(jù)庫。COG是ClusterofOrthologousGroups

7、ofproteins（蛋白相鄰類的聚簇）的縮寫，即直系同源基因數(shù)據(jù)庫。COG是對基因產(chǎn)物進行直系同源分類的數(shù)據(jù)庫，每個COG蛋白都被假定來自祖先蛋白，COG數(shù)據(jù)庫是基于細菌、藻類、真核生物具有完整基因組的編碼蛋白、系統(tǒng)進化關(guān)系進行構(gòu)建的，我們將Unigene和COG數(shù)據(jù)庫進行比對，預(yù)測Unigene可能的功能并對其做功能分類統(tǒng)計，從宏觀上認識該物種的基因功能分布特征。GO(geneontology)是基因本體聯(lián)合會(Ge

當前文檔最多預(yù)覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 26



此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學公式或PPT動畫的文件，查看預(yù)覽時可能會顯示錯亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容，確認文檔內(nèi)容符合您的需求后進行下載，若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤，付費完成后未能成功下載的用戶請聯(lián)系客服處理。

轉(zhuǎn)錄組測序(RNA-Seq)--楊軍課件.ppt

轉(zhuǎn)錄組測序(RNA-Seq)--楊軍課件.ppt

相關(guān)文章

相關(guān)標簽