轉(zhuǎn)錄組測序(RNA-Seq)--楊軍課件.ppt

轉(zhuǎn)錄組測序(RNA-Seq)--楊軍課件.ppt

ID:57375201

大?。?.62 MB

頁數(shù):26頁

時間:2020-08-13

轉(zhuǎn)錄組測序(RNA-Seq)--楊軍課件.ppt_第1頁
轉(zhuǎn)錄組測序(RNA-Seq)--楊軍課件.ppt_第2頁
轉(zhuǎn)錄組測序(RNA-Seq)--楊軍課件.ppt_第3頁
轉(zhuǎn)錄組測序(RNA-Seq)--楊軍課件.ppt_第4頁
轉(zhuǎn)錄組測序(RNA-Seq)--楊軍課件.ppt_第5頁
資源描述:

《轉(zhuǎn)錄組測序(RNA-Seq)--楊軍課件.ppt》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、轉(zhuǎn)錄組測序(RNA-Seq)JunYangRNA-Seq的技術(shù)背景RNA-Seq又稱轉(zhuǎn)錄組高通量測序(transcriptomesequencing)或稱為全轉(zhuǎn)錄組鳥槍法測序(WholeTranscriptomShotgunSequencingWTSS)2005年以來,以Roche公司的454技術(shù)、Illumina公司的Solexa技術(shù)和ABI公司的SOLiD技術(shù)為標志的新一代測序技術(shù)誕生,之后HelicosBiosciences公司又推出單分子測序(Singlemoleculesequencing,SMS)技術(shù)。新一代測序又稱作深度測序或高通量測序。轉(zhuǎn)錄組是特定組織或細胞在某一功能狀態(tài)下

2、所能轉(zhuǎn)錄出來的所有RNA的總和,包括mRNA和非編碼RNA。轉(zhuǎn)錄組(transcriptome)廣義上指某一生理條件下,細胞內(nèi)所有轉(zhuǎn)錄產(chǎn)物的集合,包括信使RNA、核糖體RNA、轉(zhuǎn)運RNA及非編碼RNA;狹義上指所有mRNA的集合。蛋白質(zhì)是行使細胞功能的主要承擔者,蛋白質(zhì)組是細胞功能和狀態(tài)的最直接描述,轉(zhuǎn)錄組成為研究基因表達的主要手段,轉(zhuǎn)錄組是連接基因組遺傳信息與生物功能的蛋白質(zhì)組的必然紐帶,轉(zhuǎn)錄水平的調(diào)控是目前研究最多的,也是生物體最重要的調(diào)控方式。轉(zhuǎn)錄組?轉(zhuǎn)錄本All transcriptsAll mRNAsTotalRNA樣品檢測OD260/280:1.8~2.2;RNA28S:18S

3、≥1.0;RIN≥7;樣品總量不低于15ug;樣品濃度:totalRNA濃度不低于400ng/ul。樣品RNA準備2.測序文庫構(gòu)建?使用oligodT微珠純化mRNA?mRNA片段化處理?反轉(zhuǎn)錄反應(yīng)合成合成雙鏈cDNA?雙鏈DNA末端修復(fù)及3’末端加‘A’?使用特定的測序接頭連接DNA片段兩端?高保真聚合酶擴增構(gòu)建成功的測序文庫3.DNA成簇(Cluster)擴增4.高通量測序(IlluminaGenomeAnalyzerIIx)5.數(shù)據(jù)分析?原始數(shù)據(jù)讀取?與數(shù)據(jù)庫比對并進行注釋?深層次數(shù)據(jù)分析實驗流程標準信息分析流程生物信息分析基本信息分析數(shù)據(jù)量產(chǎn)出:>2Gbpersample測序策略:

4、HiSeq2000,PE91or101插入片段大?。?00bps測序質(zhì)量控制:Q20%>80相關(guān)概念高通量測序中,每測一個堿基會給出一個相應(yīng)的質(zhì)量值,這個質(zhì)量值是衡量測序準確度的。Q20與Q30則表示質(zhì)量值大于等于20或30的堿基所占百分比。Q20值是指的測序過程堿基識別過程中,對所識別的堿基給出的錯誤概率。質(zhì)量值Q20,錯誤識別概率是1%,即正確率是99%;質(zhì)量值Q30,錯誤識別概率是0.1%,即正確率是99.9%;質(zhì)量值Q40,錯誤識別概率是0.01%,即正確率99.99%;Q“N”0的質(zhì)量值,就是正確率有N個9的百分比。N50即覆蓋50%所有核苷酸的最大Unigene長度或覆蓋50%

5、所有核苷酸的最大序列重疊群長度。相關(guān)概念高通量測序時,在芯片上的每個反應(yīng),會讀出一條序列,是比較短的,叫read,它們是原始數(shù)據(jù);有很多reads通過片段重疊,能夠組裝成一個更大的片段,稱為contig; 多個contigs通過片段重疊,組成一個更長的scaffold;一個contig被組成出來之后,鑒定發(fā)現(xiàn)它是編碼蛋白質(zhì)的基因,就叫singleton;多個contigs組裝成scaffold之后,鑒定發(fā)現(xiàn)它編碼蛋白質(zhì)的基因,叫unigene。Unigene是UniqueGene的英文縮寫,意為廣泛通用的基因數(shù)據(jù)庫,通過電腦對相同基因座(Locus)的收集整理集合形成一個非冗余的基因數(shù)據(jù)庫

6、。相關(guān)數(shù)據(jù)庫概念NR是NCBI里的非冗余蛋白數(shù)據(jù)庫,即NCBI的blastp程序中的NR數(shù)據(jù)庫,我們可以用自己的query序列,blast搜索這個數(shù)據(jù)庫,得到這些query序列的具有序列相似性的蛋白序列。NT:NCBI的blast頁面,選擇nucleotideblast,數(shù)據(jù)庫選others,也就是(nr/nt).SWISS-PROT是經(jīng)過注釋的蛋白質(zhì)序列數(shù)據(jù)庫,由歐洲生物信息學研究所(EBI)維護。KEGG(KyotoEncyclopediaofGenesandGenomes,京都基因與基因組百科全書)是基因組破譯方面的數(shù)據(jù)庫。COG是ClusterofOrthologousGroups

7、ofproteins(蛋白相鄰類的聚簇)的縮寫,即直系同源基因數(shù)據(jù)庫。COG是對基因產(chǎn)物進行直系同源分類的數(shù)據(jù)庫,每個COG蛋白都被假定來自祖先蛋白,COG數(shù)據(jù)庫是基于細菌、藻類、真核生物具有完整基因組的編碼蛋白、系統(tǒng)進化關(guān)系進行構(gòu)建的,我們將Unigene和COG數(shù)據(jù)庫進行比對,預(yù)測Unigene可能的功能并對其做功能分類統(tǒng)計,從宏觀上認識該物種的基因功能分布特征。GO(geneontology)是基因本體聯(lián)合會(Ge

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。