資源描述:
《利用rna-seq數(shù)據(jù)構(gòu)建人類共表達(dá)網(wǎng)絡(luò)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、學(xué)士學(xué)位論文論文題目:利用RNA-Seq數(shù)據(jù)構(gòu)建人類共表達(dá)網(wǎng)絡(luò)作者:黃立波導(dǎo)師:龐爾麗副教授系別年級(jí):生命科學(xué)學(xué)院2010級(jí)學(xué)號(hào):201011202950學(xué)科專業(yè):生物科學(xué)完成日期:2014年5月北京師范大學(xué)教務(wù)處北京師范大學(xué)學(xué)士學(xué)位論文(設(shè)計(jì))誠(chéng)信承諾書(shū)本人鄭重聲明:所呈交的學(xué)士學(xué)位論文(設(shè)計(jì)),是本人在導(dǎo)師的指導(dǎo)下,獨(dú)立進(jìn)行研究工作所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本論文不含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫(xiě)過(guò)的作品成果。對(duì)本文的研究做出重要貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。本人完全意識(shí)到本聲明的法
2、律結(jié)果由本人承擔(dān)。本人簽名: 年月日北京師范大學(xué)學(xué)士學(xué)位論文(設(shè)計(jì))使用授權(quán)的說(shuō)明本人完全了解北京師范大學(xué)有關(guān)收集、保留和使用學(xué)士學(xué)位論文(設(shè)計(jì))的規(guī)定,即:本科生在校攻讀學(xué)位期間論文(設(shè)計(jì))工作的知識(shí)產(chǎn)權(quán)單位屬北京師范大學(xué)。學(xué)校有權(quán)保留并向國(guó)家有關(guān)部門(mén)或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許學(xué)位論文(設(shè)計(jì))被查閱和借閱;學(xué)??梢怨紝W(xué)位論文的全部或部分內(nèi)容,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。保密的學(xué)位論文在解密后遵守此規(guī)定。本論文(是、否)保密論文。保密論文在年解密后適用本授權(quán)書(shū)。本
3、人簽名:年月日目錄摘要IABSTRACTII前言11.背景綜述21.1基因共表達(dá)網(wǎng)絡(luò)及構(gòu)建方法21.1.1基因和基因表達(dá)21.1.2復(fù)雜網(wǎng)絡(luò)和基因共表達(dá)網(wǎng)絡(luò)及其構(gòu)建方法21.2轉(zhuǎn)錄組與RNA-Seq技術(shù)51.2.1轉(zhuǎn)錄組51.2.2早期研究轉(zhuǎn)錄組的基本方法61.2.3全轉(zhuǎn)錄組鳥(niǎo)槍法測(cè)序(RNA-Seq)61.2.4RNA-seq的主要用途81.3共表達(dá)網(wǎng)絡(luò)可視化81.3.1Cytoscape:網(wǎng)絡(luò)可視化工具81.3.2WGCNA生成節(jié)點(diǎn)和邊的純文本文件81.3.3將邊文件導(dǎo)入Cytoscape生成網(wǎng)絡(luò)圖92.材料與方法
4、102.1計(jì)算環(huán)境、操作環(huán)境與研究流程簡(jiǎn)介102.2數(shù)據(jù)來(lái)源1142.2.1人類參考基因組文件112.2.2人類基因組注釋文件112.2.3人類RNA-Seq數(shù)據(jù)112.3RNA-Seq數(shù)據(jù)處理112.3.1將sra數(shù)據(jù)轉(zhuǎn)換為fastq數(shù)據(jù)112.3.2TopHat:拼接RNA-Seq112.3.3Cufflinks:組裝轉(zhuǎn)錄本122.3.4根據(jù)注釋文件提取編碼蛋白的表達(dá)量數(shù)據(jù)122.3.5根據(jù)表達(dá)量篩選基因122.4使用WGCNA構(gòu)建基因共表達(dá)網(wǎng)絡(luò)132.4.1表達(dá)量矩陣導(dǎo)入與數(shù)據(jù)預(yù)處理132.4.2網(wǎng)絡(luò)構(gòu)建與模塊檢
5、測(cè)162.4.3將基因網(wǎng)絡(luò)文件導(dǎo)出到Cytoscape203.結(jié)果與討論223.1模塊個(gè)數(shù)及各模塊的網(wǎng)絡(luò)情況介紹223.2根據(jù)基因網(wǎng)絡(luò)文件在Cytoscape中作網(wǎng)絡(luò)可視化243.2.1三個(gè)模塊網(wǎng)絡(luò)圖的可視化243.2.2單個(gè)模塊網(wǎng)絡(luò)圖的可視化244.總結(jié)與展望264.1研究過(guò)程中存在的主要問(wèn)題2644.2基因共表達(dá)網(wǎng)絡(luò)的應(yīng)用展望26參考文獻(xiàn)27附錄一篩選編碼蛋白基因的perl代碼28附錄二WGCNA中使用的R代碼30致謝374正文圖表目錄圖1復(fù)雜網(wǎng)絡(luò)圖例3圖2無(wú)尺度網(wǎng)絡(luò)與隨機(jī)網(wǎng)絡(luò)的對(duì)比4圖3RNA-Seq的測(cè)序步驟7
6、圖4研究流程圖10圖5檢測(cè)離群樣本的層次聚類15圖6為β值的選取分析網(wǎng)絡(luò)拓?fù)?8圖7所有模塊的層次聚類圖19圖8模塊檢測(cè)結(jié)果22圖9通過(guò)聚類分析尋找離群樣本23圖10三個(gè)模塊的網(wǎng)絡(luò)圖(相關(guān)系數(shù)0.68)24圖11對(duì)單個(gè)模塊基因網(wǎng)絡(luò)的可視化(相關(guān)系數(shù)0.94)25圖12處于網(wǎng)絡(luò)中心位置的gene的id25表1現(xiàn)實(shí)中的無(wú)尺度網(wǎng)絡(luò)5表2三種轉(zhuǎn)錄組研究方法比較[9]74利用RNA-Seq數(shù)據(jù)構(gòu)建人類共表達(dá)網(wǎng)絡(luò)摘要基因共表達(dá)是指基因組中某些基因具有相似表達(dá)譜的現(xiàn)象,它們可能受到相似的調(diào)控,使其表達(dá)量的變化趨勢(shì)相同?;蚬脖磉_(dá)網(wǎng)絡(luò)
7、是一種無(wú)尺度網(wǎng)絡(luò),該網(wǎng)絡(luò)中的節(jié)點(diǎn)代表基因,基因之間的邊是由兩兩相關(guān)的基因的表達(dá)量確定的,具有共表達(dá)關(guān)系的基因處于同一個(gè)基因共表達(dá)子網(wǎng)絡(luò)之中。構(gòu)建基因共表達(dá)網(wǎng)絡(luò),需要基因的表達(dá)量數(shù)據(jù)。RNA-Seq是基于第二代測(cè)序技術(shù)的全轉(zhuǎn)錄組測(cè)序技術(shù),利用RNA-Seq數(shù)據(jù)能計(jì)算出各個(gè)基因的表達(dá)量。得到表達(dá)量數(shù)據(jù)之后,便可以通過(guò)一個(gè)名為WGCNA的R軟件包構(gòu)建基因共表達(dá)網(wǎng)絡(luò)。關(guān)鍵詞:基因共表達(dá)網(wǎng)絡(luò),人類,RNA-Seq,WGCNA,R軟件37UsingRNA-SeqDatatoConstructHumanCo-expressionNe
8、tworkABSTRACTGeneco-expressionreferstothephenomenonthatgeneshassimilarexpressionprofileingenome,theymaybeundersimilarregulation,whichmakestheirexpressiontendstoconsis