資源描述:
《基于基因組數(shù)據(jù)的轉(zhuǎn)錄調(diào)控元件分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、東南大學(xué)碩士學(xué)位論文基于基因組數(shù)據(jù)的轉(zhuǎn)錄調(diào)控元件分析姓名:胡園園申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):生物醫(yī)學(xué)工程指導(dǎo)教師:孫嘯20040701摘要題名:基于基因組數(shù)據(jù)的基因轉(zhuǎn)錄調(diào)控信息分析碩士姓名:胡園園導(dǎo)師姓名:孫嘯教授學(xué)校名稱:東南大學(xué)基岡表達(dá)調(diào)控研究對(duì)揭示生命的奧秘具有重大意義,而mRNA轉(zhuǎn)錄起始調(diào)控是調(diào)控的基本控制點(diǎn),也是最重要的一環(huán),其實(shí)質(zhì)是轉(zhuǎn)錄因子結(jié)合相應(yīng)的調(diào)控元件,影響了RNA聚合酶的活性,從而影響了基因的轉(zhuǎn)錄水平。本文從基因組數(shù)據(jù)出發(fā),致力于轉(zhuǎn)錄調(diào)控元件的搜索、發(fā)現(xiàn)以及相關(guān)調(diào)控信息的可視化方面的研究。在識(shí)別轉(zhuǎn)錄調(diào)控元件的研究中,本文以真核模式生物啤酒酵母為研究
2、對(duì)象,選用MEME算法,檢驗(yàn)了該算法在用于識(shí)別轉(zhuǎn)錄調(diào)控元件時(shí)的有效性和局限性,進(jìn)而將該算法用來分析一些實(shí)驗(yàn)結(jié)果,包括分析由Devaux等實(shí)驗(yàn)發(fā)現(xiàn)的20個(gè)受PDRl/3調(diào)控的基因以及由Gasch等實(shí)驗(yàn)發(fā)現(xiàn)的未知轉(zhuǎn)錄因子的9個(gè)受控基因,結(jié)果從PDRl/3調(diào)控的20個(gè)基因的上游區(qū)域中,我們識(shí)別出了PDRl/3的結(jié)合位點(diǎn)(其中15個(gè)酵母啟動(dòng)子數(shù)據(jù)庫中已有,另外5個(gè)沒有)。而對(duì)Gasch等發(fā)現(xiàn)的未知轉(zhuǎn)錄因子的受控基因的上游區(qū)域的分析中,我們發(fā)現(xiàn)這個(gè)未知轉(zhuǎn)錄因子的調(diào)控元件與MCB很相似,而MCB是轉(zhuǎn)錄因子MBPl的結(jié)合位點(diǎn),因此,我們推測,這個(gè)未知的轉(zhuǎn)錄因子可能是MBPl或者
3、某個(gè)與它具有相似結(jié)合特性的轉(zhuǎn)錄因子。在研究用已知的轉(zhuǎn)錄調(diào)控元件進(jìn)行搜索的過程中,我們嘗試了利用共有序列(Consensus)和位置頻率矩陣(PFM)兩種方法。在利用共有序列搜索時(shí),我們選用了快速有效的字符串搜索算法——BM算法,結(jié)果發(fā)現(xiàn)BM算法用于搜索轉(zhuǎn)錄調(diào)控元件時(shí),所有與調(diào)控元件的共有序列一致的位點(diǎn)序列均可以搜索到,但存在假陽性現(xiàn)象:在用位置頻率矩陣方法進(jìn)行轉(zhuǎn)錄結(jié)合位點(diǎn)的搜索時(shí),我們發(fā)現(xiàn),搜索的結(jié)果與“P值”的域值有關(guān),一般取的域值足夠高,位點(diǎn)基本可以完全搜索到,但同樣存在假陽性現(xiàn)象。怎樣解決這些問題,有待進(jìn)一步研究。另外,我們?cè)谵D(zhuǎn)錄調(diào)控信息可視化方面也做了一些
4、工作,其一是將轉(zhuǎn)錄因子結(jié)合位點(diǎn)表示成Logo圖的形式,從Logo圖中可以比較直觀的觀察轉(zhuǎn)錄因子結(jié)合位點(diǎn)上每個(gè)位置的保守程度及相應(yīng)的字母;其二是將轉(zhuǎn)錄因子結(jié)合位點(diǎn)在每條序列中的相對(duì)位置可視化地表達(dá)出來。晟后,本文在上述研究的基礎(chǔ)上,實(shí)現(xiàn)了轉(zhuǎn)錄調(diào)控信息分析軟件GTRIAnalysiS,該軟件具有轉(zhuǎn)錄調(diào)控元件的搜索、發(fā)現(xiàn)以及相關(guān)調(diào)控信息的可視化三個(gè)方面的功能。關(guān)鍵詞:轉(zhuǎn)錄調(diào)控,轉(zhuǎn)錄因子,結(jié)合位點(diǎn),基因組序列ITHESISTITLEMASTERNAME:SUPERVISORNAMEUNIVERSITYNAM!EAbstractTheanalysisoftranscript
5、ionalregulationinformationbasedongenomedataHuYuanyuanSunXiao(Professor)SoutheastUniversitymRNAtranscriptionregulationisthebasicandthemostimportantstepingeneregulation.Itsessentialisthattranscriptionfactors(TF)bindtoelementstoaffecttheRNApolymerase’Sactiveness.Fromthegenomedata,thesear
6、chmethodsandthediscoverymethodsofTF’Sbindingsitesisstudied,wealsodidsomeworkonthevisualizationofTF’Sbindingsitesanditsregulatoryinformation.Intheresearchoftheidentificationofpotentialregulatorymotifs。thisarticleuseMEMEmethodtoreseachontheEukaryoticmodelorganism~Saccharomycascerevisiae
7、.itcanverifythevalidityandlimitofthismethodintheuseoftheidentificationofregulatorymotifs.wethenusethismethodtoanalyzesomeexperimentalresultsincluding20genesthatareregulatedbyPDRI/3foundbyDevauxetaland9genesthatareregulatedbyunknownTFfoundbyGascheta1.Fromtheupstreamof20genesregulatedby
8、PDRI/