資源描述:
《人組織特異性基因組合轉(zhuǎn)錄調(diào)控模塊的統(tǒng)計(jì)分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、扉頁:獨(dú)創(chuàng)性聲明本人聲明所呈交的論文是我個(gè)人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他人或集體已經(jīng)發(fā)表或撰寫過的研究成果,對(duì)本文的研究做出貢獻(xiàn)的集體和個(gè)人均已在論文中作了明確的說明并表示了謝意。研究生簽名:避日論文使用和授權(quán)說明本人完全了解云南大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定,即:學(xué)校有權(quán)保留并向國家有關(guān)部門或機(jī)構(gòu)送交學(xué)位論文和論文電子版;允許論文被查閱或借閱;學(xué)校可以公布論文的全部或部分內(nèi)容,可以采用影印、縮印或其他復(fù)制手段保存論文。(保密的論文在解密后應(yīng)遵循此規(guī)定)研究生簽名:邊塑墾筮導(dǎo)師簽名:本人及導(dǎo)師同意將學(xué)位論文提交至清華大
2、學(xué)“中國學(xué)術(shù)期刊(光盤版)電子雜志社”進(jìn)行電子和網(wǎng)絡(luò)出版,并編入cNgJ系列數(shù)據(jù)庫,傳播本學(xué)位論文的全部或部分內(nèi)容,同意按《中國優(yōu)秀博碩士學(xué)位論文全文數(shù)據(jù)庫出版章程》規(guī)定享受相關(guān)權(quán)益。研究生簽名:導(dǎo)師簽名:摘要本文主要就人30個(gè)組織特異性基因上游1000bp到第一內(nèi)含子序列中的組合轉(zhuǎn)錄調(diào)控模塊的識(shí)別方法進(jìn)行探討,同時(shí)對(duì)識(shí)別得到的組合轉(zhuǎn)錄調(diào)控模塊進(jìn)行統(tǒng)計(jì)分析。識(shí)別兩個(gè)調(diào)控元件組合的模塊(即模體對(duì))的方法有兩種:分步方法和同步方法。這兩種方法都包含兩個(gè)方面:模體對(duì)的共出現(xiàn)率,模體對(duì)的距離檢驗(yàn)。本文在求模體對(duì)的共出現(xiàn)率時(shí)采用超幾何分布的方法,而在檢驗(yàn)?zāi)sw對(duì)的距離時(shí),文中應(yīng)用了三種檢驗(yàn)方法:Ma
3、nn·whitneyU秩和檢驗(yàn),兩樣本的Kolmogorov-Smimov檢驗(yàn)方法,單樣本的Kolmogorov.Smimov檢驗(yàn)的方法。兩種方法三種檢驗(yàn)得到的是六種求過表達(dá)模體對(duì)的方法。用這六種方法分別求人30個(gè)組織特異性基因中的過表達(dá)模體對(duì)。分析它們的匹配率與豐度得到:同步方法的單樣本Kolmogorov-Smimov檢驗(yàn)是最優(yōu)方法。此外,對(duì)這最優(yōu)方法得到的過表達(dá)模體對(duì)的轉(zhuǎn)錄因子、分布區(qū)域、距離進(jìn)行分析。結(jié)果表明:(1)不同的轉(zhuǎn)錄因子對(duì)有不同的調(diào)控功能:有些轉(zhuǎn)錄因子對(duì)可以調(diào)控不同組織的基因表達(dá),而有些特定的轉(zhuǎn)錄因子對(duì)只調(diào)控特定的組織基因表達(dá)。(2)在轉(zhuǎn)錄調(diào)控中,不僅存在著同時(shí)出現(xiàn)在某
4、一區(qū)域的模體對(duì),還存在著跨區(qū)域的模體對(duì)。(3)在組織特異性基因中,兩個(gè)相互作用的轉(zhuǎn)錄因子之間的距離主要集中在200bp以內(nèi)。本文采用組合方法識(shí)別兩個(gè)以上調(diào)控元件組合的模塊。首先,對(duì)最優(yōu)方法得到的過表達(dá)模體對(duì)進(jìn)行兩兩組合,接著,用超幾何分布的模型求得三個(gè)模體組合的調(diào)控模塊,進(jìn)而限$1J400bp窗口,求多個(gè)組合轉(zhuǎn)錄調(diào)控模塊。對(duì)多個(gè)組合轉(zhuǎn)錄調(diào)控模塊進(jìn)行分析發(fā)現(xiàn),不同組織的模塊具有堿基使用偏向性,有的組織偏向于A/T堿基,有的組織偏向于G/C堿基。此外,不同模塊在基因中有著不同的調(diào)控能力,有的模塊只在一個(gè)組織中出現(xiàn),有的模塊在多個(gè)組織中出現(xiàn)。關(guān)鍵詞:組織特異性基因:模體對(duì);超幾何分布;檢驗(yàn);組
5、合轉(zhuǎn)錄調(diào)控模塊AbstractInthisdissertation,wemainfocusonthewaysofrecognizingcombinatorialtranscriptionalregulatorymoduleinregionsfromtheupstream1000bptointronIofhumantissue-specificgenes,andthestatisticalanalysisofcombinatorialtranscriptionalregulatorymodule.Therearetwomethodsofrecognizingcombinatorialtra
6、nscriptionalregulatorymodule:stepbystepmethodandsynchronizationmethod.However,thesemethodsbothincludedthebindingsitepairCO.occurrenceandthedistancetest.WeCangettheCO—occurrencebYusingHypergeometricdistribution,buttherearethreekindsofdistancetestinourpaper:Mann—WhitneyUtest,two-sampleKolmogorov-Sm
7、irnovtest,one.sampleKolmogorov.Smimovtest.SixmethodsCanbeused.WeCananalyzethematchingrateandtheabundanceoftheover-representedmotifsbyusingsixdifferentmetIlods.Theresultsshowthat:one—sampleKolmogorov—SmirnovtestiSoptima