資源描述:
《基于chip-seq數(shù)據(jù)的轉(zhuǎn)錄因子結(jié)合位點識別算法》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、-義腳學(xué)校代碼;10004密級;公開齡交新1BEIJINGJIAOTONGUNIVERSITY碩±學(xué)位論文基于ChlP-seq數(shù)據(jù)的轉(zhuǎn)錄因子結(jié)合位點識別算法M作者姓名賈薩學(xué)科專業(yè)減欄學(xué)那術(shù)^'*1指導(dǎo)教師劉一教授f1.培養(yǎng)院系計算機與信息技術(shù)學(xué)院^||1--.,奇‘巧粹I祐請織鄉(xiāng)齡詞d-:棄團野^la理巧禪1'畫UK?。崳姡蓿海保В睿穑瓡袂擅鏈貐s*漏麵o喃_,ffl,"^|^|-w—^*—^o商邱r,.JN^:誦賴..p<J1I鍾1看,六年四■.迴
2、巧:!?。担椋犌仂丁兜纴V肇碩±學(xué)位論文Ch-基于IPs巧數(shù)據(jù)的轉(zhuǎn)錄因子結(jié)合位點識別算法or-AnAlgithm1;〇DetectTFBSsbasedonChIPseDataq作者:賈瑤麗一導(dǎo)師:劉北京交通大學(xué)2016年4月學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解北京交通大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定。特授權(quán)北京交通大學(xué)可W將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索,提供閱覽服務(wù),并采用影印、縮印或掃描等復(fù)制手段保存、匯編1^供查閱和借閱。同意學(xué)校向國家有關(guān)部口或機構(gòu)送交論文的復(fù)印件和磁盤。
3、學(xué)??蔀榇嬖陴^際合作關(guān)系的兄弟高校用戶提供文獻傳遞服務(wù)和交換服務(wù)。(保密的學(xué)位論文在解密后適用本授權(quán)說明)\.、^學(xué)位論文作者簽名:它謂斬導(dǎo)師簽名:1^、*簽字曰期年月、曰簽字曰期年■月曰>;七^乙37學(xué)校代碼:10004密級:公開化京交通大學(xué)碩古學(xué)位論文基于Ch-seqIP數(shù)據(jù)的轉(zhuǎn)錄因子結(jié)合位點識別算法An-Algorithm1:0DekctTFBSsbasedonChIPseqData:作者姓名賈瑤麗學(xué)號:13120399一導(dǎo)師姓名:劉職稱:教授學(xué)位類別:工學(xué)學(xué)位級別:碩±學(xué)科專
4、業(yè):計算機科學(xué)與技術(shù)研究方向:數(shù)據(jù)挖掘北京交通大學(xué)2016年4月i致謝一在這里,首先感謝導(dǎo)師劉教授在研究生期間給予的學(xué)習(xí)上和生活上的譚厚教誨和悉也關(guān)懷。劉老師為人誠懇,學(xué)識淵博。劉老師的榜樣作用影響并激勵著我?未來的人生,鞭策我奮發(fā)努力工作,銳意進取,是我人生路上的標桿。其次,非常感謝中科院遺傳與發(fā)育生物學(xué)研究所李家洋研究組余貓老師在我實習(xí)期間在科研上對我不遺余力的幫助。余老師平易近人、知識淵博、學(xué)風(fēng)嚴謹。余老師傳授知識時深入淺出。實習(xí)期間,余老師潛移默化影響著我、并激勵著我不斷努力地去實現(xiàn)人生的夢想。再次感謝中科院遺傳
5、與發(fā)育生物學(xué)研究所給予的數(shù)據(jù)上的支持,使我的研巧工作得頃利進行。一最后,感謝我家人直默默支持和鼓勵我,他們都,他們?yōu)槲覠o怨無悔地傾注自己的必血、,給予我堅實的依靠和無限的信屯。感謝我的同學(xué)、朋友在我情緒低谷的時候無私的陪伴、。再次衷屯地感謝關(guān)也、幫助和支持我的老師、同學(xué)、朋友。北京交通大學(xué)碩±學(xué)位論文摘要隨著生物信息學(xué)的大力發(fā)展,,研究者們不斷地在探究基因調(diào)控規(guī)律而不能深入的理解轉(zhuǎn)錄調(diào)控規(guī)律己經(jīng)成為研究調(diào)控網(wǎng)絡(luò)的瓶頸。目前,轉(zhuǎn)錄因子結(jié)合位一一點識別問題己成為生物信息學(xué)的熱點研究領(lǐng)域之。轉(zhuǎn)錄因子作為種重要的轉(zhuǎn),通過與特定的D
6、NA序列相結(jié)合錄調(diào)控因子,在基因表達的過程中,調(diào)控下游基因的表達,抑制或增強其作用,是基因表達的關(guān)鍵步驟。識別這些特定的DNA序列對理解基因調(diào)控具有重要意義。隨著高通量自動化測序技術(shù)的快速發(fā)展,染色質(zhì)免疫共沉淀(CMP)技術(shù)與二代測序技術(shù)相結(jié)合的ChIP-seq技術(shù)為轉(zhuǎn)錄因子結(jié)合位點識別研巧提供了海量的數(shù)據(jù)-se。ChIPq技術(shù)在全基因組上免疫沉淀DNA片段,為全基因組范圍上識別轉(zhuǎn)錄因子結(jié)合位點提供了高分辨率的數(shù)據(jù),成為了研巧轉(zhuǎn)錄因子結(jié)合位點的常規(guī)手段。現(xiàn)在己有許多轉(zhuǎn)錄因子結(jié)合位點識別算法用于尋找Ch-se數(shù)據(jù)中的轉(zhuǎn)錄因IPq子特異
7、結(jié)合序列,但這些算法依然存在很多問題。首先,現(xiàn)存的這些算法不足W勝任ChIP-s海量數(shù)據(jù)而導(dǎo)致不切實際的開銷其次,這些算法過度依賴重復(fù)巧的;-,無法區(qū)分識別位點真?zhèn)蔚热秉c序列過濾。本文在現(xiàn)有發(fā)表的ChIPse數(shù)據(jù)基礎(chǔ)q上-,挖掘和總結(jié)ChIPse數(shù)據(jù)的特點q,并針對這些特點,利用期望最大化一(expectationmaximization,EM)算法的思想,提出了個簡化的EM算法。甘有-se的基于EM的識別轉(zhuǎn)錄因子結(jié)合位點識別算法忽略了ChIPq數(shù)據(jù)的特點,雖然成功的發(fā)現(xiàn)了真實的轉(zhuǎn)錄因子結(jié)合位點,但卻付出了時間的代價。本