資源描述:
《基于調(diào)控范圍語義相似性的致病基因預(yù)測方法》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、代號10701學(xué)號1103121705分類號TP301密級公開題(中、英文)目基于調(diào)控范圍語義相似性的致病基因預(yù)測方法SemanticSimilarityofRegulationRangeBasedMethodforDiseaseGenesPrediction作者姓名張青芳指導(dǎo)教師姓名、職務(wù)高琳教授學(xué)科門類工學(xué)學(xué)科、專業(yè)計(jì)算機(jī)應(yīng)用技術(shù)萬方數(shù)據(jù)提交論文日期二○一四年三月萬方數(shù)據(jù)西安電子科技大學(xué)學(xué)位論文獨(dú)創(chuàng)性(或創(chuàng)新性)聲明秉承學(xué)校嚴(yán)謹(jǐn)?shù)膶W(xué)風(fēng)和優(yōu)良的科學(xué)道德,本人聲明所呈交的論文是我個(gè)人在導(dǎo)師指導(dǎo)下
2、進(jìn)行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝中所羅列的內(nèi)容以外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果;也不包含為獲得西安電子科技大學(xué)或其它教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻(xiàn)均已在論文中做了明確的說明并表示了謝意。申請學(xué)位論文與資料若有不實(shí)之處,本人承擔(dān)一切的法律責(zé)任。本人簽名:日期西安電子科技大學(xué)關(guān)于論文使用授權(quán)的說明本人完全了解西安電子科技大學(xué)有關(guān)保留和使用學(xué)位論文的規(guī)定,即:研究生在校攻讀學(xué)位期間論文工作的知識產(chǎn)權(quán)單位屬西安電子科技大學(xué)。學(xué)校有權(quán)保留送
3、交論文的復(fù)印件,允許查閱和借閱論文;學(xué)??梢怨颊撐牡娜炕虿糠謨?nèi)容,可以允許采用影印、縮印或其它復(fù)制手段保存論文。同時(shí)本人保證,畢業(yè)后結(jié)合學(xué)位論文研究課題再撰寫的文章一律署名單位為西安電子科技大學(xué)。(保密的論文在解密后遵守此規(guī)定)本學(xué)位論文屬于保密,在本人簽名:年解密后適用本授權(quán)書。導(dǎo)師簽名:日期:日期:萬方數(shù)據(jù)萬方數(shù)據(jù)摘要摘要隨著高通量實(shí)驗(yàn)技術(shù)手段的不斷發(fā)展和完善,多種類型的分子生物學(xué)數(shù)據(jù)也在迅猛增加。比如基因序列數(shù)據(jù)、基因表達(dá)譜、功能注釋、蛋白質(zhì)相互作用關(guān)系、代謝路徑以及基因調(diào)控通路等?;趶?fù)雜網(wǎng)絡(luò)對高通量生物數(shù)據(jù)
4、建模,運(yùn)用計(jì)算方法從中挖掘致病基因已成為當(dāng)前生物信息學(xué)研究熱點(diǎn)之一。近年來,基于功能相關(guān)的基因?qū)е孪嗨萍膊〉纳飳W(xué)假設(shè),涌現(xiàn)出了很多致病基因預(yù)測方法。這些方法通過識別網(wǎng)絡(luò)中的稠密子圖達(dá)到致病基因預(yù)測目的,傾向于研究拓?fù)潢P(guān)系連接緊密的致病基因。然而,生物學(xué)研究表明在人類已經(jīng)發(fā)現(xiàn)的致病基因中有77.6%的為非必需致病基因,它們大多分布在基因網(wǎng)絡(luò)的外圍區(qū)域,并不是網(wǎng)絡(luò)中的核心節(jié)點(diǎn)。因此,如何刻畫拓?fù)潢P(guān)系連接稀疏的致病基因之間的關(guān)系,是致病基因預(yù)測有待解決的問題。另外,生物網(wǎng)絡(luò)數(shù)據(jù)存在高噪聲和假陽性等問題,而且人類生物過程是有方向性的,比
5、如基因調(diào)控過程,這些因素在許多致病基因預(yù)測方法中是被忽視的。本文采用網(wǎng)絡(luò)可控性的思想,提出了基于調(diào)控范圍語義相似性的致病基因預(yù)測方法。由于基因調(diào)控網(wǎng)絡(luò)可以有效刻畫基因在疾病狀態(tài)下的異常調(diào)控過程,因此基于該網(wǎng)絡(luò)預(yù)測致病基因更加準(zhǔn)確。運(yùn)用調(diào)控范圍度量基因在網(wǎng)絡(luò)中的影響力,結(jié)合語義相似性計(jì)算候選基因?qū)е录膊“l(fā)生的概率,最終依據(jù)概率得分對候選基因排序。實(shí)驗(yàn)結(jié)果預(yù)測出LRP1是阿爾茨海默病潛在的致病基因,PRCK1與EGF是卵巢癌潛在的致病基因,并且發(fā)現(xiàn)拓?fù)潢P(guān)系弱的致病基因在調(diào)控范圍上具有相似的生物功能,這表明調(diào)控范圍語義相似性能很好地刻畫
6、非必需致病基因之間的關(guān)系。留一交叉驗(yàn)證結(jié)果顯示本文提出的致病基因預(yù)測方法相比于PRINCE方法準(zhǔn)確率提升了7.95%。關(guān)鍵詞:致病基因預(yù)測調(diào)控范圍語義相似性基因調(diào)控網(wǎng)絡(luò)萬方數(shù)據(jù)萬方數(shù)據(jù)AbstractAbstractWiththedevelopmentofhigh-throughputtechniques,varioustypesofmolecularbiologydataareincreasingrapidly,suchasgenesequencedata,geneexpressionprofile,functionala
7、nnotation,protein-proteininteraction,metabolicpathwaysandgeneregulatorypathwaysandsoon.Modelingthehigh-throughputbiologicaldataandminingdiseasegenesbyusingcomputationalapproacheshavebecomearesearchfocusinbioinformatics.Inrecentyears,alotofdiseasegenespredictionmethods
8、havebeenproposed.Mostofthemarebasedonthebiologicalhypothesisthatfunctionallyrelatedgenesoftenleadtosimilardisease.Thesemetho