基于高通量轉(zhuǎn)錄組測(cè)序的序列比對(duì)算法研究

基于高通量轉(zhuǎn)錄組測(cè)序的序列比對(duì)算法研究

ID:35106544

大?。?.45 MB

頁(yè)數(shù):78頁(yè)

時(shí)間:2019-03-18

基于高通量轉(zhuǎn)錄組測(cè)序的序列比對(duì)算法研究_第1頁(yè)
基于高通量轉(zhuǎn)錄組測(cè)序的序列比對(duì)算法研究_第2頁(yè)
基于高通量轉(zhuǎn)錄組測(cè)序的序列比對(duì)算法研究_第3頁(yè)
基于高通量轉(zhuǎn)錄組測(cè)序的序列比對(duì)算法研究_第4頁(yè)
基于高通量轉(zhuǎn)錄組測(cè)序的序列比對(duì)算法研究_第5頁(yè)
資源描述:

《基于高通量轉(zhuǎn)錄組測(cè)序的序列比對(duì)算法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、木留鐘達(dá)若來大賽UniversitofScienceandTechnoloofChinaygy碩±學(xué)位論文...\\.戀基于高通量轉(zhuǎn)錄組側(cè)序論文題目的序列比對(duì)算法研堯張勇作者姓名計(jì)鼻柄軟件與理冶學(xué)辛斗專業(yè)徐去敎換導(dǎo)師姓名二-六年十月十王〇g完成時(shí)間中通種《接禾乂嗦碩±學(xué)位論文基于高通量轉(zhuǎn)錄紐測(cè)序的序列比對(duì)算法研究作者姓名:張勇學(xué)科專業(yè):計(jì)算機(jī)軟件與理論導(dǎo)師姓名:徐云教授二0—完成時(shí)間:六年十月十H日UniversityofSc

2、ienceandTechnologyofChina’ADisseilationforMastersDereeg參ResearchonSequenceAlinmentAlgorithmBasedong-HighthroughputTranscriptomeSequencingA’u化orsName:YonZhanggSecialit:ComuterSoftwareandTheorpypySuervisor:Prof.YunXup出Finishedtime:O

3、ctober132016,中國(guó)科學(xué)技術(shù)大學(xué)學(xué)位論文原創(chuàng)性聲明本人聲明所呈交的學(xué)位論文,是本人在導(dǎo)師指導(dǎo)下進(jìn)巧研巧工作所取得的成果。除己特別加W標(biāo)注和致謝的地方外,論文中不包含任何他人己經(jīng)發(fā)表或撰寫過的研究成果一。與我同工作的同志對(duì)本研巧所做的貢獻(xiàn)均己在論文中作了明確的說明。之狐/漢王作者簽名::—亂簽字日期7中國(guó)科學(xué)技術(shù)大學(xué)學(xué)位論文授權(quán)使用聲明?作為申請(qǐng)學(xué)位的條件之,學(xué)位論文著作權(quán)擁有者授權(quán)中國(guó)科學(xué)技術(shù)大學(xué)擁有學(xué)位論文的部分使用權(quán),即:學(xué)校有權(quán)按有關(guān)規(guī)定向國(guó)家巧關(guān)部口或機(jī)構(gòu)送巧L論文的復(fù)印件和化子版,允

4、許論文被查閱和借閱,可:A將學(xué)位論文編入《中國(guó)學(xué),可W采用影印位論文全文數(shù)據(jù)庫(kù)》等有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢索、縮印或掃描等復(fù)制一致手段保存、匯編學(xué)位論文。本人提交的電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相。保密的學(xué)位論文在解密后也遵守此規(guī)定。公開□保密(年)作者簽名:J&M導(dǎo)師簽名:王簽字日期.7:20///化文7簽字日期:摘要摘要一近些年,下代測(cè)序技術(shù)獲得了突飛猛進(jìn)的發(fā)展,由此產(chǎn)生了越來越多的測(cè)序數(shù)據(jù)一直W來都是生物信息學(xué)領(lǐng)域的一項(xiàng)重要研究?jī)?nèi)。如何處理這些測(cè)試數(shù)據(jù)一容,下代測(cè)序技術(shù)應(yīng)用到轉(zhuǎn)錄組研巧領(lǐng)域產(chǎn)

5、生了高通量轉(zhuǎn)錄組測(cè)序技術(shù),簡(jiǎn)稱一-RNA-S技術(shù)項(xiàng)重要功能便是重構(gòu)剪接之前的為巧。RNAseq數(shù)據(jù)分析軟件的mRNA在細(xì)胞中的形態(tài),此外,還應(yīng)該能夠評(píng)估每種剪接異構(gòu)體的表達(dá)水平。但^-是,所有分析過程的第步都是要把從RNAseq中得到的測(cè)序片段比對(duì)到相應(yīng)的參考序列上,所。因?yàn)閮?nèi)含子序列在DNA轉(zhuǎn)錄為成熟mRNA?xí)r會(huì)被剪切除去,W與傳統(tǒng)的序列比對(duì)問題相比,轉(zhuǎn)錄組序列比對(duì)有其固有的特殊之處即需要將-測(cè)序得到的序列分段比對(duì)到不同的外顯子序列上,因此需要設(shè)計(jì)??卺槍?duì)RNA-se的序列比對(duì)算法。現(xiàn)有的RNAS巧序列比對(duì)算法基本上都

6、是依賴于經(jīng)典的剪qGT-接位點(diǎn)信號(hào),而許多非經(jīng)典的剪接信號(hào)位點(diǎn)具有重要的生物學(xué)功能,如TGGa-與人類腺昔酸環(huán)化酶刺激蛋白s的形成有關(guān)。為此,我們?cè)O(shè)計(jì)了兩個(gè)新的RNAse序列比對(duì)算法,用來發(fā)現(xiàn)多種類型的剪接位點(diǎn)q。(])獨(dú)立于剪接位點(diǎn)信號(hào)的轉(zhuǎn)錄組序列比對(duì)算法^-首先我們?cè)O(shè)計(jì)了種采用重疊種子內(nèi)部擴(kuò)展策略的RNAseq序列比對(duì)算法,命名為RNAMap。種子序列的重疊性能夠保證由種子的比對(duì)信息能夠組合出完整測(cè)序序列的定位信息一一個(gè)動(dòng)態(tài)。在掃描基因組時(shí),RNAMap建立個(gè)靜志表和,此時(shí)并不表來索引種子序列及其比對(duì)信息,

7、尋找左右錯(cuò)點(diǎn)序列之間的剪接位點(diǎn)受經(jīng)典剪接位點(diǎn)信號(hào)的限制,對(duì)于。實(shí)驗(yàn)結(jié)果表明含有多種類型的剪接位點(diǎn)的數(shù).%和9.01%,優(yōu)于其它的轉(zhuǎn)據(jù)集,RNAMap的召回率和精確度分別這到了92537錄組序列比對(duì)工具。(2)轉(zhuǎn)錄組序列比對(duì)算法改進(jìn)^之后我們又訝計(jì)了種采用非重疊種子之間擴(kuò)展策略的RNA-se序列比對(duì)q算法,命名為RNAMap2。該算法通過減少種子的數(shù)量來降低計(jì)算量,然后利用^測(cè)序深度,即測(cè)序序列的重復(fù)性來進(jìn)行比對(duì)a。這在定程度上彌補(bǔ)了RNAMp在運(yùn)行速度方面的不足,300b,RNAMa。實(shí)驗(yàn)結(jié)果表明在測(cè)序序列的長(zhǎng)度為p

8、時(shí)p2-2a近40%。此外eedlemanWunsch全局比RNAMp快將,民NAMap采用N動(dòng)態(tài),規(guī)劃算法,能夠

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。