資源描述:
《基于信息自動獲取構(gòu)建生物信息平臺及序列比對算法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、電子科技大學碩士學位論文基于信息自動獲取構(gòu)建生物信息平臺及序列比對算法研究姓名:祝帥申請學位級別:碩士專業(yè):計算機應用技術(shù)指導教師:朱清新20061009摘要二十一世紀是生命科學的世紀,近年來生物信息學得到了前所未有的發(fā)展。生物信息二級數(shù)據(jù)庫是生物信息學中的一個重要研究方向,由于生物信息數(shù)據(jù)的復雜性及其分析應用的復雜性,至今沒有一種比較通用的構(gòu)建模型能夠滿足一般性生物信息二級數(shù)據(jù)庫系統(tǒng)的開發(fā)需要。序列比對是生物信息學中一個非常重要的操作,是基本的處理信息的方法。將大量累積的核酸和蛋白質(zhì)序列進行比對,對發(fā)現(xiàn)生
2、物序列的功能、結(jié)構(gòu)和進化信息具有重要的意義。本文對生物信息學的發(fā)展、研究內(nèi)容、生物數(shù)據(jù)庫做了簡單的介紹,對序列比對的各種算法:點陣法、動態(tài)規(guī)劃全局比對算法、Smith.Waterman算法、FASTA算法、啟發(fā)式BLAST算法等做了簡單描述,并分析了序列比對研究的目的及其意義。本文利用.NET、XML和WebServices相關(guān)技術(shù),實現(xiàn)了一種建立生物信息學研究平臺的框架體系。該平臺可自動從Intemet獲取生物信息數(shù)據(jù)并建立本地二級生物信息數(shù)據(jù)庫。重點介紹了用WebClient類的方法提取分析網(wǎng)絡(luò)數(shù)據(jù)庫資
3、源并創(chuàng)建本地二級生物信息數(shù)據(jù)庫;用ASP.NET和ADO.NET實現(xiàn)了對此二級數(shù)據(jù)庫的查看、查詢等操作;使用XML保存從Web站點上下載的數(shù)據(jù);用WebServices技術(shù)封裝序列對比算法,可從客戶端直接調(diào)用。此系統(tǒng)在.NET技術(shù)上采用Web信息自動獲取并結(jié)合Webservices技術(shù)有助于二級數(shù)據(jù)庫開發(fā)人員在海量的信息源中迅速找到真正需要的生物數(shù)據(jù)信息,并靈活地加以應用,從而將更多的精力集中在更純粹的生物信息處理上來,并可以通過Web的方式向Intemet用戶提供方便、有效的公共生物信息技術(shù)服務平臺的各類
4、資源。本文還在BLAST部分算法的基礎(chǔ)上,基于十六進制編碼序列和尋找最優(yōu)可變窗口大小的思想,提出了一種相似核苷酸序列搜索算法SLAHAW。本算法采用十六進制編碼存儲序列,通過序列片斷相似度得到最佳搜索窗口值,從而提高搜索速度和準確度并且節(jié)約了存諸空間。建立出實驗環(huán)境和實現(xiàn)了相應算法,通過實驗證明在序列滿足相似度的情況下,SLAHAW是一種快速而有效的相似序列片斷匹配算法。關(guān)鍵詞:生物信息;序列比對;搜索算法;二級數(shù)據(jù)庫ABSTRACT21stcenturyisthecenturyoflifesciences
5、.Bioinformaticshasgottenunprecedenteddevelopmentinrecentyears.BioinformationSecondaryDatabaseisoneoftheimportantresearchdirectionsinbioinformafics.Duetothecomplexityofbothbioinformationdataandtheirapplications,thereisnorelativelycommonframeworkmodelsofarto
6、meetthedevelopmentneedofgeneralbioinformationsecondarydatabasesystems.Sequenceali鯽mentisthemostimportantmanipulationandthefundamentalinformationprocessingmethodinbioinformatics.Aligninganumberofcumulatednucleicacidandproteinsequencesissignificantfordiscove
7、ringfunctional,structural,andevolutionaryinformationinbiologicalsequences.In1histhesis,itintroducesthedevelopment,researchanddatabaseofbioinformaticsfast,andthensomeofalignmentmethodsaredescribed,suchasdotmatrixsequencecomparison,dynamicwoFammingalgorithmf
8、orsequencegiobalalignment,Smith-Watermanalgorithm,F(xiàn)ASTAalgorithm,BLASTalgorithmandSOon.Analyzethepurposeanditsmeaningoftheresearchofsequencealignmentalso.Thisthesisachievedaframeworksystemaboutcreatingbioinfo