資源描述:
《生物序列的索引研究及其應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、生物序列的索引研究及其應(yīng)用Researchandapplicationofindexonbiologicalsequences導(dǎo)邱伯仁師朱揚(yáng)勇教授指導(dǎo)小組成員施伯樂教授顧寧教授汪衛(wèi)教授張亮教授d4拳疊;{f§j,,§‘l-9·f,●-薏_薯菩P目錄。摘要......................??..????...........??.....................................????..?...???..IABSTRACT..。.。。。.?.?.。....。。。。????.。.?????...?..。
2、.????。..??.??????.I第1章引言??????????????????????????????????。l1.1研究背景和意義?????????????????????????11.1.1生物信息學(xué)??????????????????????????.11.1.2生物序列相似性查詢?????????????????????21.2本文的主要工作????????????????????????。31.3文章結(jié)構(gòu)???????????????????????????.4第2章相關(guān)工作???????????????????.2.
3、1問題定義及描述????????????????????????一62.2研究進(jìn)展????????????????????????????????.1O第3章BIoINDEX索引143.1索引的建立??????????????????????????143.2基于BIoINDEx的查詢算法????????????????????l53.3實(shí)驗(yàn)結(jié)果及其分析????????????????????????。173.4本章小結(jié)???????????????????????????.19第4章SSQ』F算法????......????.....
4、.....??.??...?????.:!II4.1最優(yōu)過濾順序模型和過濾集大小估計(jì)???????????????。204.1.1最優(yōu)過濾順序模型???????????????????????204.1.2各過濾器的基本過濾原理???????????????????234.1.3過濾集大小的在線估計(jì)???????????????????。254.2SS0-MF算法實(shí)現(xiàn)策略???。??????????????????.3l4.3實(shí)驗(yàn)結(jié)果及其分析???????????????????????334.3.1參數(shù)影響??????????????
5、???????????..344.3.2過濾水平?????????????????????????????????..354.3.3過濾代價(jià)和過濾準(zhǔn)確度???????????????????。364.4本章小結(jié)???????????????????????????????????..38第5章轉(zhuǎn)錄調(diào)控序列數(shù)據(jù)挖掘系統(tǒng)????????????????????。?.395.1轉(zhuǎn)錄調(diào)控序列數(shù)據(jù)挖掘系統(tǒng)概述??????????????????39生物序列的索引研究及其應(yīng)用5.2順式調(diào)控元件查詢工具?????????????????????.4l
6、5.3轉(zhuǎn)錄調(diào)控序列挖掘工具?????????????????????.425.3.1順式調(diào)控元件挖掘工具???????????????????..425.3.2轉(zhuǎn)錄因子挖掘工具?????????????????????..435.3本章小結(jié)????????????????????????????45第6章總結(jié)與未來研究工作??????...??????????????????.47參考文獻(xiàn)???????????????????????????????????.49攻讀碩士學(xué)位期間的工作成果???。致{射?????????????????
7、?.生物序列的索引研究及其應(yīng)用捅要在生物領(lǐng)域研究中,在巨量生物數(shù)據(jù)庫中進(jìn)行生物序列相似性查詢是一項(xiàng)經(jīng)常性的工作,在探索生物學(xué)知識(shí)和生命活動(dòng)規(guī)律的過程中扮演著重要角色。然而在大型的長(zhǎng)序列數(shù)據(jù)庫中用樸素的完全搜索方法來進(jìn)行相似性查詢,其效率是非常低下的。因此,研究者開始研究各種優(yōu)化方式來提高查詢效率。查詢優(yōu)化的關(guān)鍵技術(shù)之一就是建立索引。索引結(jié)構(gòu)用一定的存儲(chǔ)空間作為代價(jià)換取查詢時(shí)的快速響應(yīng)。良好的索引結(jié)構(gòu)能有效組織生物序列數(shù)據(jù),顯著提高檢索的速度。然而現(xiàn)有的方法存在一些問題,針對(duì)這些問題提出新的方法以提高查詢效率是當(dāng)前研究的熱點(diǎn)。本文分析了當(dāng)
8、前的生物序列相似性查詢的索引研究的現(xiàn)狀,針對(duì)現(xiàn)有查詢算法的不足,提出了新的基于索引的生物序列相似性查詢算法BioIndex方法和SSQ-MF算法,設(shè)計(jì)實(shí)現(xiàn)了轉(zhuǎn)錄調(diào)控序列數(shù)據(jù)挖掘系統(tǒng)ITREP。本文取得的主要