資源描述:
《生物信息學(xué)的現(xiàn)狀與未來》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、http://www.paper.edu.cn生物信息學(xué)的現(xiàn)狀與未來鄭偉國,郭英中國民用航空學(xué)院理學(xué)院天津,300300weiguozhejiang@eyou.com摘要:生物信息學(xué)已成為整個生命科學(xué)發(fā)展的重要組成部分,成為生命科學(xué)研究的前沿。本文對生物信息學(xué)研究對象、重要技術(shù)、數(shù)據(jù)庫建設(shè)及其研究現(xiàn)狀等方面進行了綜述,并展望生物信息學(xué)的發(fā)展前景。關(guān)鍵詞:生物信息學(xué);基因組學(xué);蛋白組學(xué);功能蛋白質(zhì)組學(xué);隨著生物科學(xué)技術(shù)的迅猛發(fā)展,生物信息數(shù)據(jù)資源的增長呈現(xiàn)爆炸之勢,同時計算機運算能力的提高和國際互聯(lián)網(wǎng)絡(luò)的發(fā)展使得對大規(guī)模數(shù)據(jù)的貯存、處理和傳輸成為可能,為了快捷方便地對已
2、知生物學(xué)信息進行科學(xué)的組織、有效的管理和進一步分析利用,一門由生命科學(xué)和信息科學(xué)等多學(xué)科相結(jié)合特別是由分子生物學(xué)與計算機信息處理技術(shù)緊密結(jié)合而形[1]成的交叉學(xué)科——生物信息學(xué)(Bioinformatics)應(yīng)運而生,并大大推動了相關(guān)研究的開展,被譽為“解讀生命天書的慧眼”。生物信息學(xué)既是一門工程技術(shù)又是一門科學(xué),自產(chǎn)生以來,大致經(jīng)歷了前基因組時代、基因組時代和后基因組時代三個發(fā)展階段。前基因組時代的標志性工作包括生物數(shù)據(jù)庫的建立、檢索工具的開發(fā)以及DNA和蛋白質(zhì)序列分析等;基因組時代的標志性工作包括基因識別與發(fā)現(xiàn)、網(wǎng)絡(luò)數(shù)據(jù)庫系統(tǒng)的建立和交互界面工具的開發(fā)等;后基因組
3、時代的標志則是大規(guī)?;蚪M分析、蛋白質(zhì)組分析以及各種數(shù)據(jù)的比較與整合。這三個階段雖無明顯的界限,卻真實地反映了整個研究重心的轉(zhuǎn)移變化歷程。對生物信息學(xué)的定義,國內(nèi)外眾說紛紜,至今尚未形成統(tǒng)一的認識。以下是一些較有影響的意見:美國國家基因組研究中心認為,生物信息學(xué)是一個代表生物學(xué)、數(shù)學(xué)和計算機的綜合力量的新興學(xué)科。北京生物技術(shù)和新醫(yī)藥產(chǎn)業(yè)中心認為,生物信息學(xué)是在生命科學(xué)研究中以計算機為工具[2]對生物信息進行儲存、檢索和分析的科學(xué)。1995年,在美國人類基因組計劃(HGP)第一個5年總結(jié)報告中給出了一個較為完整的生物信息學(xué)的定義:生物信息學(xué)是包含生物信息的獲取、處理、儲
4、存、傳遞、分析和解釋的所有方面的一門學(xué)科。從廣義上講,生物信息學(xué)是用數(shù)理和信息科學(xué)的觀點、理論和方法去研究生命現(xiàn)象,組織和分析大量生物學(xué)數(shù)據(jù)的一門學(xué)科;從狹義上講,生物信息學(xué)主要是基因組信息學(xué),它以計算機及互聯(lián)網(wǎng)為主要手段,并開發(fā)各種軟件,對與日俱增的大量DNA和蛋白質(zhì)序列及結(jié)構(gòu)進行收集、整理、發(fā)布、提取、加工和分析,從而破譯DNA序列中隱藏的信息,揭示出人體生理和病理過程的分子基礎(chǔ),并逐步認識生命起源、進化、遺傳和發(fā)育的本質(zhì),為人類疾病的預(yù)測、-1-http://www.paper.edu.cn診斷、預(yù)防和治療提供最為合理和有效的方法或途徑。縱觀生物信息學(xué)豐富多彩的
5、相關(guān)學(xué)科、研究領(lǐng)域及其由信息流方向主導(dǎo)的研究過程,筆者歸納出如下定義:生物信息學(xué)是一門采用計算機技術(shù)和信息論方法對蛋白質(zhì)及其核酸序列等多種生物信息采集、加工、儲存、傳遞、檢索、分析和解讀的科學(xué),是現(xiàn)代生命科學(xué)與信息科學(xué)、計算機科學(xué)、數(shù)學(xué)、統(tǒng)計學(xué)、物理學(xué)和化學(xué)等學(xué)科相互滲透而形成的交叉學(xué)科。1.研究對象生物信息學(xué)主要包括基因組學(xué)(Genomics)和蛋白組學(xué)(Proteomics),其實質(zhì)就是分析和解讀核酸和蛋白質(zhì)序列中所表達的結(jié)構(gòu)與功能的生物信息。1.1基因組學(xué)一種生物的全部遺傳構(gòu)成稱為該種生物的基因組,有關(guān)基因組的研究稱為基因組學(xué),它包含對基因組信息的獲取、處理、存
6、儲、分配和解釋等。其中,序列基因組學(xué)(Sequencegenomics)[3]主要研究測序和核苷酸序列,為繪制圖譜提供材料;結(jié)構(gòu)基因組學(xué)(Structuralgenomics)著重于遺傳圖譜、物理圖譜和測序等方面的研究;功能基因組學(xué)(Functionalgenomics)則研究以[3,4]轉(zhuǎn)錄圖為基礎(chǔ)的基因組表達圖譜;比較基因組學(xué)(Comparativegenomics)的研究內(nèi)容則包[5]括對不同進化階段基因組的比較和不同種群和群體基因組的比較。1.2蛋白組學(xué)由于基因表達水平并不能代表細胞中活性蛋白質(zhì)的數(shù)目(準確的說是開放讀框‘ORF’的數(shù)目),基因組序列并不能描述
7、活性蛋白質(zhì)所必需的翻譯后修飾和反映蛋白質(zhì)種類和含量[6]的動態(tài)變化過程,澳大利亞學(xué)者Wasinger等在1994年首次提出了蛋白組(Proteme)的概念。在一定條件下某一基因組蛋白質(zhì)表達的數(shù)量類型稱為蛋白組,代表這一有機體全部蛋白質(zhì)組成及其作用方式,有關(guān)蛋白組的研究稱為蛋白組學(xué)。其中,蛋白組的研究技術(shù)與方法、雙向[7]凝膠電泳圖譜以及對不同條件下蛋白組變化的比較分析是蛋白組學(xué)的主要研究內(nèi)容。1.3兩者的關(guān)系基因組基本上是固定不變的,而蛋白質(zhì)組是動態(tài)的,具有時空性和可調(diào)節(jié)性,能反映某基因的表達時間、表達量,以及蛋白質(zhì)翻譯后的加工修飾和亞細胞分布等,因