資源描述:
《生物信息數(shù)據(jù)庫(kù)與生物信息中心》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、王祿山計(jì)算機(jī)應(yīng)用生物信息數(shù)據(jù)庫(kù)與生物信息中心授課大綱生命信息學(xué)——生命科學(xué)與計(jì)算機(jī)技術(shù)的交叉。生物信息學(xué)的研究?jī)?nèi)容:(1)生物信息中心(2)生物信息數(shù)據(jù)庫(kù)及格式。生物信息數(shù)據(jù)的檢索工具——Entrez文獻(xiàn)的檢索與管理軟件——Referencemanager序列同源搜索分析工具——Blast核酸、蛋白質(zhì)序列比對(duì)分析軟件——DSgeneDNASIS生物大分子空間三維結(jié)構(gòu)顯示與分析軟件——Rasmol生物圖像對(duì)比分析軟件——ScionImage(NIHimage)生物科學(xué)數(shù)據(jù)處理軟件——Origin重要生物信息中心重要生物信息數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)檢索工具生物分析相關(guān)軟件生物信息研究?jī)?nèi)容一
2、、重要生物信息中心BioinformaticsCentresNCBINationalCenterforBiotechnologyInformation(US)www.ncbi.nlm.nih.govEBIEuropeanBioinformaticsInstitute(EU)www.ebi.ac.ukDDBJDNADataBankofJapan(JP)www.ddbj.nig.ac.jpExPASyExpertofProteinAnalysisSystem(Switzerland)www.expasy.chPDBProteinDataBank(US)www.rcsb.org/p
3、db/CBIPKU北京大學(xué)生物信息中心(CN)www.cbi.pku.edu.cn/chinese/BioSino中國(guó)生物信息中心(CN)www.biosino.orgNCBI:http://www.ncbi.nlm.nih.govhttp://www.cbi.pku.edu.cn/chinese/http://www.biosino.org/二、重要生物信息數(shù)據(jù)庫(kù)生物信息學(xué)數(shù)據(jù)的表示形式生物信息學(xué)數(shù)據(jù)的表示形式平面文件(flat-file)信息在文件中順序存放且具有特定格式記錄(Entry)通過“獲得號(hào)”(accession#)唯一確定同一文件間和不同文件間信息的聯(lián)系均通
4、過accession#實(shí)現(xiàn)關(guān)系數(shù)據(jù)庫(kù)(relationalDB)基于實(shí)體聯(lián)系模型(E-R模型)表中的記錄(record/tuple)鍵唯一確定表之間通過外鍵建立聯(lián)系信息表示:關(guān)系數(shù)據(jù)庫(kù)semanticmappingAttributesRelations查詢語義映射和處理過程結(jié)果語義匹配生物信息學(xué)數(shù)據(jù)存在的問題信息源分布在世界各地不同的站點(diǎn)上涉及多個(gè)數(shù)據(jù)源的全局問題無法立刻得到答案PainfullycollectingunstructuredinformationaroundthesitesManuallyputtingpiecestogetherHopefullygettin
5、gtherightpicture...總之,信息源的特點(diǎn)是:自治的(autonomous)分布式的(distributed)異構(gòu)的(heterogeneous)數(shù)據(jù)集成DataIntegration數(shù)據(jù)集成XMLXMLSiteASiteBDataIntegration生物信息學(xué)最重要的任務(wù)是從海量數(shù)據(jù)中提取新知識(shí)生物數(shù)據(jù)庫(kù)的種類序列數(shù)據(jù)庫(kù)核酸序列數(shù)據(jù)庫(kù)(EMBL、GenBank、DDBJ)常用蛋白質(zhì)序列數(shù)據(jù)庫(kù)(Swissprot,PIR)結(jié)構(gòu)數(shù)據(jù)庫(kù)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)(PDB)蛋白質(zhì)分類數(shù)據(jù)庫(kù)(SCOP、CATH)其它數(shù)據(jù)庫(kù)生物數(shù)據(jù)庫(kù)的種類序列數(shù)據(jù)庫(kù)主要核酸序列數(shù)據(jù)庫(kù):GenBa
6、nk、EMBL、DDBJ主要蛋白質(zhì)序列數(shù)據(jù)庫(kù):Swissprot,PIR美國(guó)的核酸數(shù)據(jù)庫(kù)GenBank〖Banson,D.A.etal.(1998)NucleicAcidsRes.26,1-7〗從1979年開始建設(shè),1982年正式運(yùn)行;歐洲分子生物學(xué)實(shí)驗(yàn)室的EMBL數(shù)據(jù)庫(kù)也于1982年開始服務(wù)日本于1984年開始建立國(guó)家級(jí)的核酸數(shù)據(jù)庫(kù)DDBJ,并于1987年正式服務(wù)。從那個(gè)時(shí)候以來,DNA序列的數(shù)據(jù)已經(jīng)從80年代初期的百把條序列,幾十萬堿基上升至現(xiàn)在的110億堿基!這就是說,在短短的約18年間,數(shù)據(jù)量增長(zhǎng)了近十萬倍。核酸序列數(shù)據(jù)庫(kù)核酸序列核酸序列是由4種核苷酸的單字母(ATG
7、C)符號(hào)排成的序列。蛋白質(zhì)序列數(shù)據(jù)庫(kù)SWISS-PROT和PIR是國(guó)際上二個(gè)主要的蛋白質(zhì)序列數(shù)據(jù)庫(kù),目前這二個(gè)數(shù)據(jù)庫(kù)在EMBL和GenBank數(shù)據(jù)庫(kù)上均建立了鏡像(mirror)站點(diǎn)。SWISS-PROT數(shù)據(jù)庫(kù)包括了從EMBL翻譯而來的蛋白質(zhì)序列,這些序列經(jīng)過檢驗(yàn)和注釋。PIR數(shù)據(jù)庫(kù)的數(shù)據(jù)由美國(guó)家生物技術(shù)信息中心(NCBI)翻譯自GenBank的DNA序列。蛋白質(zhì)序列MNIQQLALQNIKGNWRNYKVFFLSSCFAIFASFAYMSVIVHPYMKETMWYQNVRWGLIICNIIIISFFI