生物信息數(shù)據(jù)庫(kù)與生物信息中心

生物信息數(shù)據(jù)庫(kù)與生物信息中心

ID:39849749

大?。?.30 MB

頁(yè)數(shù):71頁(yè)

時(shí)間:2019-07-13

生物信息數(shù)據(jù)庫(kù)與生物信息中心_第1頁(yè)
生物信息數(shù)據(jù)庫(kù)與生物信息中心_第2頁(yè)
生物信息數(shù)據(jù)庫(kù)與生物信息中心_第3頁(yè)
生物信息數(shù)據(jù)庫(kù)與生物信息中心_第4頁(yè)
生物信息數(shù)據(jù)庫(kù)與生物信息中心_第5頁(yè)
資源描述:

《生物信息數(shù)據(jù)庫(kù)與生物信息中心》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。

1、王祿山計(jì)算機(jī)應(yīng)用生物信息數(shù)據(jù)庫(kù)與生物信息中心授課大綱生命信息學(xué)——生命科學(xué)與計(jì)算機(jī)技術(shù)的交叉。生物信息學(xué)的研究?jī)?nèi)容:(1)生物信息中心(2)生物信息數(shù)據(jù)庫(kù)及格式。生物信息數(shù)據(jù)的檢索工具——Entrez文獻(xiàn)的檢索與管理軟件——Referencemanager序列同源搜索分析工具——Blast核酸、蛋白質(zhì)序列比對(duì)分析軟件——DSgeneDNASIS生物大分子空間三維結(jié)構(gòu)顯示與分析軟件——Rasmol生物圖像對(duì)比分析軟件——ScionImage(NIHimage)生物科學(xué)數(shù)據(jù)處理軟件——Origin重要生物信息中心重要生物信息數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)檢索工具生物分析相關(guān)軟件生物信息研究?jī)?nèi)容一

2、、重要生物信息中心BioinformaticsCentresNCBINationalCenterforBiotechnologyInformation(US)www.ncbi.nlm.nih.govEBIEuropeanBioinformaticsInstitute(EU)www.ebi.ac.ukDDBJDNADataBankofJapan(JP)www.ddbj.nig.ac.jpExPASyExpertofProteinAnalysisSystem(Switzerland)www.expasy.chPDBProteinDataBank(US)www.rcsb.org/p

3、db/CBIPKU北京大學(xué)生物信息中心(CN)www.cbi.pku.edu.cn/chinese/BioSino中國(guó)生物信息中心(CN)www.biosino.orgNCBI:http://www.ncbi.nlm.nih.govhttp://www.cbi.pku.edu.cn/chinese/http://www.biosino.org/二、重要生物信息數(shù)據(jù)庫(kù)生物信息學(xué)數(shù)據(jù)的表示形式生物信息學(xué)數(shù)據(jù)的表示形式平面文件(flat-file)信息在文件中順序存放且具有特定格式記錄(Entry)通過“獲得號(hào)”(accession#)唯一確定同一文件間和不同文件間信息的聯(lián)系均 通

4、過accession#實(shí)現(xiàn)關(guān)系數(shù)據(jù)庫(kù)(relationalDB)基于實(shí)體聯(lián)系模型(E-R模型)表中的記錄(record/tuple)鍵唯一確定表之間通過外鍵建立聯(lián)系信息表示:關(guān)系數(shù)據(jù)庫(kù)semanticmappingAttributesRelations查詢語義映射和處理過程結(jié)果語義匹配生物信息學(xué)數(shù)據(jù)存在的問題信息源分布在世界各地不同的站點(diǎn)上涉及多個(gè)數(shù)據(jù)源的全局問題無法立刻得到答案PainfullycollectingunstructuredinformationaroundthesitesManuallyputtingpiecestogetherHopefullygettin

5、gtherightpicture...總之,信息源的特點(diǎn)是:自治的(autonomous)分布式的(distributed)異構(gòu)的(heterogeneous)數(shù)據(jù)集成DataIntegration數(shù)據(jù)集成XMLXMLSiteASiteBDataIntegration生物信息學(xué)最重要的任務(wù)是從海量數(shù)據(jù)中提取新知識(shí)生物數(shù)據(jù)庫(kù)的種類序列數(shù)據(jù)庫(kù)核酸序列數(shù)據(jù)庫(kù)(EMBL、GenBank、DDBJ)常用蛋白質(zhì)序列數(shù)據(jù)庫(kù)(Swissprot,PIR)結(jié)構(gòu)數(shù)據(jù)庫(kù)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)(PDB)蛋白質(zhì)分類數(shù)據(jù)庫(kù)(SCOP、CATH)其它數(shù)據(jù)庫(kù)生物數(shù)據(jù)庫(kù)的種類序列數(shù)據(jù)庫(kù)主要核酸序列數(shù)據(jù)庫(kù):GenBa

6、nk、EMBL、DDBJ主要蛋白質(zhì)序列數(shù)據(jù)庫(kù):Swissprot,PIR美國(guó)的核酸數(shù)據(jù)庫(kù)GenBank〖Banson,D.A.etal.(1998)NucleicAcidsRes.26,1-7〗從1979年開始建設(shè),1982年正式運(yùn)行;歐洲分子生物學(xué)實(shí)驗(yàn)室的EMBL數(shù)據(jù)庫(kù)也于1982年開始服務(wù)日本于1984年開始建立國(guó)家級(jí)的核酸數(shù)據(jù)庫(kù)DDBJ,并于1987年正式服務(wù)。從那個(gè)時(shí)候以來,DNA序列的數(shù)據(jù)已經(jīng)從80年代初期的百把條序列,幾十萬堿基上升至現(xiàn)在的110億堿基!這就是說,在短短的約18年間,數(shù)據(jù)量增長(zhǎng)了近十萬倍。核酸序列數(shù)據(jù)庫(kù)核酸序列核酸序列是由4種核苷酸的單字母(ATG

7、C)符號(hào)排成的序列。蛋白質(zhì)序列數(shù)據(jù)庫(kù)SWISS-PROT和PIR是國(guó)際上二個(gè)主要的蛋白質(zhì)序列數(shù)據(jù)庫(kù),目前這二個(gè)數(shù)據(jù)庫(kù)在EMBL和GenBank數(shù)據(jù)庫(kù)上均建立了鏡像(mirror)站點(diǎn)。SWISS-PROT數(shù)據(jù)庫(kù)包括了從EMBL翻譯而來的蛋白質(zhì)序列,這些序列經(jīng)過檢驗(yàn)和注釋。PIR數(shù)據(jù)庫(kù)的數(shù)據(jù)由美國(guó)家生物技術(shù)信息中心(NCBI)翻譯自GenBank的DNA序列。蛋白質(zhì)序列MNIQQLALQNIKGNWRNYKVFFLSSCFAIFASFAYMSVIVHPYMKETMWYQNVRWGLIICNIIIISFFI

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。