第二节 常用数据库简介
一、NCBI
美国国立生物技术信息中心(National Center for Biotechnology Information,NCBI)是美国国立卫生研究所(National Institute of Health,NIH)的国立医学图书馆(National Library of Medicine,NIM)分支,成立于1988年,目的是提供一个医学研究成果交换平台。NCBI由不同类型数据库和分析软件所组成,其中的Nucleotide数据库(GenBank)收载大量中药材物种序列,是重要的生物信息来源。
二、EMBL
由以色列及17个欧洲国家共同管理的欧洲分子生物学实验室(The European Molecular Biology Laboratory,EMBL),其中EMBL-DNA Database由欧洲生物信息研究院(European Bioinformatics Institute,EBI)建立。数据库除提供核酸及蛋白质序列查询外,亦有多种序列分析程序,常用的有多序列排序ClustalW。
三、DDBJ
日本DNA数据库(DNA Databank of Japan,DDBJ)建立于1984年。主要搜集及管理日本及世界各地所载的分子序列。DDBJ每日跟GenBank及EMBL-DNADatabase交换新增数据,所以以上三者所收录的序列是相同的。
四、BOLD
Barcode of Life Data Systems(BOLD)是一个生物学条形码信息平台(Ratnasingham和Hebert,2007),协助收载、储存、分析和发放DNA条形码记录,整合生物的分子、外观形态以及群体分布的数据库。BOLD会为任何对DNA条形码有兴趣的研究员免费提供服务。跟NCBI一样,研究人员可以在BOLD上发布DNA条形码序列,利用数据库鉴定不知名样本等。除此之外,所收载的每条序列,都附有来源标本的影像、采集数据(采集者、日期、地点GPS坐标)、用作扩增的引物和序列的源文件,由此可见BOLD并非一个单纯的序列数据库,而是针对DNA条形码研究所需而建成的特殊数据库。
BOLD的其中一项功能是DNA条形码鉴定物种,所以极为重视来源生物品种的真实、正确性。相反,NCBI所收载的序列数据,其来源生物的身份是未经考证的,这是BOLD优胜的地方。但是BOLD只接受几种DNA条形码序列,如真菌的ITS、植物的mat K和rbc L以及动物的CO I。NCBI则接受任何DNA区域的查询,限制较少。
五、MMDBD
Medicinal Materials DNA Barcode Database(MMDBD)由香港中文大学邵鹏柱领导的团队建立的全世界第一个中药DNA条形码数据库(Lou等,2010)。能够提供药材的中文名、拉丁名、药用部位、图片、常见伪品、混淆品和代替品的DNA条形码资料。用户可以药材名称或植物拉丁名检索。内建BLAST功能,使用者可比对数据库内的序列,从而鉴定药材。
此外,中国医学科学院药用植物研究所建立了全世界最大的药用植物DNA条形码鉴定数据库(含2万余个物种)和中药材DNA条形码鉴定系统网站(http://www.tcmbarcode.cn),该数据库鉴定系统以《中国药典》2010版收载的植物和动物药材为研究对象,将DNA条形码技术和生物信息学技术相结合,建立了用于中药鉴定的网络信息化操作平台,并涵盖绝大多数美国药典、日本药局方、欧盟药典、韩国药典和印度药典的草药。同时建立专门中药条形码网站,如基于ITS2的DNA条形码鉴定网站(http://www.its2-plantidit.dnsalias.org),不仅可用于中药资源信息检索、查询以及比对鉴定,而且可广泛应用于从中药材源头生产到市场流通等各环节,如中药种植基源信息检索、查询以及比对鉴定,中药种植基地种质资源的真伪,种子种苗的鉴定,现有种质资源库样品的真伪,中药资源野生变家种过程中种源的鉴定以及中药材采收、粗加工、存储和销售等市场流通环节。
六、美国科学网(Web of Science)
由美国Thomson公司所管理及开发,所收载的期刊比NIM-PubMed更多,经订购后,用户可在线查询多份期刊,将摘要整合、记录、打印和输出往个人的期刊库储存。
七、中国知识网(CKRID)
中国知识网(China Knowledge Resource Integrated Database,CKRID)管理多类中文文献,包括学术期刊、博士学位论文、工具书等。经订购后,用户可直接下载文章,是寻找中文学术文章的重要工具。
八、中国植物志(Flora of China)
中国植物志英文版(Flora of China)是中国的植物分类学权威参考,提供植物基原在线查询。
九、常用网站链接
1.National Center for Biotechnology Information(NCBI):
http://www.ncbi.nlm.nih.gov/
2.The European Molecular Biology Laboratory -DNA database(EMBL):http://www.ebi.ac.uk/embl/
3.DNA Databank of Japan(DDBJ):
http://www.ddbj.nig.ac.jp/
4.Barcode of Life Data Systems(BOLD):
http://www.boldsystems.org/views/login.php
5.Medicinal Materials DNA Barcode Database(MMDBD):
http://www.cuhk.edu.hk/icm/mmdbd.htm
6.Web of Science:
http://thomsonreuters.com/products_services/science/science_products/a-z/web_of_science/
7.中国知识网:
http://www.cnki.net/
8.Flora of China:
http://hua.huh.harvard.edu/china/
9.The International Plant Names Index(IPNI):
http://www.ipni.org/
10.BioEdit:
http://www.mbio.ncsu.edu/bioedit/bioedit.html
11.Molecular Evolutionary Genetics Analysis(MEGA):
http://www.megasoftware.net/
12.Phylogenetic Analysis Using Parsimony(PAUP):
http://paup.csit.fsu.edu/
13.Phylogeny Inference Package(PHYLIP):
http://evolution.genetics.washington.edu/phylip.html
14.Genemarker:
http://www.softgenetics.com/GeneMarker.html
15.NEBcutter:
http://tools.neb.com/NEBcutter2/index.php