科技名词

您当前的位置: 首页  >  科技名词  >  科技名词
基因数据库
发布时间:2021-07-21     作者:   来源:全国科学技术名词审定委员会   分享到:

基因数据库

gene data bank

定义:含基因和基因组资料的DNA数据库。

学科:生物化学与分子生物学_方法与技术

相关名词:基因组 序列 国家生物信息中心



【延伸阅读】

基因数据库存储有基因和基因组的序列、结构、变异和功能等多维度数据。这些信息是基因表达、调控及进化研究的基础。基因组序列、注释、结构、变异及功能等信息,为大规模人群队列研究、植物群体遗传及病毒进化等研究提供必要的数据资源。了解基因的结构、序列和功能,有利于药物或疫苗研发、癌症精准治疗、作物改良育种明确靶标等。

世界上生命科学领域重要的一级基因数据库,有美国国家生物技术信息中心的基因库(GenBank)、欧洲分子生物学实验室(EMBL)和日本DNA数据库(DDBJ)。这三个数据库建立信息共享机制,每天进行基因信息交换,确保所包含内容一样,只是格式存在差异。随着测序技术的发展,成千上万个物种完成了基因组测序,基因组数据海量增加,因而分类更为精细的基因数据库不断涌现。例如,植物基因数据库有植物比较基因组学数据库(Phytozome)、拟南芥信息资源(TAIR)、小麦基因组变异联合数据库(WheatUnion)、玉米遗传学和基因组学数据库(MaizeGDB);人和动物基因数据库有人和小鼠基因组及注释数据库(GENCODE)、加州大学圣克鲁斯分校基因组生物信息学数据库(UCSC);真菌基因数据库(MycoCosm)、细菌基因组数据库(IMG/M);病毒基因数据库有病毒病原体数据库和分析资源(ViPR)和全球共享禽流感数据库(GISAID)。

如今生命科学研究已进入大数据时代,生物信息资源成为基因组学革命及精准医学发展的源头。它是关系到国民经济和社会可持续发展的重要战略资源,因此生物数据安全至关重要。2019年,我国成立了国家生物信息中心,围绕基因组结构、变异、功能及其演化规律开展研究,建立了组学原始数据归档库、DNA甲基化数据库、RNA测序表达谱、植物RNA编辑数据库、长非编码RNA数据库、跨物种全基因组核小体定位图数据库以及犬类数据库等专业数据库。其中,组学原始数据归档库收录了人、小鼠、玉米、水稻、大豆、真菌等物种的基因组数据。2019年末新冠肺炎疫情暴发后,国家生物信息中心完成了新冠病毒基因组信息整合与变异注释分析,于2020年1月发布了新冠病毒信息库(2019nCoVR),为国内外科学研究、疫情防控等工作起到了重要的支撑作用。(中国科学院遗传与发育生物学研究所赵宇慧博士)