原标题:The Genome Reference Consortium Human Genome Build 37 now Available。其中“The Genome Reference Consortium”,找了好久都找不到正确的翻译。按我的理解,可译为基因组参照序列联盟(The Genome Reference Consortium,简称GRC)。
在2009年8月份,NCBI发布了版本37的人类基因组序列(build 37 of the human genome)。这个版本包含了由GRC提供的新测序的序列和新组装的序列。
GRC联盟
GRC联盟是由英国Wellcome Trust Sanger研究中心(the Wellcome Trust Sanger Center)、华盛顿大学基因组中心(The Washington University Genome Center)、欧洲生物信息研究所(the European Bioinformatics Institute)和美国国家生物技术信息中心(NCBI)联合组成。
Human Genome Build 37
GRC的目标是要修正那些不能装配或是错位的区域,努力让目前存的染色体序列的gaps消失。版本37(Build 37),或是称之为GRCh37,在版本36的基础上,更新了人类基因组的所有染色体,接合了25处序列的gaps,修正超过了150处有问题的序列,并且加了9个alternate loci。
关于GRC的详细信息,你可以访问GRC的首页:
http://www.ncbi.nlm.nih.gov/projects/genome/assembly/grc/human/
通过NCBI的数据库和工具,如the Entrez system, the graphical sequence viewer, the Map Viewer, and the NCBI Web BLAST services等,也可以很容易找到这些序列的注释信息。
GRCh37 Sequences at NCBI
最初组装好的染色体序列的命令为:accession号 从CM000663到 CM000686。包含了22条常染色体,再加上X和Y性染色体。另外的9个alternate loci来自:
the UDP glucuronosyltransferase 2, polypeptide B17 gene (UGT2B17) on chromosome 4 (accession GL000257); the Major Histocompatibility Complex (MHC) on chromosome 6 (accessions GL000250 through GL000256); and the microtubule-associated protein tau (MAPT) gene on chromosome 17 (accession GL000258).
注:染色体4的UGT2B17(accession GL000257)、染色体6的主要组织相容性复合体(accessions从 GL000250 到 GL000256)、和染色体17的微管结合蛋白基因(accession GL000258)
NCBI在此基础上,经过专家注释了31个参照序列(The NCBI genome annotation pipeline has created a corresponding set of 31 reference sequences (RefSeqs)),下面表1列出了GRCh37在RefSeq和Genbank数据库之间的相互关系。
Table 1:
Correspondence of GenBank, RefSeq accession numbers, and assembled sequences for the GRCh37 reference genome.(GRCh37的RefSeq的accession号和Genbank的accession号的一一对应)
GenBank Accession |
RefSeq Accession |
Description |
Chromosome 1 |
||
Chromosome 2 |
||
Chromosome 3 |
||
Chromosome 4 |
||
Chromosome 5 |
||
Chromosome 6 |
||
Chromosome 7 |
||
Chromosome 8 |
||
Chromosome 9 |
||
Chromosome 10 |
||
Chromosome 11 |
||
Chromosome 12 |
||
Chromosome 13 |
||
Chromosome 14 |
||
Chromosome 15 |
||
Chromosome 16 |
||
Chromosome 17 |
||
Chromosome 18 |
||
Chromosome 19 |
||
Chromosome 20 |
||
Chromosome 21 |
||
Chromosome 22 |
||
Chromosome X |
||
Chromosome Y |
||
MHC Region (ALT_REF_LOCI_1) |
||
MHC Region (ALT_REF_LOCI_2) |
||
MHC Region (ALT_REF_LOCI_3) |
||
MHC Region (ALT_REF_LOCI_4) |
||
MHC Region (ALT_REF_LOCI_5) |
||
MHC Region (ALT_REF_LOCI_6) |
||
MHC Region (ALT_REF_LOCI_7) |
||
UGT2B17 Region (ALT_REF_LOCI_8) |
||
MAPT Region (ALT_REF_LOCI_9) |
转载自原文链接, 如需删除请联系管理员。
原文链接:(译文)NCBI发布版本37的人类基因组序列,转载请注明来源!