如果您向科学家们在国家人类基因组研究所(NHGRI)的时候,人类基因组项目包裹起来,他们会告诉你它在2003年完成。但是,一项新的研究表明了 复合参考基因组 从多个人的遗传密码部分堆放在一起,绝对是正在进行的工作。

完成的基因组是作为典型人类的遗传构成模型,研究人员可以用作检测遗传缺陷和某些疾病人们缺陷的参考。但新的研究 上周发表于自然界 表明当前模型可能出现故障—因此,可能实际上可能是迄今为止缺失的基因。

在研究人员认为可能包含数百个新基因的基因组中,八个人的遗传变异研究超过250个地区。研究Coauthor Evan E. Eichler表示,它还确定参考基因组可能是完全错误的或含有罕见的等位基因(基因的版本),西雅图大学基因组科学副教授副教授。

"具有罕见等位基因的参考基因组意味着它并不完全呈现大多数人,这是大多数人如何考虑参考基因组,"迈克尔斯奈德说,耶鲁大学生学家没有参与研究。

Eichler认为,从这八个基因组中收集的结果—和17其他他计划分析—可以帮助填补参考基因组中的间隙,这将使序列更有助于研究复杂的遗传疾病,如心脏病,糖尿病和糖尿病 精神分裂症 . "有一种说法,'这是序列,愚蠢的," Eichler says. "一旦获得高质量的序列,您可以在协会研究之后进行,并在疾病之后进行。"

Eichler和他的团队就在那里的基因组中查明了各个区域 结构变化 这可能会通过比较几个人的代码来进行。 这些变化 可以在遗传密码中影响数千到数百万字母或核苷酸(DNA分子)。人类基因组含有30亿个字母。改变可以采用所谓的拷贝数变异的形式(其中删除或复制了几个基因,导致一个人携带的基因副本数量的变化,而不是每个父母的一个副本的规范)或逆转,其中代码的段是颠倒的。当正在进行儿童的基因组时(通过将父母的守则切割和粘贴在一起)或通过修复DNA损伤的误差时,可能会引起这些突变,这通常由紫外线和烟雾吸入等环境因素引起的。

研究人员从八个人的血液中取出了DNA样本:四个非洲人,两个亚洲人和两个欧洲人。它们随机将每个人的代码造成一百万片碎片,然后尝试将段的末端与参考基因组的区域匹配。如果他们找不到匹配,团队将无意义的段指定为结构变化的网站。

总的来说,研究人员确定了1,695个结构变体实例,其中800例之前没有报道。受这些突变影响的区域中的五十个百分之一的人在研究中的一个以上。从参考基因组中缺少的525个区域中的40%是由于拷贝数变异,这意味着可能隐藏在它们内部的作物。

"我几乎确定他发现了新的基因," says 乔纳森塞巴特 ,在长岛冷泉港实验室的遗传学家,N.Y。"我们从未见过任何[位置]参考序列的基因零拷贝。"

Eichler表示,他的团队目前正在排序包含缺失信息的志愿者基因组的细分。"显然有些东西看起来像是那里的基因," he says.

他指出,我们的基因组的许多结构变化发生在代码的400个不稳定区域中。"许多这些变化被偏向于包括对适应重要的基因的特定区域," he says. "这些是在人类内部变化的基因,或者是[相对]的新基因,这些基因未在人类之外发现。"他叫这些地区"进化坩埚,"在尝试外,其中尝试了新的核苷酸组合,除了"very rare"他们创造有利的特征的实例"铸造了新的基因。"

一旦这些结构变化的特征为缺失,重复或倒置,它们就可以添加到其他努力中 国际HAPMAP项目,试图仅在不同种族的人之间仅涉及单一核苷酸的突变。今年早些时候,一个包括Nhgri在内的国际财团宣布了一个计划 序列1,000基因组 其中,在其他方面,有助于改进参考基因组中的数据。

如果可以修改参考基因组以代表最常见的基因集(并且可以编目小而大的变化),Eichler表示科学家能够能够在特定疾病的那些糖尿病中快速查明在那些中发现的等位基因,以及这种糖尿病将其与参考基因组进行比较以确定它是否是"normal" or flawed. "通过正确表征正常基因组," he says, "我们将能够非常容易地识别疾病导致的变体。"