一种一个国际科学家团队表示,他们已经对整个人类基因组进行了测序,包括二十年前在第一个人类基因组序列中没有发现的部分。
这一说法如果得到证实,将超越人类基因组计划和 Celera Genomics 的领导人在 2000 年宣布对人类基因组初稿进行测序时在白宫草坪上所做的壮举。 这个历史性的草案,以及随后的人类 DNA 测序,都遗漏了大约 8% 的基因组。
新的基因组测序使用新技术填补了这些空白。 然而,它有各种限制,包括研究人员用来加快工作速度的细胞系类型。
广告
工作是 5月27日印前详解,这意味着它尚未经过同行评审。
“你只是想研究人类基因组的最后一个未知数,”加州大学圣克鲁兹分校的研究员 Karen Mega 说,他共同领导了创建测序的国际联盟。 “以前没有做过,以前没有做过的原因是因为它很难。”
广告
Mega 证实,在该论文被审查并发表在医学期刊上之前,她不会考虑宣布官方。
研究人员表示,新基因组是一个飞跃,由两家私营公司开发的新 DNA 测序技术使之成为可能:加利福尼亚州门洛帕克的 Pacific Biosciences,也称为 BacBio,和来自英国牛津科学园的 Oxford Nanopore。 与长期以来被认为是研究人员黄金标准的工具相比,他们的 DNA 读取技术具有非常特殊的优势。
欧洲分子生物学实验室副主任 Euan Birney 将这一结果描述为“强大的技术回合”。 他指出,原始基因组论文是精心制作的,因为它们没有对从一端到另一端的每个 DNA 分子进行测序。 “这个小组所做的就是表明他们可以从头到尾做到这一点。” 他说,这对未来的研究很重要,因为它展示了可能的情况。
哈佛大学生物学家和测序先驱乔治·丘奇将这项工作描述为“非常重要”。 他说他喜欢在他的谈话中指出,到目前为止还没有人对整个脊椎动物基因组进行测序——如果新工作得到证实,这将不再是真实的。
一个重要的悬而未决的问题:人类谜题中这些缺失的部分有多重要? 该财团表示,将 DNA 碱基数量从 29.2 亿增加到 30.5 亿,增长了 4.5%。 但基因数量仅增加了 0.4%,达到 19,669。研究人员强调,这并不意味着这项工作也不能带来其他新见解,包括基因如何调控的见解。
使用的 DNA 序列不是来自人,而是来自葡萄胎,当精子与不含细胞核的卵子受精时,葡萄胎会在女性子宫中生长。 这意味着它有 23 条染色体,就像精子或卵子一样,而不是 46 条。
研究人员选择了这些保存在实验室中的细胞,因为这使得创建 DNA 序列的计算工作更加简单。 2003 年建立的原始基因组计划也只包含 23 条染色体,但随着 DNA 测序技术变得更便宜和更简单,研究人员倾向于对所有 46 条染色体进行测序。
全国儿童医院基因组医学研究所联合执行主任艾伦·马迪斯担心,由于这些细胞系在实验室中的保留,新的遗传信息可能会发生变化。”在很大程度上,它是一种随着细胞系在培养中传播多年而积累的残留物。”
Mega 说,对细胞系的研究表明,它类似于人类细胞,研究人员使用的是冷冻多年的细胞,而不是循环的细胞。 她同意,下一步是让该小组尝试排列所有 46 条染色体,即二倍体基因组。
为什么基因组的最后 8% 需要 20 年才能测序,即使基因组其余部分的测序成本从 3 亿美元降至 300 美元? 答案与 DNA 测序技术的工作方式有关。
目前由 Illumina 制造的 DNA 测序仪采用小片段 DNA 进行解码,然后重新组装产生的拼图。 这适用于大多数基因组,但不适用于 DNA 代码是长重复模式结果的区域。 如果一台超级计算机只包含小部件,它如何组装一个以碱基为基础重复“AGAGAGA”的DNA序列? 这就是 8% 的缺失基因组的样子。
在这些“未配对”区域中,是生物学中最著名的结构之一。 如果您曾经看过染色体(回想一下高中生物学),它们看起来就像连在一起的绳子。 这些节点是中心粒,它们是将染色体连接在一起的 DNA 束。 它们在细胞分裂中起主要作用。 它充满了重复。
事实上,正是行星吸引了美嘉想要看到这些缺失的区域。
“为什么对生命如此重要、对细胞如何工作如此重要的区域,放置在我们基因组的一部分上,这些巨大的串联海洋会重复?” 她记得她大一的时候问过这个问题。
正是这个问题促使她在与 NIH 研究员 Adam Phillippe 的讨论中建议在 2019 年开始他们当前的倡议,称为端粒 2 端粒联盟,以端粒(染色体的末端)命名。他们签下了 Evan Eichler,作为共同作者,华盛顿大学的生物学家多年来一直关注基因组的缺失部分。
这项工作之所以成为可能,是因为 Oxford Nanopore 和 PacBio 的技术不会将 DNA 切割成小块拼图。 牛津纳米孔技术使 DNA 分子穿过一个小孔,从而产生一个很长的序列。 PacBio 技术使用激光一遍又一遍地扫描相同的 DNA 序列,从而获得高度准确的读数。 两者都比当前的 Illumina 技术更昂贵。
公司在激烈的竞争中。 研究人员说,对于这个项目,PacBio 技术的准确性证明是无价的,他们使用牛津纳米孔完成了一些领域。 但牛津纳米孔已经承诺了一种新的、更实用的技术。 约翰霍普金斯大学助理教授迈克尔沙茨说:“就目前而言,PacBio 具有优势,但尚不清楚他们能够保持多久。”
所有研究人员都谈到了对未来的愿景,他们将组装数百个不同的、完整的、相互关联的和种族多样化的基因组,而不是使用单一的参考基因组,这些基因组可以用作参考。 Mega 也帮助领导这项业务。 这只是朝着这个方向迈出的一步。
但到目前为止,Schatz 说,一直存在关于缺少什么的问题。 现在我们终于有了正确的数据。 “我们拥有正确的技术。”
More Stories
詹姆斯·韦伯太空望远镜检测到超大质量黑洞附近的冲击(图片)
研究表明,富含水果和蔬菜的饮食可以降低患心脏病和肾脏疾病的风险
中国的巨大陨石坑里有“天堂”森林,其中的植物适应了严酷的地下生活