阅读所有7万种脊椎动物完整基因序列项目的首次重大发现

新的DNA测序技术和组装方法

New DNA sequencing technologies and assembly methods let researchers read the entire genomes of 25 species: pale spear-nosed bat, greater horseshoe bat, Egyptian fruit bat, greater mouse-eared bat, Kuhl’s pipistrelle bat, velvety free-tailed bat, Canada lynx, marmoset, vaquita, platypus, echidna, zebra finch, kākāpō, Anna’s hummingbird, domestic duck, emu, Goode’s thornscrub tortoise, two-lined caecilian, zig-zag eel, climbing perch, flier cichlid, eastern happy cichlid, channel bull blenny, blunt-snouted clingfish, and thorny skate. The animals span all major classes of vertebrates. Credit: Irving Geis/HHMI

通过发布新方法和前25个高质量基因组,读取每种已知的脊椎动物种类的完整遗传序列的大胆项目达到其第一个里程碑。

这是当今生物学中最大胆的项目之一——读取所有鸟类、哺乳动物、蜥蜴、鱼类和所有其他脊椎动yabo124物的整个基因组。

现在来自脊椎动物基因组项目(VGP)的第一个主要支付:25种的完整,高质量的基因组,Howard Hughes Medical Institute(HHMI)调查员Erich Jarvis于2021年4月28日报告,在Journal上报告自然。这些物种包括更大的马蹄蝙蝠,加拿大Lynx,鸭嘴兽和Kākāpō鹦鹉 - 濒危脊椎动物物种的第一高质量基因组之一。

本文还阐述了让科学家达到新的技术进步准确性Hhmi调查员和加州大学(UCSC),Santa Cruz(UCSC)的计算遗址Coauthor David Haussler表示,铺平了大约70,000名脊椎动物物种的基因组的方法。“我们将获得自然填写所有生态系统的令人兴奋的令人难以置信的各种各样的动物。”

还有大量的相关论文,这项工作开始提供该承诺。该项目团队在Zebra Finch基因组中发现了先前未知的染色体,例如,发现Marmoset和人类脑之间的遗传差异。新的研究还提供了拯救Kākāpō和濒危瓦基塔海豚的希望。

“这25个基因组代表了一个关键的里程碑,”洛克菲勒大学的贾维斯,VGP椅子和神经源学家解释。“我们学习超过我们预期的更多,”他说。“这项工作是一个原则的证据,以便到来的原则。”

Sagui Marmoset.

Marmoset基因组揭示了几种脑基因对人类的致病性差异。该发现突出了为什么科学家在开发动物模型时考虑基因组背景是重要的。

从10K到70K

VGP的里程碑已经酝酿多年。该项目的起源可以追溯到2000年代末,当时豪斯勒、遗传学家斯蒂芬·奥布莱恩(Stephen O 'Brien)和圣地亚哥动物园(San Diego Zoo)保护遗传学主任奥利弗·莱德(Oliver Ryder)认为,是时候大胆思考了。

而不是仅仅像果蝇一样排序,例如人类和模型生物,而是为什么不阅读一万只动物的完整基因组,大胆的“Genome 10k”努力?然而,当时,价格标签是数亿美元,而计划从未真正下车。“每个人都知道这是一个好主意,但没有人想为此付出代价,”召回Hhmi调查员和Hhmi教授Beth Shapiro,UCSC的进化生物学家和同志自然纸。

另外,科学家们在拼写拼写或“排序”时的早期努力DNA动物基因组中的字母被误坏了。在原来的方法,用于在2003年完成第一个粗糙人类基因组的原始方法,科学家们将DNA切成了短片,几百个字母长,读这些字母。然后是以正确的顺序组装碎片的恶魔困难的工作。这些方法无法达到任务,导致误解,主要差距和其他错误。通常它甚至不可能将基因映射到个体染色体。

加拿大山猫

冬季的加拿大猞猁(加拿大猞猁)。

新的短读序列测序技术的引入使阅读数千个基因组的想法成为可能。这些快速发展的技术降低了成本,但也降低了基因组组装结构的质量。2015年,Haussler和他的同事们引进了Jarvis。Jarvis是破译复杂神经回路的先驱,正是这些神经回路让鸟儿在听了其他鸟儿的歌曲后发出新歌的颤音。贾维斯已经显示出了管理大型复杂项目的能力。2014年,他和100多名同事一起工作对48种鸟类的基因组进行测序,这让新基因涉及声乐学习。“大卫和其他人要求我接受Genome 10K项目的领导,”Jarvis回忆道。“他们觉得我有它的个性。”或者,正如Shapiro所说的那样:“Erich是一个非常咄咄逼人的领导者,以一种很好的方式。他想要发生的事情,他会发生。“

贾维斯扩展并重新命名了基因组10K的想法,将所有脊椎动物的基因组都包括在内。他还帮助启动一个新的测序在洛克菲勒中心,一起在德国马克斯普朗克研究所的前领导的霍华德·休斯医学研究所的迈尔斯Janelia研究校园组长基因后,和另一个在英国桑格研究所由理查德·杜宾和Mark Blaxter目前生产的大部分虚地磁极基因组数据。他邀请美国国家人类基因组研究所(NHGRI)的领先基因组专家亚当·菲利普(Adam Phillippy)担任VGP组装团队的主席。然后,他发现大约60名顶级科学家愿意用自己的资助资金支付这些中心的测序费用,来研究他们最感兴趣的基因组。该团队还与新西兰的Māori和墨西哥的官员进行了谈判,以获得kākāpō和小头鼠海豚的样本,这是“国际合作的一个美丽的例子”,洛克菲勒VGP的项目主任Sadye Paez说。

开门

这个庞大的研究团队取得了一系列的技术进步。新的测序机器可以让他们读取10000个或更多字母的DNA块,而不是几百个。研究人员还设计了将这些片段组装成单个染色体的聪明方法。他们已经能够梳理出哪些基因是遗传自母亲和父亲的。这解决了一个被称为“错误复制”的特别棘手的问题,即科学家错误地将同一个基因的母本和父本副本标记为两个独立的姐妹基因。

“我认为这项工作开辟了一套非常重要的门,因为大会的技术方面是过去排序基因组的瓶颈,”杜克大学的遗传学家珍妮董说,他并没有直接参与该研究。她说,拥有高质量的测序数据“将改变人们可以提出的问题类型”。

该团队提高的准确性表明,以前的基因组序列是严重不完整的。以斑胸草雀为例,研究小组发现了8条新的染色体和大约900个被认为缺失的基因。之前未知的染色体也出现在鸭嘴兽身上公布在网上自然今年早些时候。研究人员还仔细研究了正确组装的长链重复DNA,其中大部分只包含四个基因字母中的两个。一些科学家认为这些拉伸是没有功能的“垃圾”或“暗物质”。错了。许多重复出现在基因组编码蛋白质的区域,贾维斯说,这表明DNA在开启或关闭基因方面起着令人惊讶的关键作用。

这只是一个开始自然Paper设想为“一个横跨生命科学的新发现时代”。每有一个新的基因组序列,贾维斯和他的合作者就会发现新的——而且往往是意想不到的——发现。例如,贾维斯的实验室终于找到了鹦鹉和鸣禽学习曲调所需的一个关键基因的调控区域;接下来,他的团队将试图弄清楚它是如何工作的。绒猴的基因组产生了几个令人惊讶的结果。虽然狨猴和人类大脑的基因在很大程度上是保守的,但狨猴有几个人类致病基因


Amino acids are a set of organic compounds used to build proteins. There are about 500 naturally occurring known amino acids, though only 20 appear in the genetic code. Proteins consist of one or more chains of amino acids called polypeptides. The sequence of the amino acid chain causes the polypeptide to fold into a shape that is biologically active. The amino acid sequences of proteins are encoded in the genes. Nine proteinogenic amino acids are called "essential" for humans because they cannot be produced from other compounds by the human body and so must be taken in as food.
" class="glossaryLink ">氨基酸。这突出了在开发动物模型时需要考虑基因组背景,团队在伴侣纸上报告自然。和在调查结果去年发布自然一位由Imma Teeling教授在爱尔兰都柏林教授领导的一群人发现,一些蝙蝠失去了免疫相关基因,这可能有助于解释他们耐受病毒的能力SARS-CoV-2, 什么导致新型冠状病毒肺炎

KāKāpō鹦鹉

高度濒临灭绝的Kākāpō鹦鹉缺乏遗传多样性,但显然能够吹扫有害突变,对其基因组的新分析表明。

新的信息也可能促进拯救稀有物种的努力。“帮助濒临灭绝的物种是一项至关重要的道德责任,”贾维斯说。这就是为什么这个团队从一个名为Jane的kākāpō上收集了样本,Jane是一个圈养繁殖计划的一部分,这个计划已经把鹦鹉从灭绝的边缘拯救了回来。在新杂志上发表的一篇论文中细胞基因组学, 的细胞奥塔哥大学的尼古拉斯斯斯斯克斯族家族和同事的家庭描述了他们对Jane的基因以及其他人的研究。这项工作透露,最后10,000年孤立在新西兰的岛屿上孤立的最后一个幸存的Kākāpō人口,尽管物种的低遗传多样性,但仍有一些纯净的有害突变。对于Vaquita来说,估计的10-20人在出版的研究中留下了类似的发现分子生态资源,由Phil Morin领导的加利福尼亚拉霍纳国家海洋和大气管理渔业。“这意味着有希望保护物种,”贾维斯的结论。

保持年轻的鸭嘴兽

高质量的基因序列显示了鸭嘴兽以前未知的染色体。

一个清晰的路径

VGP现在集中在更多物种上。项目团队的下一个目标是完成260个基因组,代表所有脊椎动物命令,然后捕获足够的资金来解决成千上万的资金,代表所有家庭。Tung说,这项工作并不容易,它将不可避免地带来新的技术和后勤挑战。在动物园或实验室中容易发现数百次或甚至数千只动物进行了测序,科学家可能面临来自其他物种的样品的道德障碍,特别是当动物稀有或濒危时。

但是用新的论文,前方的道路看起来比多年来更清晰。VGP模型甚至鼓励其他大型测序努力,包括地球生物元项目,旨在在10年内解码所有真核物种的基因组。也许是第一次,似乎有可能意识到Haussler和许多其他人在读取每个有机体的基因组的每个字母中的梦想。达尔文看到地球上的巨大多样性,因为“无尽的形式最美丽”,Haussler观察。“现在,我们有一个令人难以置信的机会,看看这些表格如何出现。”

参考:Arang rhee, Shane A. McCarthy, Olivier Fedrigo, Joana Damas, Giulio Formenti, Sergey Koren, Marcela Uliano-Silva, William Chow, Arkarachai Fungtammasan, Juwan Kim, Chul Lee, Byung June Ko, Mark Chaisson, Gregory L. Gedman, Lindsey J. Cantin, Francoise Thibaud-Nissen,Leanne Haggerty, Iliana Bista, Michelle Smith, Bettina Haase, Jacquelyn Mountcastle, Sylke Winkler, Sadye Paez, Jason Howard, Sonja C. Vernes, Tanya M. Lama, Frank Grutzner, Wesley C. Warren, Christopher N. Balakrishnan, Dave Burt, Julia M. George, Matthew T. Biegler, David Iorns, Andrew Digby, Daryl Eason, Bruce Robertson, Taylor Edwards,Mark Wilkinson, George Turner, Axel Meyer, Andreas F. Kautt, Paolo Franchini, H. William Detrich III, Hannes Svardal, Maximilian Wagner, Gavin J. P. Naylor, Martin Pippel, Milan Malinsky, Mark Mooney, Maria Simbirsky, Brett T. Hannigan, Trevor Pesout, Marlys Houck, Ann Misuraca, Sarah B. Kingan, Richard Hall, Zev Kronenberg, Ivan Sović,克里斯托弗•邓恩国家Ning,亚历克斯·Hastie乔伊斯Lee Siddarth一,理查德·e·格林,尼古拉斯·h·普特南Ivo肠道Jay Ghurye Erik驻军,应模拟人生,乔安娜·柯林斯,莎拉Pelan,詹姆斯·托伦斯,艾伦•特蕾西Jonathan Wood, Robel e . Dagnew登封关,莎拉·e·伦敦,大卫·f·克莱顿克劳迪奥·v·梅洛,萨曼莎·r·弗里德里希Peter V. Lovell, Ekaterina Osipova, Farooq O. Al-Ajli, Simona Secomandi, Heebal Kim, Constantina Theofanopoulou, Michael Hiller, Yang Zhou, Robert S. Harris, Kateryna D. Makova, Paul Medvedev, Jinna Hoffman, Patrick Masterson, Karen Clark, Fergal Martin, Kevin Howe, Paul Flicek, Brian P. Walenz, Woori Kwak, Hiram Clawson, Mark Diekhans,Luis Nassar教皇本笃祭碟,安德鲁·j·克劳福德罗伯特·h·s·克劳斯·m·托马斯·p·吉尔伯特国捷张Byrappa Venkatesh来说,罗伯特·w·墨菲Klaus-Peter Koepfli,贝思夏皮罗,沃伦·e·约翰逊Federica迪帕尔马托马斯Marques-Bonet,艾玛·c . Teeling Tandy Warnow,詹妮弗·马歇尔坟墓,奥利弗·a·赖德大卫•Haussler Stephen j . O ' brienJonas Korlach, Harris A. Lewin, Kerstin Howe, Eugene W. Myers, Richard Durbin, Adam M. Phillippy和Erich D. Jarvis, 2021年4月28日,自然
DOI: 10.1038 / s41586 - 021 - 03451 - 0