首个完整的新冠肺炎模型展示合作——“他们一起努力”

完成SARS-CoV-2病毒粒子模型

首次利用超级计算机开发出完整的SARS-CoV-2病毒粒子的多尺度模型。该模型为科学家提供了利用病毒漏洞的新方法。外部(L)和内部(R)视图显示刺突蛋白三聚体(teal)、糖基化位点(黑色)、膜蛋白(蓝色)和五聚膜离子通道(橙色)。来源:格雷戈里·沃斯,芝加哥大学

弗朗特拉,安东2台超级计算机模拟整体模型SARS-CoV-2病毒粒子。

新冠肺炎病毒有一些神秘之处。对于它如何融合并进入宿主细胞,科学家们仍然一无所知;它如何组装自己;以及它是如何脱离宿主细胞的。

“它们(刺突蛋白)不像一堆随机、不相关的运动那样独立移动。他们一起工作。”- - -格雷戈里·沃斯

计算模型结合实验数据提供了对这些行为的见解。但迄今为止,对引起大流行的SARS-CoV-2病毒有意义的时间尺度进行建模,仅限于spike蛋白等片段,这是目前一轮疫苗的目标。

一种新的SARS-CoV-2病毒粒子的多尺度粗粒度模型,其核心遗传物质和病毒粒子外壳首次使用超级计算机开发出来。该模型为科学家提供了利用病毒漏洞的新方法。

“我们希望了解SARS-COV-2如何整体效果作为整个粒子,”格雷戈里·帕皮扎岛杰出的服务教授芝加哥大学。沃斯是开发首个完整病毒模型的研究的通讯作者,该模型于2020年11月发表在《柳叶刀》杂志上生物物理学杂志

“我们开发了一个自下而上的粗粒模型,”休胜“,我们从原子级分子动力学模拟和实验中获取了信息。”他解释说,粗粒模型只能解决原子组,而不是 -原子模拟,每一个原子的相互作用都被解决。“如果你做得好(这一直是一个挑战),你就能保持模型中的物理特性。”


使用LAMMPS的SARS-COV-2 VIRION使用LAMMPS进行10×106 CG时间步长的粗粒分子动力学模拟。信贷:芝加哥大学格雷戈里丧料。

这项研究的早期结果显示了病毒表面的刺突蛋白是如何协同移动的。

“他们不会独立地像一堆随机,不相关的动作一样移动,”扑克说。“他们一起工作。”

这种刺突蛋白的协同运动提供了信息,说明冠状病毒如何探索和检测潜在宿主细胞的ACE2受体。

沃斯说:“我们发表的论文显示了刺突蛋白的运动模式是如何相互关联的。”他补充说,这些尖刺是相互连接的。当一种蛋白质移动时,另一种蛋白质也会相应移动。

“该模型的最终目标是作为第一步,研究最初的病毒群岛景点和与ace2对细胞的接受者的相互作用,并了解该吸引力的起源以及这些蛋白质如何共同努力进入病毒融合过程扑克说。


SARS-CoV-2病毒粒子沿着最高方差特征模的运动模式,这对应于刺突蛋白S1-S2结构域的伸展运动。来源:格雷戈里·沃斯,芝加哥大学

蒸料和他的小组一直在为艾滋病毒和流感等病毒开发粗粒模拟方法,超过20年。它们“粗化”数据以使其更简单,更可计算地进行易行,同时保持符合系统的动态。

“粗粒度模型的好处是它的计算效率可以是全原子模型的数百到数千倍,”Voth解释说。计算上的节省使得该团队能够建立一个比以往任何时候都大得多的冠状病毒模型,比全原子模型的时间尺度更长。

“你剩下的是较慢,集体动作。如果你做得很好,较高频率,全原子动作的效果将折叠到这些互动中。这就是系统性粗谷的想法。“

沃斯开发的整体模型从SARS-CoV-2病毒粒子四个主要结构元素的原子模型开始:刺突、膜、核衣壳和包膜蛋白。然后对这些原子模型进行模拟和简化,以生成完整的粗粒度模型。

该研究的合著者Rommie Amaro是加州大学圣迭戈分校的化学和生物化学教授,他对病毒粒子系统中的刺突蛋白成分(约170万个原子)进行了全原子分子动力学模拟。yabovip2021

“他们的模型基本上吸收了我们的数据,它可以从我们拥有的这些更详细的数据中学习,然后超越我们的研究范围,”Amaro说。“沃斯开发的这种方法将使我们和其他人能够在更长的时间尺度上模拟病毒感染细胞。”

Amaro阐述了从穗蛋白的粗粒模拟观察到的行为。

“他看到的是非常清楚的是Spike的S1亚基解离的开始。在融合期间,钉子的整个顶部剥落,“Amaro说。

病毒与宿主细胞融合的第一步是解离,它与宿主细胞的ACE2受体结合。

“使用这种粗粒模型看到的较大S1开放运动是我们在全原子分子动态中没有看到的东西,实际上我们将很难看,”Amaro说。“这是该蛋白质功能的关键部分和宿主细胞的感染过程。这是一个有趣的发现。“

沃斯和他的团队利用了阿玛罗实验室在Frontera超级计算机上生成的spike蛋白的开态和闭态的全原子动力学信息,以及其他数据。Frontera系统由美国国家科学基金会(NSF)资助,由德克萨斯大学奥斯汀分校的德克萨斯高级计算中心(TACC)运行。

“弗朗特拉已经表明,在多个尺度上,它对这些病毒研究是多么重要。在原子层面上,理解尖峰及其所有原子的潜在动力学是至关重要的。还有很多东西要学。但现在,这些信息可以再次被用于开发新的方法,让我们能够走得更远更远,就像粗粒度方法一样,”Amaro说。

“Frontera在为该模型中提供原子的原子水平提供分子动力学数据特别有用。这是非常有价值的,“扑克说。

Voth小组最初使用芝加哥大学研究计算中心的Midway2计算集群来开发粗粒度模型。

膜和包膜蛋白全原子模拟是在Anton 2系统上生成的。在美国国立卫生研究院的支持下,匹兹堡超级计算中心(PSC)运营的Anton 2是由D. E. Shaw Research公司免费开发和提供的用于分子动力学模拟的特殊用途超级计算机。

“弗朗特拉和安东2号为这个模型提供了关键的分子水平输入数据,”沃斯说。

“关于Frontera的一个非常棒的事情,这些类型的方法是我们可以让人们更准确地了解这些病毒如何移动和携带他们的工作,”Amaro说。

“甚至是实验的病毒的部分病毒,”她继续。“And through these types of methods that we use on Frontera, we can give scientists the first and important views into what these systems really look like with all of their complexity and how they’re interacting with antibodies or drugs or with parts of the host cell.”

Frontera提供给研究人员的这类信息有助于理解病毒感染的基本机制。它还有助于设计更安全、更好的药物来治疗和预防这种疾病,Amaro补充说。

休托:“我们关注的一件事现在是英国和南非SARS-COV-2变体。据推测,与我们在此开发的计算平台上,我们可以迅速评估这些差异,这是一个变化的差异


Amino acids are a set of organic compounds used to build proteins. There are about 500 naturally occurring known amino acids, though only 20 appear in the genetic code. Proteins consist of one or more chains of amino acids called polypeptides. The sequence of the amino acid chain causes the polypeptide to fold into a shape that is biologically active. The amino acid sequences of proteins are encoded in the genes. Nine proteinogenic amino acids are called "essential" for humans because they cannot be produced from other compounds by the human body and so must be taken in as food.
" class="glossaryLink ">氨基酸。我们希望迅速了解这些突变的变化导致病毒,然后有助于设计新的修改疫苗前进。“

参考:“SARS-COV-2 Virion的MultiScale粗粒模型”由Alvin Yu,亚历山大J.Pak,Penghe He,Viviana Monje-Galvan,Lorenzo Casalino,Zied Gaieb,Abigail C. Dommer,Rommie E. Amaro和格雷戈里A.冒险,2020年11月27日,生物物理学杂志
DOI:10.1016 / J.BPJ.2020.10.048

这项研究于2020年11月27日发表在《柳叶刀》杂志上生物物理学杂志。该研究的共同作者是芝加哥大学的Alvin Yu, Alexander J. Pak, Peng He, Viviana Monje-Galvan, Gregory A. Voth;以及加州大学圣迭戈分校的洛伦佐·卡萨利诺、齐德·盖耶布、阿比盖尔·c·多默和罗姆米·e·阿马洛。美国国家科学基金会(NSF)通过NSF RAPID grant ch -2029092、NSF RAPID MCB-2032054、美国国立卫生研究院普通医学科学研究所(National Institute of General Medical Sciences of National Institutes of Health)通过grant R01 GM063796、美国国立卫生研究院(National Institutes of Health) GM132826和加州大学圣地亚哥摩尔癌症中心(UC San Diego Moore’s Cancer Center 2020 SARS-COV-2种子基金提供资助。计算资源是由芝加哥大学的研究计算中心、由NSF基金资助的德克萨斯高级计算机中心的Frontera (OAC-1818253)和匹兹堡超级计算中心(PSC)通过Anton 2机器提供的。Anton 2计算机时间由COVID-19高性能计算联盟分配,由PSC通过美国国立卫生研究院拨款R01GM116961提供。PSC的安东2号机器是由d·e·肖研究公司慷慨提供的"