科学家绘制了与免疫逃避和疾病严重程度有关的冠状病毒蛋白的奇怪结构

Cosmo Buffalo和Richard Hooy ORF8结构

生物学家利用在伯克利实验室的高级光源进行的晶体学研究,揭示了这种新病毒不寻常的蛋白质结构。

一个由艾滋病毒研究人员、细胞生物学家和生物物理学家组成的团队,他们联合起来支持新型冠状病毒肺炎科学家确定了一种冠状病毒蛋白的原子结构,认为这种蛋白有助于病原体逃避和抑制人类免疫细胞的反应。该结构图现已发表在期刊上PNAS但自8月以来已经向科学界开放——为专门针对这些疾病的新型抗病毒治疗奠定了基础SARS-CoV-2,从而进一步研究这种新出现的病毒是如何破坏人体的。

“使用x射线晶体学,我们建立了一个ORF8原子模型,它强调两个独特的区域:一个只出现在SARS-CoV-2及其直接蝙蝠的祖先,和一个没有任何其他冠状病毒,”主要作者詹姆斯·赫尔利说,加州大学伯克利分校教授、前教师学家劳伦斯伯克利国家实验室(伯克利实验室)。“这些区域稳定了蛋白质——这是一种分泌的蛋白质,不像病毒的特征刺突蛋白那样结合在膜上——并创造新的分子间界面。我们和研究界的其他人都认为,这些界面参与了某种反应,使SARS-CoV-2比它进化而来的毒株更具致病性。”

结构生物学在聚光灯下yabo124

生成蛋白质结构图总是需要大量的劳动,因为科学家们必须设计出能够泵出大量分子的细菌,操纵这些分子形成纯晶体,然后拍摄很多很多晶体的x射线衍射图像。这些图像是由x射线束从晶体中的原子反射回来,穿过晶格的缝隙,产生一种斑点图案产生的。这些图像通过特殊的软件进行组合和分析,以确定每个个体的位置原子。根据蛋白质的复杂程度,这个艰苦的过程可能需要数年时间。

马克·阿莱尔晶体学光束线

对许多蛋白质来说,通过将未解分子的结构与其他具有类似氨基酸的蛋白质进行比较,有助于构建图谱这些序列已经被绘制出来,这使得科学家能够对蛋白质如何折叠成其三维形状做出有根据的猜测。

但是对于ORF8,团队必须从头开始。ORF8的氨基酸序列与其他任何蛋白质都不一样,以至于科学家们无法参考它的整体形状,而决定其功能的是蛋白质的三维形状。

赫尔利和他在加州大学伯克利分校的同事们在HIV蛋白的结构分析方面经验丰富,他们与位于加州大学伯克利分校高级光源实验室(ALS)的结构生物学中心的生物物理学家和晶体学专家马克·阿莱尔(Marc Allaire)合作。yabo124他们一起努力工作了六个月——Hurley的实验室生成了晶体样本,并将它们交给Allaire,后者将使用ALS的x射线光束线来拍摄衍射图像。ORF8的结构是由数百个含有不同版本蛋白质的晶体和数千张衍射图像组成的,这些图像都是通过特殊的计算机算法分析得出的。

“冠状病毒的突变不同于流感或艾滋病毒等病毒,后者通过一个被称为高突变的过程快速积累许多小变化。在冠状病毒中,大块的核酸有时会通过重组四处移动,”Hurley解释说。当这种情况发生时,新的大的蛋白质区域就会出现。在SARS-CoV-2大流行早期进行的基因分析显示,这种新毒株是从感染蝙蝠的一种冠状病毒进化而来的,而且在编码一种名为ORF7的蛋白质的基因组区域发生了重大的重组突变,这种蛋白质在许多冠状病毒中都存在。ORF7的新形式被命名为ORF8,很快引起了病毒学家和流行病学家的注意,因为像ORF8这样的重大遗传差异事件往往是造成新毒株毒性的原因。

ORF8带图

ORF8结构的带状图,它由两个相同的氨基酸序列和形状的蛋白质单元组成,通过硫硫键连接。资料来源:赫利实验室/加州大学伯克利分校

“基本上,这种突变导致蛋白质的大小增加了一倍,而增加一倍的物质与任何已知的折叠无关,”Hurley补充说。“其中大约一半的核心与早期冠状病毒已解决的结构中的已知折叠类型有关,但另一半则是全新的。”

接电话

和许多从事COVID-19研究的科学家一样,赫尔利和他的同事选择了这样做在数据发表在同行评议的期刊上之前分享他们的发现它允许其他人比传统的出版过程提前几个月开始有影响力的后续研究。正如阿莱尔所解释的那样,由大流行造成的所有人都参与其中的危机,使研究界的每个人都变成了务实的心态。科学家们不用担心谁先完成了某件事,也不用拘囿于自己的特定研究领域,他们更早、更频繁地分享数据,当他们拥有所需的资源和专业知识时,就会开始新项目。

在这种情况下,Hurley在加州大学伯克利分校的合作者有病毒蛋白质和晶体学的专业知识,而Allaire,一个长期的合作者,也有晶体学的专业知识,关键的是,光束仍然在运行。ALS获得了《护理法案》(CARES Act)的特别资助,以继续开展COVID-19调查。该团队通过回顾1月发布的SARS-CoV-2基因组分析,了解到ORF8是(当时更加模糊的)大流行之谜的重要组成部分,因此他们开始工作。

从那以后,作者们都转向了其他项目,满意地为其他小组更详细地研究ORF8奠定了基础。(目前,有几项正在进行的研究集中在ORF8如何与细胞受体相互作用以及它如何与抗体相互作用,因为感染个体除了产生针对病毒表面蛋白的抗体外,似乎还产生了与ORF8结合的抗体。)

“当我们开始这个项目的时候,其他的项目都被搁置了,而我们有了这个独特的机会来坚持下来,解决一个紧迫的问题,”Allaire说,他是伯克利实验室分子生物物理和综合生物成像部门的一员。“我们非常密切地合作,进行了很多反复,直到我们做出了正确的选择。这真的是我职业生涯中最好的合作之一。”

从层序到结构

对一个基因或一串


Amino acids are a set of organic compounds used to build proteins. There are about 500 naturally occurring known amino acids, though only 20 appear in the genetic code. Proteins consist of one or more chains of amino acids called polypeptides. The sequence of the amino acid chain causes the polypeptide to fold into a shape that is biologically active. The amino acid sequences of proteins are encoded in the genes. Nine proteinogenic amino acids are called "essential" for humans because they cannot be produced from other compounds by the human body and so must be taken in as food.
" class="glossaryLink ">氨基酸对科学家来说,了解蛋白质的组成成分既快又容易,但用x射线晶体学或低温电子显微镜来研究氨基酸序列如何相互作用,从而折叠成蛋白质的实际物理形态,则是一项复杂而耗时的工作。因此,在生物学领域一直有一种长期的呼声,那就是开发一种工具,根据蛋白质的序列来准确预测蛋白质的结构。yabo124

ORF8色带结构实际vs AlphaFold

由AlphaFold 2(蓝色)预测的ORF8结构的色带图渲染,覆盖在由加州大学伯克利分校领导的团队确定的实际结构(绿色)上。信贷:DeepMind

在过去的几十年里,机器学习已经成为这一挑战的领跑者。这些人工智能程序被提供已知蛋白质结构的大型数据集,以便它们学会识别序列和折叠形状之间的相关性,迅速找到人类需要数年才能发现的模式。一旦这个被称为算法的程序以这种方式“训练”,它就可以用来建立未解蛋白质结构的预测模型。每次给它喂食一个新的经过确认的结构,它就会得到改善。

为了检验哪种算法是最好的,很多公司和机构都会举办竞赛,其中最著名的是每年两次的蛋白质结构预测临界评估(Critical Assessment of protein Structure Prediction, CASP)实验。去年,ORF8被选为CASP比赛的最后一项挑战,因为它“非常难以预测”,Hurley说。最优秀的算法都是基于ORF8结构和其他结构,直到8月份这些结构被公布在蛋白质数据库中,CASP的评委们才能够选出获胜者。AlphaFold 2是谷歌分支DeepMind开发的算法在构建了与实验目标最匹配的结构(包括ORF8的结构)后,获得了最佳的结果。

参考文献:Thomas G. Flower, Cosmo Z. Buffalo, Richard M. Hooy, Marc Allaire, Xuefeng Ren, and James H. Hurley, 2021年1月12日《SARS-CoV-2 ORF8结构,一种快速进化的免疫逃逸蛋白》美国国家科学院院刊
DOI: 10.1073 / pnas.2021785118

先进光源是能源部科学办公室的用户设备。伯克利结构生物学中心部分由霍华德休斯医学研究所和国家卫生研究院支持。yabo124