机器学习采用合成生物学:革命算法可以为您提供快速生物工程的细胞yabo124

Tijana Radivojevic和Hector Garcia Martin

伯克利实验室科学家Tijana Radivojevic(左)和Hector Garcia Martin在去年在敏捷生物福克斯的机械和统计建模,数据可视化和代谢地图上工作。信用:Thor Swift / Berkeley Lab

Berkeley Lab科学家开发了一个可以大大加快设计新生物系统的能力的工具。

如果你吃过味道像肉的素食汉堡,或者在美容过程中使用过合成胶原蛋白——这两种产品都是在实验室“生长”的——那么你就从合成生物学中受益了。yabo124这是一个充满潜力的领域,因为它让科学家能够设计出符合规格的生物系统,比如设计一种微生物来生产一种抗癌剂。然而,生物工程的传统方法是缓慢和费力的,试验和错误是主要的方法。

现在,能源部劳伦斯伯克利国家实验室(Berkeley Lab)的科学家制定了一种新工具,适应机器学习算法,以系统地引导开发的综合生物学需求。yabo124创新意味着科学家不必花几年为细胞的每个部分的细致了解以及它所做的事情;相反,通过一组有限的训练数据,该算法能够预测单元格的变化DNA或者生物化学yabovip2021会影响它的行为,然后为下一个工程周期提出建议,以及实现预期目标的概率预测。

“这些可能性是革命性的,”伯克利实验室的生物系统和工程(BSE)部门的研究员Hector Garcia Martin表示,他们领导了研究。“现在,生物工程是一个非常缓慢的过程。创造抗疟疾药物的150人患有150人的人青蒿素。如果您能够在几周或几个月内为规范创建新的单元格而不是年份,您可以真正彻底改变与生物工程能做什么。“

与BSE数据科学家Tijana Radivojevic和一家国际研究人员组织,该团队开发并展示了一种名为“自动推荐工具(ART)的专利申请算法,该算法在最近在期刊发布的一对论文中描述自然通信。机器学习允许计算机从大量可用的“培训”数据中“学习”后进行预测。

在Radivojevic领导的“ART:人工合成生物学的机器学习自动推荐工具”(ART: A machine learning Automateyabo124d Recommendation Tool for synthetic biology)中,研究人员提出了一种算法,该算法针对合成生物学领域的特点量身定制:小的训练数据集,量化不确定性的需要,以及递归循环。之前的代谢工程项目(如提高可再生生物燃料的产量)的模拟数据和历史数据证明了该工具的能力。

在“结合机械和机器学习模型进行预测工程和优化色氨酸代谢”中,该团队使用ART来指导代谢工程过程,以增加色氨酸(一种氨基)的产量用各种用途,由一种叫做糖酵母酿酒酵母或面包酵母的酵母。该项目由Jie Zhang of The Novo Nortisk Body of Denmark技术大学德国·Zhang基金会生物大学生物奥斯卡特·斯氏彼得森领导,与伯克利实验室和旧金山的创业公司Teselagen的科学家合作。

为了进行实验,它们选择了五个基因,每个基因由不同的基因启动子和细胞内的其他机制控制,总共代表生物途径的近8,000个潜在组合。然后,丹麦的研究人员在这些途径中获得了250个途径的实验数据,只表示所有可能组合的3%,并且数据用于训练算法。换句话说,艺术学会了与输入(基因表达)相关的输出(氨基酸产生)。

然后,使用统计推断,该工具能够推断剩余的7,000加组合的每个组合将如何影响色氨酸生产。该设计最终推荐的色氨酸产量增加106%,在最先进的参考应变中,超过17%的最佳设计,用于训练模型的最佳设计。

“这是一个明确的演示,即通过机器学习的生物工程是可行的,并且如果可扩展,则破坏性。我们为五个基因做了它,但我们相信它可以为全基因组完成,“Garcia Martin表示,敏捷的生物化学会成员,也是联合生物能源研究所(jbei)的定量代谢建模团队主任,Doe Bioenergy研究中心;两者都支持这项工作的一部分。“这仅仅是个开始。有了这一点,我们已经表明,正在进行代谢工程的替代方法。算法可以自动执行研究的常规部分,同时将时间投入到科学努力的更具创造性的部分:决定重要问题,设计实验,并巩固所获得的知识。“

需要更多数据

研究人员表示,他们对获得结果所需的数据如此之少感到惊讶。然而,要真正实现合成生物学的潜力,他们表示,这些算法需要用更多yabo124的数据进行训练。加西亚·马丁将合成生物学描述为仅仅处于婴儿期——相当于18世纪90年yabo124代的工业革命。他说:“只有通过投资自动化和高通量技术,你才能利用真正彻底改变生物工程所需的数据。”

Radivojevic添加:“我们提供了一个小型数据集的方法和演示;潜在的应用可能是对大量数据的访问提供革命性的。“

国家实验室的独特能力

除了实验数据的缺乏外,Garcia Martin还表示其他限制是人力资本 - 或机器学习专家。鉴于今天我们世界的数据爆炸,许多领域和公司正在竞争机器学习和人工智能的有限数量的专家。

Garcia Martin指出,如果国家实验室提供的团队环境包围,生物学的知yabo124识不是绝对的先决条件。例如,advojevic在应用数学和生物学中没有背景,有博士学位。yabo124他说:“在这里两年来,她能够用我们的多学科生物学家,工程师和计算机科学家的多学科团队努力合作,并在合成生物领域产生差异,”他说。yabo124“以传统的方式进行代谢工程,她将不得不花五年或六年,只是在开始自己的独立实验之前学习所需的生物学知识。”

“国家实验室提供了专业化和标准化可以繁荣的环境,并在他们标志的大型多学科团队中结合,”Garcia Martin说。

合成生物学有可能对几yabo124乎每个部门产生重大影响:食品,医学,农业,气候,能源和材料。根据各种市场报告,全球合成生物市场目前估计yabo124约为40亿美元,预计将增加2025年的超过20亿美元。

“如果我们能将代谢工程自动化,我们就能争取更大胆的目标。我们可以为治疗或生物修复目的设计微生物群。例如,我们可以改造肠道中的微生物群来生产治疗自闭症的药物,或者将废物转化为生物燃料的环境中的微生物群。”加西亚·马丁说。“机器学习和基于crispr的基因编辑的结合,能够更有效地收敛到所需的规范。”

参考:TijanaRadivojević,Zak Costello,Kenneth工人和Hector Garcia Martin,192020年9月2yabo1245日,参考:“合成生物学的机器学习自动推荐工具”自然通信
DOI:10.1038 / S41467-020-18008-4

该研究是由能源部支持的Agile Biofoundry和Jbei的一部分,并获得了Novo Nordisk基金会和欧洲委员会的支持。艺术可用于GitHub上的许可。

是第一个评论关于“机器学习接受合成生物学:革命算法可以为您提供快速生物工程的细胞”yabo124

发表评论

邮箱地址可选。如果提供,您的电子邮件将不会被公布或共享。