Ai矿山现有的Biobanks为想象中的人类产生现实基因组

染色体从随机数字噪声中产生

染色体从随机的数字噪声中产生。信贷:Burak Yelmen

由于新算法和计算机技术的进步,机器现在可以学习复杂的模型,甚至可以生成高质量的合成数据,比如逼真的照片,甚至是想象中的人类的简历。最近发表在《国际杂志》上的一项研究公共科学图书馆遗传学使用机器学习来挖掘现有的生物汉并生成不属于真实人类但具有实际基因组特征的人类基因组的大块。

“现有的基因组数据库是生物医学研究的宝贵资源,但由于正当的伦理考虑,它们要么无法公开获取,要么被冗长而费力的应用程序所屏蔽。这为研究人员创造了一个主要的科学障碍。该研究的第一作者、塔尔图大学现代人口遗传学初级研究员Burak Yelmen说。

发电机产生随机噪声

发电机机器在鉴别器机器测试所生成的数据的情况下,将生成的数据塑造在可用实际数据的数据库中。一旦进程完成,算法将生成看起来像真实的人工数据,但实际上是完全新的。信用:Yelmen等人。2021.

PluidIsCISINARINARINARES与真实的团队进行多次分析以评估所生成的基因组的质量。“令人惊讶的是,这些基因因子从随机噪声中出现,模仿我们可以在真实人群中观察的复杂性,并且对于大多数属性,它们与我们用于训练我们的算法的BioBank的其他基因组不区分,除了一个细节,除了一个细节:他们这样做不属于任何基因捐助者,“Luca Pagani博士说,该研究的高级作者之一和Mobilitas Plus Plower。

该研究另外涉及评估人工基因组对实际基因组的邻近,以测试原始样品的隐私是否保存。“虽然在大海捞针中寻找成千上万的基因组中的检测隐私泄漏可能会像在干草堆中寻找针一样,但结合了多种统计措施使我们能够仔细检查所有模型。令人兴奋的是,复杂泄漏模式的详细探索可以导致生成式模型评估和设计的改善,并将燃料恢复机器学习领域,“跨学科计算机科学实验室的研究和CNRS研究人员(LRI / LISN,UniversitéParis-Saclay,法国国家科学研究中心)。

总而言之,机器学习方法已经为少数想象的人类提供了面孔,传记和多个其他特征:现在我们更多地了解他们的生物学。yabo124这些具有现实基因组的虚构人类可以作为所有实际基因组的代理,这些实际基因组不公开或需要长期应用程序或合作,因此去除基因组研究中的重要可访问性屏障,特别是对于强名的群体。

参考:“使用生成神经网络创建人造人类基因组”由伯克yelmen,aléliendecelle,琳达ongaro,戴维·马奈塔托,科伦特林·塔尔克,弗朗切斯科·蒙内罗罗,西里卡·弗莱特赫纳,卢卡·帕格尼和弗洛拉杰纳,2月4日2021年2月4日,公共科学图书馆遗传学
DOI: 10.1371 / journal.pgen.1009303

是第一个评论在“Ai矿山现有的生物人物,为想象的人类产生现实基因组”

发表评论

邮箱地址可选。如果提供,您的电子邮件将不会被发布或共享。