密集:DNA数据存储的新扭曲让用户预览存储的文件

DNA数据概念

研究人员北卡罗来纳州立大学在长期存在的挑战脱氧核糖核酸将数据存储到工具中,使用它来提供用户预览存储的数据文件 - 例如图像文件的缩略图版本。

DNA数据存储是一种有吸引力的技术,因为它有可能在小包装中存储大量数据,它可以长时间存储该数据,并且它以节能的方式实现。但是,到目前为止,如果您想知道文件是什么,则无法在存储为DNA中的文件中预览数据,您必须“打开”整个文件。

“我们技术的优势在于它在时间和金钱方面更有效率,”凯尔托姆克说,一篇关于工作的纸张和博士学位。在NC状态的学生。“如果您不确定您想要的数据的文件,则不必在所有潜在文件中排序所有DNA。相反,您可以将DNA文件的更小部分序列以作为预览的方式。“

以下是快速概述这是如何工作的。

通过将称为引物结合序列的DNA序列附着到存储信息的DNA链的末端,用户“名称”它们的数据文件。为了识别和提取给定文件,大多数系统使用聚合酶链反应(PCR)。具体地,它们使用匹配相应的引物结合序列的小DNA引物鉴定包含所需文件的DNA链。然后系统使用PCR制备相关DNA链的大量拷贝,然后序列整个样品。因为该过程使得靶向DNA链的许多拷贝,所以靶线的信号比样品的其余部分更强,使得可以鉴定靶向DNA序列并读取文件。

但是,DNA数据存储研究人员已经努力的挑战是,如果两个或多个文件具有类似的文件名,则PCR将无意中复制多个数据文件。因此,用户必须给出文件非常明显的名称以避免获得凌乱的数据。

“在某些时候,我们可能能够将这些非特定交互用作工具,而不是将其视为问题,”工作和助理的一份文件的共同对应作者Albert Keung表示NC状态的化学和生物分子教授。

具体而言,研究人员开发了一种使用类似文件名的技术,让它们打开整个文件或该文件的特定子集。当命名文件和给定的文件子集时,通过使用特定命名约定来使用此操作。他们可以选择是否打开整个文件,或者只是通过操纵PCR工艺的几个参数来打开整个文件,或者只是“预览”版本:温度,样品中的DNA浓度,以及样品中试剂的类型和浓度。

“我们的技术使系统更加复杂,”詹姆斯·塔克(James Tuck)表示,本文的合法作者和NC州的计算机工程教授。“这意味着我们必须更加小心地管理文件命名约定和PCR条件。然而,这使得系统更加数据效率和大幅度更多的用户友好。“

研究人员通过在DNA数据存储中保存四个大型JPEG图像文件并在整体上检索每个文件的缩略图以及完整的高分辨率文件中的四个大型JPEG图像文件来展示了它们的技术。

“虽然我们只有存储的图像文件,但这种技术与其他文件类型广泛兼容。它还提供了这种新功能,而无需增加成本,“工作的共同作者和博士凯文·沃尔克尔说。在NC状态的学生。

新的“文件预览”技术也与DNA浓缩和嵌套分离(密集的)系统兼容,使得研究人员创建的,使DNA数据存储更加实用。通过引入数据文件标签和检索的改进技术,有效地使DNA存储系统更加可扩展。

“我们目前正在寻找行业合作伙伴,帮助我们探索这项技术的商业可行性,”Keung说。

本文将于今天(6月10日)发表于此自然通信。本文由Elaine Indermaur共同撰写,该本科在NC状态。

参考:“基于DNA的数据存储中的智慧档案操作的混杂分子”由Kyle J. Tomek,Kevin Volkel,Elaine W. Indermaur,James M. Tuck和Albert J. Keung,2021年6月10日,自然通信
DOI:10.1038 / S41467-021-23669-W

这项工作是通过国家科学基金会的支持,根据授权1650148,1901324和2027655;从国家需要奖学金领域的教育部门援助。

是第一个评论“密集:DNA数据存储的新扭曲允许用户预览存储的文件”

发表评论

电子邮件地址是可选的。如果提供的话,您的电子邮件不会发布或共享。