去年12月倒塌了槟榔射电望远镜,但它的发现和创新遗产仍在继续

阿雷西博天文台的星空

来自坍塌的阿雷西博射电望远镜的数据被安全转移并保存到UT奥斯汀的德克萨斯高级计算中心。一个多机构合作伙伴建立了安全传输超过3pb的阿雷西博50年天空扫描数据。这些数据帮助科学家们做出了有关天空的诺贝尔奖发现。这一数据移动将确保未来几代天文学家有机会从阿雷西博的数据中做出新的发现。信贷:阿雷西博天文台

阿雷西博天文台,UCF, TACC,波多黎各大学,EPOC, Globus, CICoE试点合作伙伴将望远镜数据移动到Ranch系统。

数以百万计的人看到了著名的阿雷西博射电望远镜倒塌的画面2020年12月。从这些视频中没有看到的是Arecibo的数据中心,位于危险区域之外。它存储了望远镜数据的“金色副本” - 自20世纪60年代以来,天空扫描的原始磁带,硬盘和磁盘驱动器。

现在,一个新的合作伙伴将确保大约3pb或3000tb的望远镜数据被安全备份,并向世界各地的天文学家提供,他们将能够使用这些数据继续阿雷西博天文台的发现和创新遗产。

一起工作

在阿雷西博公司倒闭的几周内,德克萨斯高级计算中心(TACC)与中佛罗里达大学(UCF)、参与和性能操作中心(EPOC)、阿雷西博天文台、网络基础设施卓越中心试点(CICoE试点)和Globus公司签署了一项协议芝加哥大学.他们一起将阿雷西博射电望远镜的数据转移到TACC的牧场,这是一个长期的海量数据存储系统。计划包括扩大对阿雷西博天文台50多年来的天文数据的访问,阿雷西博天文台直到2016年都是世界上最大的射电望远镜。

德克萨斯大学奥斯汀·奥斯汀大学临近行政副总裁兼总体奥斯汀将成为数据储存库中最重要的望远镜之一的数据储存库的家园。“

TACC牧场

TACC的Ranch超级计算机是一种长期的海量数据存储系统,它安全地保存了来自阿雷西博射电望远镜的超过3pb的数据。牧场是美国国家科学基金会(NSF)资助的极端科学与工程发现环境(XSEDE)的分配资源。信贷:TACC

“作为一个年轻的射频天文学家,我认为槟榔作为我国对我所爱的科学承诺的惊人象征,”贾维德说。“Arecibo在许多领域作出了重要贡献 - 对行星的研究,为宇宙扩展的扩展来说,了解恒星形式的云,以少数人。保留这些数据并使它们可供进一步研究,将允许Arecibo对我的领域进行持续影响。“

阿雷西博天文台主任Francisco Cordova说:“在过去50年里,阿雷西博的数据导致了数百项发现。”“保护它,最重要的是,让全世界的研究人员和学生都可以使用它,无疑将有助于在未来几十年继续保留该设施的遗产。”随着现在先进的机器学习和人工智能工具的出现,在未来,这些数据为更多的发现和理解最近发现的物理现象提供了机会。”

NSF Vision.

自2018年以来,UCF一直领导管理阿雷西博天文台的财团,该天文台由美国国家科学基金会(NSF)拥有和资助。EPOC是印第安纳大学和能源科学网络(ESnet)之间的一个合作项目,由美国能源部科学办公室(SC)资助,由劳伦斯伯克利国家实验室管理。

阿雷西博数据移动团队

几个团队成员一起转移了阿雷西博的数据。(顺时针方向,从左到右)Nathaniel Mendoza (TACC), Ewa Deelman (CI CoE Pilot), Julio Alvarado (Arecibo Observatory), Hans Addleman (EPOC), Jason Zurawski (EPOC)。(资料来源:TACC, CI CoE Pilot, Arecibo Observatory, EPOC)。信贷:TACC

“国家科学基金会致力于支持阿雷西博天文台作为一个重要的科学、教育和文化中心,其中一部分将确保望远镜收集的大量数据继续推动发现,”国家科学基金会项目官员艾莉森·b·派克(Alison B. Peck)说。“我们很高兴地看到,这项合作不仅将安全地存储阿雷西博天文台的数据副本,而且还为当前和未来的天文学家提供了更高级别的访问。”

数据存储是Arecibo天文台的持续努力的一部分,以清理305米望远镜的900吨仪器平台和重新打开其余基础设施的碎片。NSF支持6月2021日的研讨会,专注于支持槟榔天文台未来的可行方式,为科学,教育和文化活动创造机会。

紧迫感

“阿雷西博天文台平台的崩溃无疑增加了我们团队的紧迫感,”阿雷西博大数据项目经理胡里奥·阿尔瓦拉多(Julio Alvarado)说。大数据团队已经在为他们的数据管理和云项目制定战略计划。这些计划必须得到优先考虑,并以前所未有的紧迫性和重要性予以执行。天文台的遗产依赖于存储在20世纪60年代的1700多个项目中的数据。

Alvarado的团队向UCF的研究办公室寻求帮助,该办公室将阿雷西博连接到两个国家科学基金会资助的网络基础设施项目,EPOC由印第安纳大学的首席研究员Jennifer Schopf和Dave Jent和ESnet的Jason Zurawski领导;以及由南加州大学的Ewa Deelman领导的网络基础设施卓越中心试点(CICoE Pilot)。

佛罗里达州中部大学指出,我们参与其中,他们在试图确定岛上的新数据存储位置时,他们正在挑战,并正在努力有效地移动该数据的需求,“科逊Zurawski,科学参与工程师说ESNET和EPOC项目的CO-PI。

数据迁移

EPOC的主要网络系统工程师Hans Addleman说:“如果效率不高的话,整个Arecibo数据集的迁移需要几个月甚至几年的时间,但如果有适当的硬件、软件和配置,只需要几周的时间。”EPOC团队提供了基础设施技能和资源,帮助Arecibo使用最新的研究工具和专业知识设计数据传输框架。ccoe试点团队正在帮助Arecibo评估他们的数据存储解决方案,并设计他们未来的数据管理和管理经验,以使Arecibo的数据更容易被科学界获取。

“阿雷西博是一个惊人的项目,它使天文学家、行星科学家和大气科学家能够在几十年的时间里收集和分析极有价值的科学数据,”研究主任Ewa Deelman说Founded in 1880, the University of Southern California is one of the world's leading private research universities. It is located in the heart of Los Angeles." class="glossaryLink ">南加州大学信息科学研究所,CI CoE试点项目负责人。

“CI Coe Pilot项目非常兴奋,与Arecibo,Epoc,Tacc和Globus成员一起工作,确保珍贵的数据保存并轻松找到,可访问,可互操作和可重复使用(公平)。最近,我们还向国际虚拟天文台联盟(IVOA)的成员们联系,特别是Bruce Berriman(Caltech / IPAC-NEXSCI,Ivoa执行委员会的副主席),以探索槟榔在国际社会中的数据作用。Deelman补充说,周围和Arecibo围绕和Areqibo组成的合作显示了NSF资助的项目如何放大,并对国际科学界产生影响。“

CI CoE Pilot提供了跨越Arecibo数据生命周期的许多领域的专业知识,包括数据归档(Angela Murillo,印第安纳大学)、身份管理(Josh Drake, IU)、语义技术(Chuck Vardeman,圣母大学)、可视化(Valerio Pascucci和Steve Petruzza,犹他大学)、工作流管理(Mats Rynge和Karan Vahi, USC)。CI CoE试点工作由Wendy Whitcup (USC)协调。

由于Arecibo有限的互联网连接,波多黎各大学和Engine-4(一个非营利性的共享空间和实验室)通过允许Arecibo共享他们的互联网基础设施,为数据传输过程做出了贡献。此外,数据不可替代的性质需要一种解决方案,既能保证数据完整性,又能最大限度地提高传输速度。这激发了Globus的使用,这是芝加哥大学开发和运营的一个研究数据管理平台。

转移

数据传输过程启动于1月2021年中期.ARECIBO的数据景观包括三个主要来源:硬盘中的数据;磁带库中的数据;和数据异地。存档在硬盘驱动器和两个胶带中的两个PB的数据上持有一个薄粘土。该数据包括来自数千个观察会话的信息,相当于观看120年的高清视频。

目前,数据正在从Arecibo硬盘驱动器传输到TACC的Ranch系统,该系统最近升级,以扩大其存储能力到一个exabyte,或1000pb。牧场升级结合了DDN SFA14K DCR块存储系统和Quantum Scalar i6000磁带库。

超过52,000名用户从宇宙中归档他们的所有科学方面的数据。牧场是美国国家科学基金会(NSF)资助的极端科学与工程发现环境(XSEDE)的分配资源。

Alvarado表示:“接下来的阶段将把Arecibo磁带库复制到硬盘驱动器,然后再复制到TACC,之后的阶段将把数据从场外位置复制到TACC。”

为了保持和保证科学界的连续性,阿雷西博的数据被复制到存储设备,然后被传送到位于马亚圭斯的波多黎各大学和引擎4设备上进行上传。这确保研究社区继续使用现有数据访问和执行研究。数据迁移是由Arun Venkataraman领导的Arecibo的IT部门协同执行的。

考虑到连接观测站的网络基础设施的时间限制和限制,速度、安全性和可靠性是有效移动数据的关键。

Globus服务满足了这些需求,同时还提供了一种监视传输和从任何瞬态错误中自动恢复的方法。这是必要的,以减少丢失或损坏的机会,有价值的数据收集的望远镜在50多年的服务。

Globus服务使UCF和ESNet团队每天安全可靠地移动12 tb的数据。芝加哥大学Globus执行董事Rachana Ananthakrishnan表示:“看到我们的服务在保存阿雷西博这样的著名天文台的遗产方面所产生的影响,真是令人欣慰。”

数据通过连接波多黎各大学和迈阿密的AMPATH Internet交换点传输。然后它使用第二代互联网和德克萨斯州的LEARN网络与奥斯汀的TACC联系。

阿雷西博的数据遗留

数据来自于阿雷西博1000英尺(305米)的固定球面射电/雷达望远镜。它的频率范围从50兆赫到11千兆赫。发射机包括用于行星研究的s波段(2380兆赫)雷达系统;大气科学研究用430兆赫雷达系统;以及电离层研究的加热设备。

过去的成就与arecibo制作的成就包括第一个曾经二进制的发现脉冲星,一个发现爱因斯坦的一般相对论的理论,并在1993年获得了诺贝尔奖;Venusian表面的第一个雷达图和汞上的极性冰;和太阳系外的第一行星。

阿尔瓦拉多强调说:“这些数据是无价的。阿雷西博的数据包括各种各样的天文、大气和行星观测数据,这些数据可以追溯到20世纪60年代,是无法复制的。

“虽然这些年来有些数据导致了重大发现,但仍有大量数据有待分析,很可能会产生更多发现。阿雷西博的计划是与TACC合作,为研究人员提供数据访问和必要的工具,以便轻松检索数据,继续在阿雷西博进行科学任务。”

阿雷西博的IT和大数据团队负责项目迁移阶段的数据,该阶段不允许公众访问。随着迁移和数据管理工作的进展,将向研究界提供这些数据。

ARECIBO,TACC,EPOC,Cicoe Pilot和Globus将继续在建设工具,流程和框架上工作,以支持对研究界的持续访问和分析数据。数据将暂时存储在Tacc,支持Arecibo提供对数据的开放访问的目标。Arecibo将继续与集团有关永久存储解决方案的设计和开发的组。

第一个发表评论阿雷西博射电望远镜去年12月坍塌,但其发现和创新的遗产仍在继续

发表评论

邮箱地址可选。如果提供,您的电子邮件将不会被公布或共享。