您现在的位置是:首页 >生活 > 2020-10-28 08:53:13 来源:
粒子物理学中用于大数据的固态技术
在CERN的大型强子对撞机中,在CMS粒子探测器超过8000万个探测通道的一秒钟之内,发生了多达4000万个粒子碰撞。这些冲突即使在计算机将其传送给最有意义的数据之后,仍会产生巨大的数字足迹。检索信息的简单动作可能意味着应对瓶颈。
存储大量LHC数据的美国能源部费米国家加速器实验室的CMS物理学家现在正在尝试使用NVMe或非易失性存储表达固态技术,以确定何时访问存储文件的最佳方法。科学家需要检索它们进行分析。
太字节的麻烦
欧洲核子研究中心(CMS)的CMS实验结果有可能帮助解答物理学中一些最大的开放性问题,例如,为什么宇宙中物质多于反物质,以及物理量是否超过三个。
但是,在科学家们回答这些问题之前,他们需要访问由CMS检测器记录的碰撞数据,其中大部分是在费米实验室制造的。数据访问绝非易事。如果不进行在线数据修剪,LHC每秒将产生40 TB的数据,足以填充80台普通笔记本电脑的硬盘。自动选择过程仅保留重要的,有趣的碰撞,将已保存事件的数量从每秒4000万个减少到仅1000个。
费米实验室的科学家Bo Jayatilaka表示:“我们只关注这些碰撞的一小部分,因此我们有一系列选择标准,这些选择标准可以实时确定哪些碰撞要保留,哪些碰撞可以实时丢弃。”
即使进行选择性修剪,每年仅来自CMS检测器的数万兆字节的数据也必须存储。不仅如此,而且为了确保不会丢失或破坏任何信息,必须保存每个文件的两个副本。一份副本完整存储在CERN,而另一份副本则分布在世界各地的合作机构之间。Fermilab是美国用于CMS实验的主要指定存储设备,大约40%的实验数据文件存储在磁带上。
固态解决方案
费米实验室的费曼计算中心提供了三个大型数据库,其中装有成排的磁带,用于存储费米实验室自己的实验以及CMS的数据。如果您要合并费米实验室的所有磁带存储容量,则大约可以存储相当于13,000年的高清电视画面。
Jayatilaka说:“我们的机架上装有服务器,这些服务器上都装有硬盘驱动器,它们是科学家实际上在读写数据的主要存储介质。”
但是,硬盘驱动器(在过去的60年中一直用作计算机的存储设备)在给定时间内可以加载到应用程序中的数据量有限。这是因为它们通过从旋转磁盘中检索数据来加载数据,这是该信息的唯一访问点。科学家们正在研究实施新型技术的方法,以帮助加快这一过程。
为此,费米实验室最近在其Feynman计算中心安装了一个装有固态NVMe驱动器的服务器机架,以加快粒子物理分析的速度。