2025-04-30 07:10来源:本站
在计算科学的突破性发展中,一个由国家核安全局(NNSA)三实验室研究人员组成的团队,利用世界上最大的计算机芯片——大脑晶圆级引擎(WSE),推出了一种革命性的分子动力学(MD)模拟方法。
来自劳伦斯利弗莫尔国家实验室(LLNL)、洛斯阿拉莫斯国家实验室(LANL)、桑迪亚国家实验室和Cerebras系统公司的团队在第二代Cerebras WSE-2上运行,这是一种拥有85万个核的尖端处理器,证明了该芯片可以以以前认为无法实现的速度执行涉及数十万原子的复杂模拟。正如最近的一篇论文所描述的那样,该团队实现的模拟时间步长比其他百亿次系统(如橡树岭国家实验室的Frontier)的速度快450倍以上。该作品入围了2024年计算机协会(ACM)戈登贝尔奖,这是超级计算领域的最高荣誉。
分子动力学模拟对于理解材料在原子水平上的行为,推动材料科学、生物物理学和药物设计等领域的进步至关重要。研究人员说,核安全局实验室对MD模拟特别感兴趣,在那里,当实验过于昂贵或无法达到相关条件(如温度、压力、时间和长度)时,它们对于探索材料的行为是必不可少的。
传统的超级计算机一直在努力应对大规模模拟所需的长时间运行,通常需要数周或数月才能完成。但与依赖分布式存储系统的传统超级计算机不同,WSE是一个单片处理器,由一块硅片构成。这种独特的设计允许其数十万个核心并行运行,从而以显着的效率模拟大型原子系统。
通过将处理器核心专用于每个模拟原子,与目前领先的基于gpu的百亿亿次平台Frontier相比,WSE-2实现了每秒时间步长的457倍的惊人改进。在他们的测试中,该团队在涉及80万个钽原子的问题上实现了每秒超过699,000个时间步的模拟速率,为通用处理核心和分子动力学领域的可能性设定了新的标准。
“Cerebras系统的美妙之处在于,因为它是一个通用处理器,它不是专门针对特定算法的,所以你可以将它用于所有不同类型的HPC模拟,”LLNL的合著者、计算机科学家埃德加·莱昂(Edgar Leon)说。“就目前世界领先的超级计算机所能做的事情而言,我们通过分子动力学模拟获得的数字打破了纪录。”
开拓材料科学的新领域
该团队的研究结果表明,在当今最强大的超级计算机上需要数月或数年才能完成的MD模拟可以在几天内完成,使科学家能够以惊人的效率和准确性探索原子相互作用。例如,该团队展示了WSE可以在一天内模拟300微秒的原子相互作用,这一壮举可能会影响未来的材料设计,并为材料科学和其他原子级挑战(如药物设计和复杂的生物过程)开辟新的途径。
“在许多类型的模拟中,包括MD,通过反复预测未来短时间内的位置或值,并使用预测值将模拟时间提前一个小的时间步来取得进展,”合著者Tomas Opplestrup解释说,他曾是LLNL的计算机科学家,现在在Cerebras工作。“看到每秒数千步的速度是不寻常的,而在这里我们实现了数十万步。”
Oppelstrup解释说,虽然专门设计用于生物系统分子动力学的计算机已经达到了每秒近一百万步的速度,“我们已经在更普遍的可编程计算机上实现了接近相同的速度,这表明这种速度可以在材料科学甚至分子动力学以外的其他类型的模拟中实现。”
有了模拟和探测时间尺度比以前延长两到三个数量级的能力,研究人员可以开始探索以前在现有超级计算机上无法达到的现象。对复杂系统进行高保真模拟的能力可以加速各个领域的发现,包括药物设计和生物物理学,在这些领域,在原子水平上理解蛋白质折叠和相互作用可以在开发新的疾病疗法方面取得突破。根据Leon的说法,对极端条件下材料行为的更好理解也可能导致开发更先进、更可靠的材料,用于更高效的能源系统,如聚变反应堆。
“有了这种能力,你实际上可以从纳秒的时间移动到微秒甚至毫秒的时间,以试图理解材料模拟中的特定过程,”莱昂说。“改变游戏规则”。
这项工作是在NNSA高级模拟和计算(ASC)计划的高级存储技术(AMT)项目下进行的,该项目旨在通过行业参与维持后百亿亿次世界的技术研究和开发势头。AMT项目的目标是在未来五年内将NNSA应用程序的性能提高40倍以上。分子动力学就是其中之一,也是第一个拥有完整代码的应用程序,可以进行性能测量和发布,这就是为什么我们首先选择分子动力学作为研究对象。
根据该论文,与传统平台相比,WSE的架构还可以提高能源效率,实现一到两个数量级的性能提升。研究人员说,随着科学界越来越多地寻求应对气候变化和能源生产等全球挑战的可持续解决方案,这种效率至关重要。
Oppelstrup和其他团队成员将他们在WSE-2上的结果描述为“令人兴奋”,但他们警告说,这并不意味着该芯片总体上比Frontier等e级系统更快,但对于某些只需要一个芯片的小问题,它们可能是首选路线。
Oppelstrup说:“今天的百亿亿次计算机,如Frontier或LLNL的El Capitan,其总体性能仍然远远高于单个甚至多个大脑计算机。”“Cerebras硬件在需要许多时间步长或迭代的应用中很有亮点,而当前的机器无法达到所需的时间尺度。除了将应用程序移植到这种新硬件上,Cerebras的机器还可以在为当前的超级计算机增加更多的机器学习能力方面发挥重要作用。”
超越摩尔定律的生命
随着MD代码的进一步开发和NNSA三实验室/Cerebras合作的继续,Oppelstrup表示,他预计将有更多的任务应用程序移植到Cerebras架构上,并带来非凡的速度提升。该团队还期望扩展当前的工作,包括详细和精确的原子相互作用模型,并将MD模拟与机器学习相结合,这也是WSE擅长的。这种适应性可以为更复杂的模拟打开大门,进一步增强对复杂材料和生物系统的理解。
LLNL的Leon表示,该团队希望继续探索WSE架构的前景,对其进行编程,以运行其他类型的模拟,如蒙特卡罗或流体动力学模拟,这将需要对芯片进行额外的编程。
他补充说,在未来,超级计算系统可能会定期与不同类型的加速器或节点相连,而像Cerebras WSE这样的新架构可能会以更快的速度提高某些问题的性能。研究人员在论文中表示,成功扩展到设施级机器部署也可能导致“世界上最快的超级计算机500强榜单发生比GPU革命带来的更大的范式转变”。
Leon说,作为一种新型的计算系统,开发工具仍然需要成熟,并且需要更多的优化来实现高效和准确的模拟代码,这需要计算机科学家、计算机体系结构专家和算法专家的共同努力。
“随着摩尔定律的放缓,你不会再看到比百亿亿次的性能提高1000倍了。但如果我们想要任何有意义的改进,比如40倍的规模,我们将着眼于像Cerebras这样的架构,它已经证明了这一点的潜力,”莱昂说。“有很多挑战需要解决,但这篇论文表明,我们可以迅速实现这一目标。它不会是1000倍,但对于某些工作负载来说,100倍是可以实现的。随着桑迪亚国家实验室、洛斯阿拉莫斯国家实验室、利弗莫尔国家实验室和大脑公司共同努力实现这一崇高目标,我认为我们可以很快实现这一目标。”
戈登·贝尔奖每年由美国计算机协会(ACM)赞助,旨在表彰在高性能计算领域取得的杰出成就。获奖者将于11月21日在亚特兰大举行的2024年超级计算大会(SC24)上宣布,这是高性能计算的主要会议。