基础架构

从病毒基因测序到原子能开发,忙碌在一线的超算们

面对北京突如其来的疫情,6月12日,中国疾控中心迅速新增启动病毒病所南区P3实验室,24小时不间断开展核酸检测工作,并完成样本检测1000余份。6月13日,完成相关病例样本病毒全基因组序列测定和分析,初步结论已上报并已开始进行病毒溯源。

如此快的反应堪称神速,而仅用一天左右时间完成病毒基因测序与分析也着实令人称奇。要知道,在上个世纪90年代,集全球各国之力对人类进行基因排序用了10年之久!当然,这都受制于当时超级计算机的性能。

而现在呢?在当前的高性能计算机支持下,做一套基因排序仅需几个小时,成本也降至了千元级别。

从病毒基因测序到原子能开发,忙碌在一线的超算们

在医疗相关领域,高性能计算一直都是精准医疗所需的关键性的技术。要知道,基因测序是精准医疗的前置技术,而目前基因组测序非常依赖于高性能计算,它直接影响着基因数据的测序精度和测序效率。

举例来讲,一个人的完整基因序列需要由数十万的基因片段拼接而成,由于数据量非常庞大,拼接结果的准确性、速度等数据都必须借助高性能计算来完成。此外,基因数据的比对、分析从而确诊以及新药研发等等,也都离不开高性能计算的支撑。

科技领域的加速器:超级计算机

在诸多应用领域,超级计算机早已成为高效率的代名词,并且极大推动了科学技术的发展。2019年,代号“Rome”的EPYC处理器问世,高性能计算迈入了一个新的台阶。

从病毒基因测序到原子能开发,忙碌在一线的超算们

这一代产品,将AMD新架构的优势发挥得淋漓尽致,无论是7nm工艺、64颗核心、单核与整体性能还是多核心及PCIE 4.0等新技术,都力压竞争对手一筹。

与往届AMD的推新不同,这次EPYC的朋友圈阵营也非常强大。诸多服务器厂商迅速跟进,从腾讯云到亚马逊的云平台领导者们也纷纷捧场,EPYC凭借更高的性价比为云厂商与企业级客户提供了更佳的解决方案。

2019年11月18日,由国际超级计算大会(SC)公布的新一期全球超级计算机500强榜单出炉,AMD EPYC霄龙处理器首次上榜。

这也就意味着,在传统企业级、云平台等应用之外,高性能计算领域再次迎来了AMD EPYC。而上一次入驻高性能计算平台,则还是皓龙时代。

时过境迁,与上几代产品的竞争力相比,代号“Rome”的EPYC处理器在性能方面已经全面超越竞品,并且迅速获得超级计算机用户们的青睐。

128线程EPYC,搞定海量基因测序

其实很多企业级用户对于代号“Rome”的EPYC处理器最直观印象就是:业界独有的64核心128线程!对于HPC方面应用而言,它所带来的改变简直就是翻天覆地。包括上文所提到的基因测序。

俄勒冈州立大学基因组研究和生物计算中心(CGRB)每天都会有20000个工作任务需要执行,生成大量的文件,每个文件包含5000万个与基因组对齐的序列。

一直以来,他们都在寻找能够超过100线程的处理器以供CGRB部署,但市场中绝大部分能够符合要求的产品价格不菲,对于高校来说成本难以承受。在对比了很多产品之后,俄勒冈州立大学选择了64核心128线程的AMD EPYC处理器。通过增加多台基于AMD EPYC的强大机器,以获得更高的线程数和更低的总运营成本。

“我的一些小组在24核、48线程的至强服务器上运行程序出现了崩溃现象。现在,他们正在把其中的三个移到一个AMD EPYC 7601处理器上。”谈到实战,CGRB负责人Sullivan这样认为。

凭借EPYC处理器的高密度、多线程特性,通过部分机器的更新就可以实现需要的计算线程数,从而快速的完成任务,并且不用考虑如何升级机房的难题了。

全球第一的超算,由EPYC打造

提起劳伦斯·利弗莫尔国家实验室(LLNL),相信大家都不会陌生。它隶属于美国能源部,主攻物理学、气候变化、能源和生物医学。是国家核安全局(NASA)核武器“库存管理计划”中的三个实验室之一,其中高级模拟和计算(ASC)计划是其中的关键组成部分。在ASC计划下,LLNL的科学家和工程师使用模型和方法研究材料科学,流体力学和高能量密度物理学。

劳伦斯·利弗莫尔国家实验室的Sierra超级计算机目前全球排名第二。而他们目前正在部署新的HPC集群,名为Corona,基于AMD EPYC CPU和Radeon Instinct MI25 GPU构建的。在LLNL最大的超级计算机上运行的仿真需要100 petaFLOPS的速度,未来它将成为世界上最快的超级计算机。

Corona HPC群集由AMD EPYC CPU驱动,170个节点实现最高峰值为383 teraFLOPS浮点性能,下一步还将扩展到400个节点。其中每个节点都包含一组带有2颗EPYC 7401处理器,256GB RAM和一个1.6TB固态驱动器(SSD)。一半的节点还配备了四个AMD Radeon Instinct MI25 GPU。

该计算平台是Penguin Computing的XO1114GT平台,其节点通过Mellanox HDR InfiniBand网络技术连接。

如此强大的系统,LLNL会拿它来做什么呢?

据了解,科学家们会结合仿真与机器学习,解决当前面临最具挑战的科学难题。他们更期望有强大的单核计算及混合计算能力,因此也配备了GPU加速器。

从病毒基因测序到原子能开发,忙碌在一线的超算们

基于EPYC处理器的Corona集群将帮助LLNL使用机器学习,通过一种称为Cognitive Simulation的主动学习方法,更有效地进行模拟。该方法可用于优化解决方案并显着减少计算需求。多物理场模拟是实验室中最复杂的模拟,其中包括大量的模拟和计算,这些模拟和计算围绕着对NNSA至关重要的流体动力和材料问题。

通过基于EPYC的服务器与Radeon Instinct MI25配合使用来进行机器学习,LLNL将能够准确确定要进一步探索的位置,从而检测出导致大多数误差线的要素是什么,并显着减少了完成任务所需的时间,以更准确、更高效的方式进行科研。

不安分的AMD,还在“强攻”新领域

“不安分的心跳,全世界都听到”这句歌词对2020年的AMD来说非常“应景”。EPYC这次可真没那么安分,4月份,迅速推出了三大系列高频产品,主攻HPC、超融合、云计算和数据库!

从病毒基因测序到原子能开发,忙碌在一线的超算们

全新的7Fx2系列分为:7F32、7F52和7F72。其中7F32为8核心处理器,功耗仅为180W,最高主频3.9GHz,相比现款7262/7252产品主频更高,性价比进一步提升。

7F52更高端一些,拥有16颗物理核心,比现款7302的3.0GHz和7282的2.8GHz主频要高很多,最高可以达到3.9GHz。

7F72是此次发布的最高端产品,它比现款的7402/2.8GHz和7352/2.3GHz处理器主频高出一个级别,最高达到了3.9GHz,并且拥有24颗核心。

2020年的AMD EPYC面向细分领域推出的这三大系列处理器,特点嘛,也非常明显:保持高主频、将每核心成本进一步降低并且拓宽了应用范围。顺势切入了包括超融合、裸金属、高性能计算、数据库应用和刀片服务器等市场。

过去已过去。未来,才是值得一谈之事。

——《权力的游戏》

面对未来,有太多的不确定因素,而生物、物理、化学、能源等领域也迫切需要更高性能的超级计算机来辅助进行科研。几年前笔者曾经采访过清华大学的一位导师,他的团队获得了当年大学生超级计算机竞赛冠军。

当时笔者的提问是:当前的超级计算机性能已经有了突飞猛进的发展,未来真的还需要更高性能的机器吗?

导师回答:在很多科研领域都对计算有着“源源不断”的需求,比如生物系对于蛋白质结构进行研究,有了更快的超级计算机就可以在制样过程中进行三维结构重建;并且还在研究各种分子与蛋白质相结合的能量释放情况,整个过程都需要HPC的算力全程进行支持。随便一项科研就能轻松“跑满”最顶级的超算!所以在很多研发领域,并没有计算力过剩之说。

纵观整个行业,超级计算机已经成为了当之无愧的“栋梁”!

2020年的新冠疫情席卷全球,各个国家纷纷加强生物医药方面研发,从基因测序到疫苗的研发都离不开超级计算机的帮助,这背后的英雄则是处理器、GPU厂商们。

(0)

本文由 计算杂谈 作者:云中子 发表,转载请注明来源!

关键词:, , ,
LensNews

热评文章

发表评论