基础架构

AMD EPYC:用高性能照亮HPC

10月21日,2021 CCF HPC China(全国高性能计算学术年会)在珠海·横琴召开。大会由中国计算机学会主办,中国计算机学会高性能计算专业委员会、暨南大学、澳门大学、澳门科技大学承办,横琴粤澳深度合作区执行委员会、珠海市人民政府提供支持。此次大会由5大院士领衔,300+行业大咖演讲,共有40余场论坛活动,是国内高性能计算领域的一场盛会。作为每年最具权威的HPC盛会,大会在全球业界的含金量也在日渐提升。

CCF HPC China 2021此次通过11场特邀报告针对医学、科学计算、序列图算法、地球系统、数字孪生等众多前沿议题进行深度解读、探讨,在解读行业风向的同时,更多地让行业参与者、研究院和企业们在技术更新和实践开拓等多领域进行更深入的结合。众多专家、院士通过多种思路相结合,对未来高性能计算领域的发展指出了多项国际化领先的发展方向。

AMD EPYC助力高性能计算发展

AMD EPYC:用高性能照亮HPC

在大会主论坛上,AMD全球副总裁、中国区企业与商用事业部总经理刘宏兵发表了“芯驭智能 共创未来”的主题演讲。

谈到EPYC,大家首先想到的就是:7nm工艺制程、64颗核心,它有着什么样的意义呢?

让我们先忘掉数字,来看看CPU的发展。过去几年,CPU在性能方面不断地提升,但功耗也随之快速增长。处理器动辄几百瓦的功耗给数据中心带来了巨大压力,当前我们还面临着能源成本上升、限电等问题,导致一部分数据中心不能全功率开放,这些能耗与散热挑战成为了数字化发展的绊脚石。

刘宏兵表示,在7nm工艺的加持下,64核心超强算力仅需280瓦的能耗,可以说与我国建设绿色数据中心的政策相辅相成。AMD EPYC发展至今,小芯片技术也逐渐被用户所认可,因为他们可以真正享受到更多的核心与性价比。

EPYC和它优秀的小芯片设计

其实一直以来,小芯片设计都是AMD EPYC系列处理器的一大独有特征,它的灵活性很高,并且更容易将核心做多。通过CCX单元模块,可以将核心进行各种组合,一般情况下每8颗核心组成一组CCX单元。最新的“Zen 3”架构更是让每组8核心共享高达32MB的L3缓存,在L3晶体管数量不增加的情况下,让每颗核心在大多数情况下都可以使用更多的L3缓存空间。

此外,同一CCX中的8颗处理器核心可以任意调用L3缓存数据,减少了通过IO间接调取的延迟,进一步提升了性能。

AMD EPYC:用高性能照亮HPC

IO性能,HPC挑战极限的关键

在高性能计算方面,不得不提IO性能。AMD EPYC的128条PCIe 4.0通道可以说是给高性能计算插上了翅膀。

AMD早在上一代产品中就开始提供128条PCIe 4.0通道,数量及技术在当时创造了记录,也构建出了最强大的商用处理器。PCIe 4.0能够提供2倍的PCIe 3.0性能,总带宽高达128GB/s,双向可达256GB/s。

AMD EPYC:用高性能照亮HPC

128条PCIe 4.0通道可以让EPYC服务器连接更多更强的GPU加速卡或者NVMe设备。从实际测试来看,在3DMark的PCIe功能测试中,PCIe4.0比3.0性能提升了70%,CDM硬盘性能也提升了35%到50%,优势非常明显。

将这一优势带到高性能计算中,所实现的效果则非常惊人。

AMD在全球有很多高性能计算客户,在全球高性能计算机排行榜100强中有28台是AMD的系统。

今天的AMD是一家既做CPU又做GPU的公司。在混合异构大行其道的今天,能不能在GPU和GPU之间通讯的时候实现无障碍的统一内存地址访问呢?

随着技术的不断进步,CPU和GPU之间统一地址访问已经不再是幻想。AMD与美国能源部共同打造的新超算系统,就是基于AMD EPYC(霄龙)处理器和AMD Radeon Instinct计算卡,它们之间的通信实现了统一地址访问,计算能力超过百亿亿次的超级计算机Frontier将于今年完成,双A组合下的Frontier预期峰值处理能力将达到150亿亿次FLOPS,意味着其相当于今天世界上全部超算前50名的计算能力总和。

AMD EPYC:用高性能照亮HPC

芯片3D化,为处理器注入更多缓存

那么,在晶体管数量大爆发的今天,AMD还有什么秘密武器呢?刘宏兵表示,全新的芯片堆叠封装技术3D Chiplet,能够在有限的空间内,“堆放”更多的电路、晶体管元件。

顾名思义,3D Chiplet技术是将芯片进行堆叠,从而减少所占用空间,首先应用的是处理器中的“3D垂直缓存”(3D Vertical Cache)。

“Zen 3”架构中,多颗芯片组成了CCD单元模组,单元内部具备共享的32MB容量L3缓存。3D V-Cache的意义在于能够赋予单元模组更多缓存容量,从而提升产品性能。

AMD EPYC:用高性能照亮HPC

AMD曾在Computex 2021展示了锐龙9 5900X的原型设计,3D V-Cache在其顶部3D封装了另一个64MB的“新”缓存,这样使得每个CCD的L3缓存达到96MB,整个锐龙9 5900X的L3缓存总量达到了192MB。

与现有的封装解决方案相比,3D V-Cache可提供超过200倍的2D芯片互连密度,整体效率大幅提升。通过与台积电(TSMC)紧密协作,与目前的3D解决方案相比,这项行业前沿的技术能耗更低,并且应用更加灵活。

AMD EPYC:用高性能照亮HPC

源源不断的工艺升级和架构创新是推动AMD EPYC处理器高速发展的关键。据了解,AMD EPYC处理器在短短两年的时间里,已经拥有超过200项的性能世界纪录,其中有80项是专门的HPC的世界纪录,还涵盖云计算、企业级等工作负载及应用。


正如刘宏兵演讲所说,AMD EPYC以创新的高性能处理技术重新回到企业级市场,相信与HPC应用、生产系统的深度结合,能够将高性能计算应用提升至新的领域、新的层级。

(8)

本文由 计算杂谈 作者:云中子 发表,转载请注明来源!

关键词:
LensNews

热评文章

发表评论