现在“玩”工程设计,与之前可是大不相同,因为在软、硬件全面升级的加持下,工程师可以设计出比以往更为复杂的模型。将CAD对象转换为网格会创建出具有数百万个自由度的模型,这意味着必须解决数百万个方程。这种类型的模拟,即工程计算,很容易产生庞大的计算任务,因此若想快速解决这些问题则需要拥有更高算力的GPU才行。
近年来,由于算力需求持续旺盛,GPU的发展速度也随之逐步加快。在这种情况下,GPU扛起了大旗,也同时呈现出了两大趋势,即:更高的算力和更大的图形内存。
工程设计领域发展趋势一,GPU高算力扛起大型工程
随着设计和模型变得越来越复杂,分析它们所需的时间也在增加。为了加速模拟过程,传统的做法是将大问题分解为多个小问题,然后分配给多个CPU核心进行处理。这种方法被广泛应用于航空航天、汽车和电子等行业。
近年来,GPU加速技术的普及使得台式计算机也能处理复杂工程模型,这大大提高了问题解决的效率,例如:NVIDIA® RTX™ 6000 Ada Generation GPU单精度性能达到了91.1 Teraflops(TFLOPS),RT(Ray Tracing光线追踪)核心性能为210.6 Teraflops,相比几年前的GPU,计算性能有了最高数十倍的提升。
工程设计领域发展趋势二,GPU更大容量内存可应对大规模模拟
在工业工程应用中,模拟可能涉及上千万个单元,在这一过程中需要占用大量内存(图形内存)空间,内存大小会直接影响到模拟的规模。新一代的GPU充分考虑到了这些因素,为高端型号GPU配备了更大容量内存,例如,新的NVIDIA® RTX™ 6000 Ada Generation GPU拥有48GB内存,可以运行更为复杂的模拟,并带来了比上一代产品快1.5到2倍的性能提升。
新一代高性能GPU,极大缩短工程设计模拟时间
Ozen Engineering是一家专注于为电子、半导体、生物医学、医疗保健、航空航天和汽车等行业提供Ansys解决方案的专业工程模拟公司。通过部署配备NVIDIA® RTX™ 6000 Ada的戴尔Precision工作站,使其工作效率大幅提升,基于此他们还展示了很多工程设计方面的应用案例,令人兴奋。
以空气动力学阻力模拟为例,其对算力要求非常高,传统工作站通过CPU计算基本无法满足需求。而现在,使用配备GPU的桌面工作站,可以在不到几分钟内完成整个阻力预测模型,这显示了GPU与32个CPU核心相比的巨大优势。演示中Ozen公司使用的NVIDIA® RTX™ 6000 Ada GPU轻松处理了需要30GB内存的模拟。
Ozen工程师表示:通过戴尔Precision和NVIDIA提供的桌面工作站的能力,可以轻松完成复杂的工程设计与模拟,并将模拟时间从几小时缩短到几分钟。
在Ozen的另一个在线演示中,展示了GPU加速如何提高Ansys Lumerical光子学模拟解决方案的性能。通过使用NVIDIA® RTX™ 6000 Ada Generation GPU,模拟时间从使用CPU的约45分钟缩短到使用GPU的不到8分钟,速度提升了大约6倍。
图片由Ansys和NVIDIA提供
最初,GPU计算仅仅是简单地将计算任务从CPU转移到GPU上。而现在,随着原生GPU求解器(例如Ansys 2023R2)的出现,计算速度得到了显著提升。据Ozen提供数据显示,在Ansys 2023R2应用中,使用GPU进行计算的速度比8核CPU快了13倍。
图片由Ansys和NVIDIA提供
GPU还可以应用于多种工程模拟,包括粒子动力学、光学、光子学和电磁分析等领域。如今,GPU模拟已经成为大多数模拟开发团队关注的重点,因为GPU所配备的内存容量越来越高,使我们能够在工作站级别的GPU上处理真正的工业级问题了。
Ozen工程师表示:毫不夸张地说,我们的团队运行这个CFD(计算流体动力学)模型所需的时间甚至不到喝一杯咖啡的时间。对于所有从事模拟工作的工程师来说,工作站生产力的提升让我们所有人都感到非常满意和激动。
戴尔Precision 7960塔式工作站,4颗顶级GPU加持
上文中Ozen公司提到的工作站就是:戴尔Precision 7960塔式工作站,可搭载4颗高端GPU!
戴尔Precision 7960塔式工作站是一款性能强劲的设备,它搭载了英特尔®至强®56核处理器。该工作站设计了非常宽敞的机箱,能够在内部轻松安装多达4个NVIDIA® RTX™ 6000 Ada Generation GPU。这为用户提供了极大的灵活性,可以满足计算流体动力学(CAE)工作流程、渲染和可视化等高要求任务,释放强大的计算性能。
尔Precision 7960塔式工作站所搭配的NVIDIA® RTX™ 6000 Ada是一款基于NVIDIA Ada Lovelace架构的高端工作站GPU,支持最高48GB的ECC图形内存。配备了142个最新一代RT Core核心、568个Tensor Core核心和18176个CUDA® Core核心,这些核心共同工作,提供强大的计算性能和高效的AI图形处理能力。与上代架构的RTX™ A6000相比,RTX™ 6000 Ada在单精度浮点运算、RT Core性能、Tensor性能等方面均有显著提升。这也是戴尔Precision 7960塔式工作站选择它的重要原因。
前文我们也提到了GPU对于工程设计领域的重要性,而搭载一个或多个NVIDIA® RTX™ 6000 Ada GPU的戴尔Precision 7960塔式工作站则将GPU算力发挥至极,堪称顶级工作站的典范,给设计师们构建出了一个强大的本地处理平台。它能够高效地处理各种复杂的设计模型和数据集,并且支持设计师探索拥有更多细节的模型。跨时代的GPU算力,更有助于推动整个工程设计领域迈向新的纪元。
如果你也在关注工程设计领域,那么不妨体验一下这款拥有4颗GPU的戴尔Precision 7960塔式工作站“大杀器”!
来来来,我们在CAD构建的“虚拟世界”中等你。
本文由 计算杂谈 作者:云中子 发表,转载请注明来源!