随着信息技术的高速发展,互联网、大数据、AI等新兴技术的应用日益广泛,数据中心作为信息存储和处理的核心设施,其规模和计算能力不断扩大。然而,伴随着数据中心的快速发展,能源消耗和散热问题也日益凸显,给环境和资源带来了不小的压力。在这种背景下,采用冷却技术成为了缓解数据中心能源消耗和散热问题的必然选择。
为什么要液冷
芯片热功率已达到风冷极限:芯片热功率已经达到了风冷处理的极限——350W~400W。由于液体的导热能力是空气的25倍,液冷在散热效率方面远高于风冷。
节能低噪:风冷技术需要消耗大量电能来驱动风扇以维持空气流动,从而产生较高的能源消耗,同时会制造较大的噪音。相比之下,在同等散热水平下,液冷系统比风冷系统节电30%,噪音低10~15分贝。
设备密度:液冷技术可以有效地将热量从设备中导出,降低设备温度,从而使得设备可以在更紧凑的空间内安装。这有助于提高数据中心的设备密度,实现空间资源的高效利用。
此外,相对风冷系统,液冷系统还在系统可靠性、精确温控、维护成本、可扩展性、创新潜力以及利用环境等方面也具有优势。
以上是在技术层面上的分析,而在政策层面上,我国也对数据中心能源利用效率(PUE)指标提出了更高的、仅靠风冷技术很难满足的要求,越来越需要采用液冷技术来优化冷却系统。
PUE(Power Usage Effectiveness,能源利用效率)是一种用于衡量数据中心能源效率的指标。它通过比较数据中心消耗的总能源和实际用于运行IT设备的能源来计算。
PUE计算公式为:PUE = 数据中心总能耗 / IT设备能耗
理想情况下,PUE值越接近1,表示数据中心的能源效率越高,意味着绝大部分消耗的能源都用于运行IT设备,而非其他基础设施,如冷却系统和照明等。而在实际应用中,PUE值通常大于1,因为数据中心设施需要消耗一定的能源来维持正常运行。PUE值越高,表示制冷、供电等基础设备耗能越大。近日,国家有关部门发布《绿色数据中心政府采购需求标准(试行)》的通知,要求采购人采购数据中心相关设备、运维服务时,按照《需求标准》实施相关采购活动,即:从2023年6月起数据中心PUE不高于1.4,2025年起数据中心PUE不高于1.3。
就这样,在政策的驱动、技术的演进和市场规模化需求的拉动下,“液冷时代”正式到来了。
几种典型液冷技术及代表性上市公司
液冷技术作为“PUE之问”的最佳答案,一般采取冷板式、浸没式和喷淋式等技术方式。
冷板式液冷:通过将冷却液流经与设备直接接触的金属冷板,从而将热量传导到冷却液中。这种方法的优点包括安装简便、体积小巧,散热效率较高,对现有服务器芯片组件及附属部件改动量较小,可操作性更强,目前成熟度最高、应用最广泛。然而,冷板式液冷的缺点在于需要定期维护,以确保冷却液流通畅,且可能需要针对不同设备定制冷板,使得成本升高。目前采用冷板式液冷技术的代表性上市公司主要有浪潮信息、中科曙光、英维克、高澜股份、申菱环境等。
浸没式液冷:通过将设备完全浸入非导电冷却液中进行散热。这种方法的优点是可以实现全面散热,适用于高功率密度设备,且具有较低的噪音水平。然而,浸没式液冷的缺点在于安装和维护相对复杂,需要考虑设备的防水性能,以及冷却液的清洁和替换。采用浸没式液冷技术的代表性上市公司有中科曙光、依米康、英维克、高澜股份、申菱环境等。
喷淋式液冷:通过在设备表面喷洒冷却液进行散热。这种方法的优点是安装简单,且可根据设备的实际热量分布进行定向冷却。然而,喷淋式液冷的缺点在于冷却效果可能受到空气流动的影响,且可能导致冷却液的浪费。采用喷淋式液冷技术的代表性上市公司有中国长城,其曾推出我国首台国产化喷淋式液冷服务器。
独树一帜的联想温水水冷技术
不同于上述的几种“主流”液冷技术,在数据中心行业深耕多年的联想集团,早在 2012 年即已开发出在业内独树一帜的温水水冷技术。
为什么会采用温水水冷技术
采用温水的水冷技术乍一听上去很反常识,难道不应该是水越冷,冷却的效果就越好吗?
其实,冷却的效果只是一个维度的考量。在数据中心的能耗结构中,制冷系统的能耗仅次于信息设备能耗,如何降低数据中心的制冷能耗,是降低PUE的关键。因此,如果仅仅是简单地采用冷液冷却,那么冷却的效果可能还不错,但付出的代价——能耗,可能会很大,而联想的温水水冷技术则是以尽量小的能耗去取得满意的冷却效果为目标。
联想的温水水冷技术优势
首先,它采用了直接温水冷却(DWC)+液体辅助空气冷却+后门热交换器(PDHX)的独家技术,可以将数据中心的PUE值降到1.1以下,大大降低了能源消耗。
其次,温水冷却技术消除了冷水冷却所需的大部分结构空间,节约了宝贵的空间资源。
第三,温水冷技术的液冷介质是水,不仅成本低,同时也避免了氟化液制冷的有毒问题,省却了浸没式液冷采用单相矿物油制冷的后期运维麻烦和高成本问题;再有就是水的二次利用,比如用来供暖等等,如果在冬季,可以利用余热为楼宇供暖,进一步节省其他能耗。
此外,联想温水水冷技术采用了独特可靠的快速断开连接器和枢轴管道,不仅提高了系统的安全性和可靠性,也降低了运维成本。
联想的温水水冷技术创新点
联想的温水水冷技术的实现来源于硬件设计、冷却系统和软件优化等多方面的创新。
首先,联想在设计服务器的硬件结构时,采用了独特的“分体式”散热设计,将散热器从处理器和显卡上拆分出来,使得温水可以更快速地流过热源,并有效地带走热量,从而提高了散热效率。
其次,联想采用了多级水冷系统,包括预冷系统、主冷系统和备用冷系统,以保证温水的温度稳定和均衡。再辅以温度控制系统和流量控制系统等智能化控制系统,来调节温水的温度和流量,从而保证了系统的冷却效果和稳定性。
此外,联想开发了能耗管理系统和电源管理系统等创新性的软件技术,配合水冷技术一起调节服务器的功耗和性能,从而进一步提高了服务器的能效、性能和可靠性。
联想温水水冷技术的应用
经过十余年不断优化升级,联想最新推出了第五代海神温水水冷技术。以联想SR670-V2服务器为例,每四组GPU芯片,配备一套第五代联想海神温水冷却系统,可去除服务器产生的90%以上的热量,将服务器和数据中心全面运行的总功耗可降低多达40%。
联想集团为北京大学打造的“温水水冷”高性能计算平台“未名一号”,PUE值为1.08,降低了50%的制冷散热成本,每年为北京大学节省60万度电。
目前,联想温水水冷技术已连续多年入选工业和信息化部编制的《国家绿色数据中心先进适用技术产品名录》,成为我国推广高效节能技术的卓越实践与行业标杆。联想高性能计算已在全球范围内部署超过5万个温水液冷节点。在中国、马来西亚、美国、奥地利、德国、瑞典、荷兰等地打造了新一代绿色智能算力基础设施。可以说,凭借独树一帜的液冷技术,联想已成为高性能计算产业绿色发展的引领者、可以信赖的绿算未来之选。
本文由 计算杂谈 作者:云中子 发表,转载请注明来源!