“今年是亚马逊云科技成立的15周年,也是云计算行业诞生的15周年。从云计算诞生到现在,亚马逊云科技创新的步伐从来没有停止。”亚马逊云科技大中华区产品部总经理顾凡在2021 re:Invent大会上,重点谈到亚马逊云科技在云计算领域的探索和创新。
亚马逊云科技公布五大风向标
作为云计算领域的领导者,亚马逊云科技的关注点极具参考意义,此次re:Invent也为大家总结了五个风向标。一定要重点关注哟!
第一个点是,重构云计算底座,自研芯片再升级。今年亚马逊云科技推出自研芯片Amazon Graviton3,并同时推出基于这一款新芯片的第一个实列Amazon EC2 C7g,与Amazon Graviton2处理器支持的当前一代C6g实例相比,计算密集型工作负载性能提高多达25%,同性能下能源消耗降低60%。
第二点被亚马逊云科技称为:大云无疆,无限拓展。重点讲的是万物云化,云计算正在逐步拓展到各个边界,包括数据中心、边缘计算、5G、IoT等等,未来还将拓展到太空。
第三点是,代码即云,万物皆API。云计算深刻改变了一个事实,就是应用的开发者如何去看待底层的基础设施和各种平台资源,今天在应用开发者的眼里,一切云计算的资源都是可以代码化的,都可以被编程。
第四点是:降低门槛,把云计算交到更多人手里。在这方面,相信很多中小企业都深有体会,能够让业务人员更加轻松,无需专业技术就可以自己做数据分析,甚至做机器学习。
第五点是:可持续发展。从可持续发展的责任共担模型,到亚马逊云科技发布的碳排放的跟踪工具,以及若干个新的可再生能源的项目,这一系列的举措都是为了可持续发展。
从这五大风向标可以看出云计算发展的趋势,万物上云、云端开发、低门槛应用AI与数据分析,让云计算真正成为了企业IT的支柱,并在激烈的市场竞争中推波助澜。
自研芯片,性能再刷纪录
“很多客户只用一两天时间就可以完成从x86到ARM的转移,极大的帮助客户缩短了利用ARM的整个技术、利用Graviton的技术,去获得超过40%的性价比提升的能力。”谈到Graviton系列处理器,亚马逊云科技大中华区产品部计算与存储总监周舸这样介绍道。
此次re:Invent,亚马逊云科技还发布了四个新的基于Graviton2的实例,其中包括一个TB内存的X2gd,还有Graviton加上英伟达的GPU,提供了G5g的新的实例,也帮助了安卓的游戏、流媒体的应用,发挥了它更高的性价比。
刚刚发布的Amazon Graviton3处理器,则将计算密集型工作负载性能提高多达25%。Amazon Graviton3处理器与Graviton2相比,为科学计算、机器学习和媒体编码工作负载提供高达2倍的浮点运算性能,为加密工作负载速度提升高达2倍,为机器学习工作负载提供高达3倍的性能。
Amazon Graviton3拥有500亿个晶体管,比上代产品多出200亿个,在设计方面也是从用户实际应用出发,在重点方向增强了性能。
通过使用指令并行的方式,让处理器内核在同一个时钟周期里能够执行更多的指令和任务。例如从一个时钟周期执行5个指令提升到执行8个指令,这样就可以在不必大幅度提升频率的同时,增加计算能力。
在Nginx和Groovy应用方面,Graviton3可以提升60%性能,Redshift也可以达到超过25%的提升。此外,像x264、265的解码也有50%左右的性能提升,而在加解密中AES-256则提升了61%。这就是指令并行所带来的直接效果。
亚马逊云科技研究了大量Graviton2上的应用负载,发现其中有大量的大数据、微服务架构及HPC相关服务,这些服务对于内存的带宽和延时的敏感度要求都非常高,因此这方面也成为了新的研发方向。
Amazon Graviton3推出以后,相比Intel平台内存带宽提升了50%。Twitter表示性能提升20%到80%,甚至在尾延迟方面可以降低至少35%。F1在做流体的仿真的时候,使用Graviton2本身就已经比x86快很多了,这次升级至基于Graviton3的C7g,再次提升40%。
在机器学习方面,因为C7g可以支持BFloat16,因此在推理方面比Graviton2提升了近4倍。
为企业赋能,降低AI门槛
曾经有专家谈到过:如果你想更好地利用AI,那么就需要将AI和IT两方面的专家相结合,才能真正实现灵活应用。
这一点对于很多技术能力有限的企业而言,简直太难了。不过现在有了云计算,让这一切变得更加简单。
在降低机器学习门槛方面,亚马逊云科技在多个方面为企业提供赋能。
在基础层,亚马逊云科技为机器学习专家提供了丰富的算力和经过优化的深度学习框架。并进一步优化了主流的机器学习框架,例如Tensorflow、MXNet,方便用户可以快速的构建环境,避免搭建环境的时候框架兼容性和依赖性的兼容性的问题,提升了训练的速度,降低了推理的延迟。
中间层亚马逊云科技提供了Amazon SageMaker端到端的机器学习平台,跨越整个机器学习全流程,用户可以方便的在Amazon SageMaker环境中处理数据标记、数据处理、特征存储、算法探索、模型推理到上线再到边缘端设备管理的整个过程,在Amazon SageMaker平台中全部都可以做管理。
诸多工具助企业降低机器学习成本
随着机器学习的研发水平的提高,模型也变得越来越大,随之训练时间也越来越长,带来的成本也越来越高,部署的难度也越来越大。由此,亚马逊云科技在产品设计上也不断创新,努力实现最佳性能和最佳性价比。
面对高额的训练成本,亚马逊云科技推出了Amazon SageMaker Training Compiler,通过内核层面进行优化,使Training可以更好的利用CPU的资源,实现最高50%的提速。Training Compiler默认跟Tensorflow和PyTorch集成。数据科学家只要做非常少的更改,就可以把它使用起来。
此外,还有强大的部署调优工具Amazon SageMaker Inference Recommender,能够自动化地帮助用户搞定测试调优。
Amazon Serverless Inference可以按照用户实际用量来计费,保证根据自动生产过来的流量不断进行收缩,自动配置、扩展,并且在没有需要的时间释放相应的计算资源,这些Amazon SageMaker的新功能大大减少了企业扩展机器学习规模的难度,同时降低了机器学习的成本。
同时,在降低机器学习门槛之外,亚马逊云科技也在逐步消除运维人员的繁琐工作。通过Amazon DevOps Guru for RDS,它使用了亚马逊云科技多年来的运营机器学习模型,可自动识别和分析各种潜在的性能问题,比如资源耗尽等,并在分析之后自动修复相应故障,让企业运维更省力、省心、省钱。
另外,还有两个很具实用价值的工具,分别是Amazon SageMaker Canvas和Amazon QuickSight。
Amazon SageMaker Canvas能够帮助用户或数据分析师无需任何机器学习经验或者任何代码,使用拖拉拽的功能,就能简单生成一个机器学习的分析,并且和数据科学家进行协同。
QuickSight则是亚马逊云科技开发出来的BI工具,能够帮助业务人员自助化开展BI分析。QuickSight刚刚升级的新功能是Amazon QuickSight Q,能让终端用户通过简单语言针对数据提出问题,输出可视化结果及业务报表。用无代码的方式对业务数据进行机器学习的分析和预测,为各个行业的用户也降低了云的使用门槛。
将节能进行到底
“亚马逊云科技始终专注在基础设施的各方面的效率的提升,无论是数据中心、硬件的设计、自研芯片,到数据中心的建模、跟踪、运营的绩效,所有这些东西都是在不断提升我们自己运营的基础设施效率。”谈到碳排放,顾凡这样认为。
举例而言,Graviton是非常节能的一款处理器,其每瓦性能比其他的Amazon EC2的处理器要强很多。Amazon Inferentia是亚马逊云科技最节能的机器学习推理处理器,Inf1比基于GPU的实例的推理的能效提升高达80%。
随着越来越多的企业把机器学习当作必备技能,机器学习的工作负载在数据中心里占据非常大的比重,能耗也随着迅速增长。更高的性能、效率意味着可以更快完成任务,也就更加节能,所以无论是Inf1还是Trn1都将扮演一个更加重要的角色。
在2020年的时候,亚马逊云科技已经成为全球最大的可再生能源采购企业。在本届re:Invent上,亚马逊云科技再次宣布另外18个新的可再生能源项目落地。到今天为止,亚马逊云科技已经启用了超过12000兆瓦的可再生能源的容量。
当所有这些可再生能源项目投入运营以后,预计每年会减少1370万吨的碳排放。这相当于300万辆汽车一年的碳排放量。
从云计算风向标到行业探路者,亚马逊云科技正在通过不断地创新帮助合作伙伴快速前行,打造出一个个更具实战经验的探路者们,协助它们在各自领域里不断开拓向前。
本文由 计算杂谈 作者:云中子 发表,转载请注明来源!