基础架构

华为胡克文:创新三层AI架构,打造智能IP网络

IP网络历经30多年的发展,为智能社会打下了坚实的网络联接基础。据《华为全球产业展望GIV@2025:智能世界,触手可及》预计,到2025年,全球联接数将达千亿,互联网将覆盖62亿人口。同时企业数字化进程不断加速,2025年100%企业将会采用云服务,基于云技术的应用将在企业中达到85%的使用率。随着企业云化与数字化转型的深入,IP网络需要承载越来越多、越来越关键的业务,这些海量的关键业务也对网络承载提出了更高的要求。

以企业园区Wi-Fi网络为例,在办公楼宇、大型场馆、大型商场等区域,人流密度变化频繁,用户上网使用的业务也多种多样(包括电子邮件、网页浏览、视频会议、电子交易等),如何确保不同用户的业务体验?传统方式是通过运维人员手动调整,但难以应对人流的快速变化,用户体验无法得到有效保障。Wi-Fi网络能否主动感知人流与业务的变化,自动进行网络调整,满足不同业务的诉求?

将AI技术引入园区网络,智能识别Wi-Fi网络用户的终端接入数量、接入位置、带宽需求、业务体验需求的变化,并预判趋势,据此对Wi-Fi网络进行动态调整,优化整网性能,是一个可行的思路。华为已经和部分客户开展了智能IP网络联合创新,取得了一定的成果。根据第三方测试机构Tolly测评结果显示,该方案可以通过Wi-Fi优化,将无线空口的吞吐量提升58%,Wi-Fi信道干扰率比业界下降49%。此外,还可以将AI技术用于园区网络的智能运维,大约85%的故障可以在10分钟内处理完成。

华为认为,智能IP网络具备以下几个特征:

智能联接,是智能IP网络架构的基础。当前IP网络有很多不确定性:业务和网络之间并没有充分的协商过程,业务层对于网络层服务的期望(也叫业务意图)并不明确,这是来自需求侧的不确定性。此外,IP网络是统计复用的,网络资源占用情况随着业务、流量的变化时刻在变化,这是来自供给侧的不确定性。为了消除不确定性,首先需要准确感知业务意图,比如业务层通知网络层业务诉求,或者网络层根据业务流量行为特征(业务模型)进行分析,从而主动识别出终端、用户、业务类型,进而推断出其对联接服务的期望,以消除需求侧的不确定性。同时,网络管析控平台通过神经网络等AI算法建立网络模型,并实时感知和分析网络状态,了解网络资源占用情况,以消除供给侧的不确定性。智能联接还包括将业务意图与网络资源进行匹配,以最小代价持续提供“满足业务期望”的联接服务,实现“应用驱动体验”的目标。

智能运维,是提升用户体验的关键。当前,投诉驱动的维护方式,给网络运维带来了极大挑战。网络运维部门往往是最后一个知道网络出了问题的部门,用户体验无法保障。为了提升用户体验,预测性运维是我们的目标。为此,我们首先需要能够实时感知网络状态,了解网络是否有问题发生或有潜在风险,继而,通过故障模型匹配,精确找到问题根因并自动修复,在用户体验受损前解决问题,保障业务不受影响。

智能学习,是智能联接和智能运维的保障。业务模型、网络模型和故障模型的建立,都依赖于智能学习的大数据训练和分析能力,需要通过智能训练,建立起合适的模型。同时,AI学习的持续演进能力,可以让整个系统变得越来越聪明,适应业务和网络的快速变化,提供更加优质的服务和体验。

在2019年华为全联接大会期间,围绕着智能联接,智能运维和智能学习这三大关键特征,华为发布了智能IP网络的三层AI架构,在数据通信领域加速实现自动驾驶网络ADN (Autonomous Driving Network):

设备AI:华为数据通信主力产品“四大引擎”(路由器产品族NetEngine、交换机产品族CloudEngine、WLAN产品族AirEngine、安全网关产品族HiSecEngine)全面提供AI Turbo能力。设备通过边缘推理和实时决策,基于业务意图,调整转发策略,实时保障最佳业务体验。

网络AI:华为iMaster NCE,对接业务层的意图,实现网络配置自动生成和部署,并确保网络持续满足业务意图;它可以实时感知物理网络的健康情况,发现异常并及时预警,提供异常处理建议;可以基于经验库进行网络异常的快速排障或优化;还可以实现业务的SLA实时可视,并基于AI技术使能预测性维护。同时这个系统也具备开放能力,将网络AI能力视图按需展示,使能合作伙伴面向各行各业进行定制化开发。

云端AI:华为iMaster NAIE,主要基于云平台提供数据湖服务、模型与训练服务、生态开放及开发者服务。可以帮助企业培养AI算法专家/开发者,构筑AI算法能力;提供训练服务,帮助开发者降低算力资源获取成本;数据脱敏后进行资源数据共享,助力开发者进行模型训练;提供联邦学习和迁移学习能力,解决模型泛化问题,实现模型共享。

智能IP网络不仅在园区网络大显身手,也在数据中心网络、广域网、防火墙等领域有新的突破。

数据中心网络+AI:AI时代的到来,给数据中心网络提出了更高的要求。相关测试表明,数据中心网络中0.1%的丢包率会导致AI训练算力下降50%。如何实现数据中心网络0丢包,充分释放AI算力?华为推出的业界首个智能无损DCN解决方案,采用AI技术进行预测性流量调度,能够真正实现网络0丢包,数据计算与存储效率提升约30%。此外,将AI技术用于数据中心网络的智能运维,华为与客户在联合创新中取得了重大进展:针对75类常见故障,做到1分钟感知故障,3分钟定位故障,5分钟修复故障。基于以上研发和联合创新成果,AI加持的华为数据中心网络解决方案可以初步实现“智能理解业务意图、智能选取最佳网络路径、智能评估变更风险、智能检测故障和快速定位根因”,率先在数据中心网络领域实现L3级自动驾驶网络。

广域网+AI:在“5G+云+AI”使能千行百业的新时代,5G提供了前所未有的无线接入能力,而云和AI提供了几乎无穷可扩展的智能计算能力(针对单个租户而言)。值得提醒的是,“5G+云+AI”中间的两个加号“+”不可忽视。如果说AI加持的数据中心网络就是“云+AI”中间的那个加号,那么AI加持的广域网就是“5G+云”中间的那个加号。如何借助AI技术让广域网加速实现自动驾驶网络,充分发挥5G、云、AI的潜能,为百万企业上云、5G使能千行百业提供最佳网络联接?

与数据中心网络的情况类似,在实现自动驾驶网络的过程中,将AI技术用于广域网络,也能够根据业务的时延等SLA要求,智能匹配网络资源,智能选取最佳网络路径。但是,与数据中心网络不同的是,在百万企业上云、5G使能千行百业之际,广域网首先要解决一个基本问题:如何在广域网上实现业务快速部署,并满足各行业不同的SLA诉求(如5G远程医疗的端到端时延必须小于15毫秒),实现最佳网络联接?通俗地说,如何让物理转发面的“身体”能够跟上AI加持的“管控析大脑”的节奏?这是广域网面临的新挑战。

首先,面对百万企业上云场景,由于传统网络需要人工逐段打通,部署效率已经成为瓶颈。最新一代的路由协议SRv6(IPv6段路由)采用了“源路由”机制,将广域网的部署从“端到端多设备逐一配置”简化为“源点侧单设备配置”,因而大幅降低广域网的部署复杂度,使转发面也能如影随形般跟上 “管控析大脑”的节奏。如此,“大脑”与“身体”双剑合璧,实现广域网中自动化快速部署。

其次,针对5G垂直行业场景不同的SLA尤其是时延诉求,广域网络也可以借助SRv6协议,根据管控析系统计算出的最优路径,通过对网络转发路径的编程,实现确定节点、确定路径、确定时延的路径快速配置,满足业务层的要求。

由此可见,最新一代的路由协议SRv6,是AI加持的新一代广域网必备的转发面能力,使能广域网 “智能推荐最佳路径、快速部署最佳联接、实时调优业务SLA”,与5G和云技术一起,助力百万企业上云、使能千行百业。

网络安全网关+AI:在网络安全领域,恶意软件变种众多,隐蔽度高,目前防火墙通过“特征匹配”去分析和检测威胁的方式,已经无法有效应对。华为全新发布的业界首个T级AI防火墙HiSecEngine USG12000系列产品,凭借独创的AIE威胁检测引擎,在网络边界实时处置“失陷主机”、“C&C外联”等传统安全网关无法检测的威胁,检测准确率达99%以上;同时,HiSecEngine USG12000内置昇腾310 AI芯片,用AI算力将威胁检测的性能提升5倍;采用安全事件智能分析及安全策略智能调优技术,实现分钟级业务上线及基于业务驱动的策略部署与变更,将安全运维OPEX降低80%。新一代AI防火墙,将为企业提供智能化的网络边界防护,筑起安全防护的钢铁长城。

华为始终坚持以客户为中心的核心理念,客户需求永远是牵引华为前进的动力。通过NetCity联合创新机制,华为将领先客户的需求与自身的芯片研发能力、产业标准影响力相结合,与客户和合作伙伴一起携手,持续孵化更先进的产品与解决方案,引领智能IP网络。

作者:华为数据通信产品线总裁 胡克文

(0)

本文由 计算杂谈 作者:云中子 发表,转载请注明来源!

LensNews

热评文章

发表评论