算力成网,构建数字经济新动能

时间:2022-09-30 11:05:25

9月26日,以“云网智联,筑数字经济之基”为主题的2022中国云网智联大会在京召开。中兴通讯作为全球领先的ICT基础设施提供商受邀出席,中兴通讯云计算产品规划总工朱堃发表《算力成网,构建数字经济新动能》的主题演讲,分享云网融合技术的趋势分析,以及相关课题落地实践的进展。

算力成网,构建数字经济新动能

▲中兴通讯云计算产品规划总工朱堃

算力是智能社会的基石

朱堃认为,“算力是经济发展的重要动力和衡量指标,是智能社会的基石。”随着人类社会从原始经济时代,到农业经济时代,再到工业经济时代,逐渐发展到数字经济时代,算力是推进社会发展的一个重要因素。

可以看到,业界总结了算力的三大定义。算力第一定律,即时代定律,算力就是生产力;算力第二定律,即增长定律,算力每12个月增长一倍;算力第三定律,即经济定律,算力每投入1元,带动3-4元GDP经济增长。

据IDC预测,算力指数每提高1%,GDP增长1.8%。

算力是智能社会海量数据应用的基石。随着工业的操作和流程复杂性,企业的人力成本仅次于生产成本,逐年上升。随着人口老龄化时代的来临,全社会人脑算力随人口老龄化逐渐降低。

智能社会的三大要素分别是算力、算法和数据。少量科学家研究算法,大量设备提供算力,大量用户/行业贡献数据。

如果从经济的角度看,我们正从用电力到用计算能力衡量一个国家、地区的经济发展能力,这是一个巨大的时代转变。

算力的发展面临新的挑战

算力发展至今也面临着新的挑战,比如数据量和算力之间的鸿沟。“人-物-虚”融合的“万务”互联推动数据量爆发式增长。

据 IDC统计,到2025年,全球创建的数据量将达到175ZB,海量数据对存储和算力提出了新的要求,全球数据量每增加1ZB,服务器需要增加29.4万台;预计2021~2025年,全球会增加3410万台服务器。

随着智能化深入,AI算力需求剧增。AI算力不同于通用算力,对并行计算能力要求高,因为大模型参数数量增长很快,大概每3~4月就需要算力翻倍。这时候,基于摩尔定律的CPU算力发展难以为继,需要引入异构算力,同时AI训练会消耗大量电力。

目前,算力不只存在于云中,端、边、网中也散布着不同规模的算力。这些算力是非服务化的,没有有效协同的算力和应用。我们需要通过网络能力升级和一体化调度技术可形成分布式服务化的cloud of cloud,来解决集中化的云计算诸多问题。

算力面临巨大的缺口,除了持续高效、提质,急需将非服务化算力充分利用起来。

三大因素驱动云网融合走向前台

在技术方面,网络正在从尽力而为向确定性保证演进。与此同时,算力也从单一的集中化供给向异构多样,以及泛在部署方面进行演进。AI、BD、BC、6G、大数据技术在逐步成熟。

在政策方面,节能减排、共享提效、创新引领、自主安全、东数西算等是一股强大的驱动因素。

在业务方面,工业实时计算、工业控制、数据隐私和安全、元宇宙、通感算一体化等业务逐渐走向成熟。

在这样的技术、政策和业务的驱动下,使得云网融合逐步走向前台,成为热点技术。云网融合以网强算,以算促网,通过泛在算力共享提效降耗,实时算力服务体验保障,新型算力服务来拉动网络流量,提升网络质量。

需求侧:场景和业务是关键

算网融合推进需要有需求、外因和内因同时驱动。在需求侧,目前可以分成三个阶段。近期(2022-2023年)是以云游戏、云电脑、智慧城市等富媒体、协同办公2.0业务为主。

中期(2023-2025年),随着连接的逐渐成熟,连接类的业务包括机器视觉、智慧工厂,以及高性能计算会成为第二阶段的主要业务。未来(2025年之后),元宇宙、通感一体、数字孪生,以及空天地一体化组网会成为主导业务。

聚焦应用场景,在2B领域,由于工业控制需要实时性的要求,跨地域协同带来云-边-端,以及枢纽之间的混合多云成为主要的服务方式。在2C领域,疫情之下,混合办公的数据安全性,电脑替换的高额成本,以及信创要求下的单芯性能,都使得瘦终端+云计算成为未来的主流。

在家庭场景,对于老龄化人群来说,需要保证电脑安全和免维护,对于未成年人群来说,在线学习需要有家长的陪护和监控。朱堃强调到,“服务好个人、家庭新兴业务和行业企业的数字化转型是云网融合的外部因素,也是商业成功的关键。”

供给侧:问题导向效率优先

对于内部来说,我们需要坚持问题导向、效益优先,从算力(云)、运力(网)到电力(能源)等基础设施各方面都要做到统筹规划,以及一体化设计。

从碳达峰、碳中和的角度来看,DC的PUE是我们需要关注的因素,PUE使过大的一些DC需要关闭、并网或者改造,具体技术包括数据中心、服务器等。多采用市电+UPS,以火力发电为主,适当采用水力、风能、太阳能等减少碳排放。

从资源效率的角度来看,由于采用大量冗余的计算中心,云计算中心面临总体效率不高的问题,许多数据中心的利用率甚至不到20%。如何将资源利用率逐步提升,包括资源碎片整理、动态人员控制等,也是我们需要关注的重要课题。

中西部地区数据中心的在用机架数的全国占比已经上升到39%,甚至超过北京、上海、广东三个数据中心聚集区的在用机架数的全国占比(31%),但是它的机器利用率并不高。所以目前在东数西算大的战略下面,可以通过东数西算工程来实施东西部的资源均衡发展。

业务牵引:视频业务先试先行

云网融合架构的落地需要有“杀手级”的业务来进行牵引,朱堃认为,“视频业务成为数字经济时代的基础业务。在2B领域,远程控制、机器视觉;在2C领域,在线教育、云游戏、在线办公;在2H领域,家庭监控和在线教育;这些都会使用到视频业务。”

视频业务具备几个特征,一个是需要视频业务的高实时,减少骨干网络的带宽,需要算力的分布式泛在部署。视频的编解码和视频渲染也需要有相应的GPU异构算力的支持。算力的异构、泛在是云网融合的发展方向。

这种情况下,可以建设一个视频算力网络。也就是说,从底层、终端,以及超边缘,包括云边部署,多样性的GPU、VPU等算力,通过SDN实现控制,通过分布式的算力编排,实现算力多云的灵活编排。

叠加实时的网络,实现融合的视频网络,通过视频编排服务和视频中台,使得视频类业务能够在网络上进行敏捷的落地和更新迭代。

打造高效算力,构建敏捷运力

云网融合的三大基础要素包括算力、网络和运维,以东数+西算+省份+边缘四级布局方式,高效算力具备异构多样、泛在布局、协同一体、绿色安全等特点。

在绿色安全方面,包括多模块的数据中心、内生安全,以及数据交易所需要的隐私计算、自主信创等等。在协同一体方面,通过一体化编排调度,实现多云之间的协同,可以屏蔽算力的泛在布局,实现一朵云架构。

在泛在布局方面,东西向枢纽之间东数西算,边边之间保障业务的实时性,为车联网业务提供实时性的保障。在多样算力方面,采用新型计算架构,DPU以数为中心,实现存算一体。

在网络基础设施方面,朱堃表示,“我们通过全光网络、IP底座、要素升级,构建新型网络基础设施,实现泛在敏捷的运力底座,保障算力的敏捷接入,算力的流通,一体化的编排,为上沉应用提供敏捷的运力基础。”

在敏捷的IP底座方面,实现了跨域基建互联,实现云间的数据同步。在确定性方面,小颗粒网络切片为应用提供了低时延、低抖动、高保障的网络。在算网一体方面,通过算力标识和地址路由等技术,实现算力和网络的高度协同。

算力成网,构建数字经济新动能

▲多要素融合一体服务

在运维方面,中兴通讯在算网基础设施之上搭建了一个算网大脑。云网大脑可以细分成三部分,分别是多要素融合服务、一体编排调度、全域动态感知。

中兴通讯云网融合探索实践

近年来,中兴通讯和各大运营商伙伴做了很多云网融合的探索实践。在新应用方面,在浙江和中信银行的云电脑落地实践中,云电脑构建在实时的RTN网络上面,通过云电脑的终端和系统侧的就近服务,保证了云电脑的安全性和系统实时性。

在山东和福建的视频中台落地实践中,中心通讯结合一些工厂、智慧城市,实现了视频终端智能管理、融合视频服务等。在新华社和古子城,实现AR、VR、元宇宙的落地试点。

在关键技术方面,中心通讯通过智能卡,提供云化服务保障,各大运营商在做服务感知网络,算力路由、算力度量等课题落地。在腾讯项目中,实现ZEGO液冷模块化服务器的落地。

最后,朱堃总结道,“中兴通讯拥有DC基础设施建设到服务器、云、存储和网络全系列的技术。我们希望后续与广大运营商、合作伙伴携手并进,为云网融合新技术落地和成熟贡献力量。”