阿里云云原生助力安永创新驱动力实践探索

时间:2024-01-21 22:09:45

云原生正在成为新质生产力变革的核心要素和企业创新的数字基础设施。2023 年 12 月 1 日,由中国信通院举办的“2023 云原生产业大会”在北京召开。在大会“阿里云云原生”专场,安永科技咨询合伙人王祺分享了对云原生市场的总览及趋势洞见,及安永基于阿里云容器服务、消息、微服务引擎、可观测等云原生技术产品方案,持续获得创新驱动力的切身实践。

图片

王祺,安永科技咨询合伙人

云原生加速企业数字化创新,创造更多业务价值

安永作为一家全球领先的审计、税务、战略、交易和咨询服务机构,近年来一直致力于提供数字化转型、云及 AI 相关服务,为客户提供专署解决方案并带来最佳客户体验。在安永看来,云原生应该作为一条“不归路”,帮助企业随着技术的发展获得持续成长。

图片

王祺认为:“过去企业使用直接上云的方法将应用程序迁移到云中,这还不足以获得云的全部好处。云原生使企业能够使用微服务、容器和基于 API 的设计来构建和运行可扩展的应用程序。这些技术使松散耦合系统具有弹性、可管理性和可观察性。从长远来看,采用云原生的方式比直接上云以及仅将云作为 IaaS/ 部署平台更具成本效益。”

阿里云云原生助力安永创新驱动力实践探索

在为企业提供专业技术咨询服务的同时,安永自身也在积极拥抱云原生,并基于阿里云的技术产品探索出了一套行之有效的本土化最佳实践。

图片

通过将安永本地化项目的核心业务平台迁移至阿里云云原生容器服务 ACK、容器镜像服务 ACR、消息队列 Kafka、消息队列 RocketMQ、可观测 ARMS、Prometheus、微服务引擎 MSE,安永中国实现了全面的云原生技术架构升级,整体服务器资源利用率提升超 30%,版本发布周期缩短近 40%,业务稳定性得到提升。

在出现问题后,通过多容器实例多可用区部署并且异常节点可快速隔离,帮助 Java 和 .Net 应用无缝接入可观测能力并快速分析、定位和解决系统问题,面对急剧增长的业务量,通过 ACK Serverless 集群极致的弹性能力和消息队列异步解耦提升系统吞吐能力,基于容器服务 ACK 在短时间内完成扩容,扩容效率提升了近 80%,同时,接入云原生产品能力后,业务上经历 0 故障,为业务连续性提供了充分保障。

在阿里云和安永的通力协作下,此次安永本地化核心业务云原生探索取得的效果显著,也被阿里云评选为 “2023 阿里云云原生优秀实践案例”。

图片

安永大中华区科技咨询服务主管合伙人顾卿华先生、
安永大中华区 IT 负责人支伟先生代表安永出席授奖仪式。

本次大会上,王祺也将安永本土化云原生实践过程中遇到的挑战、如何在架构层全面基于阿里云云原生能力进行构建,最后通过整体的成本优化,进一步提升云原生度并降低成本的经验进行了全面的分享。

云原生变革过程中的业务挑战

  • 自建集群稳定性差早期采用开源 Kubernetes 部署其业务平台,但自建集群稳定性不足,且缺乏与云原生监控和弹性集成的能力。
  • 弹性能力差业务适配难业务平台用户访问具有明显的波峰波谷特征,实现应用的弹性适应业务特点可以节省大量成本,但自建集群的适配难度很大。
  • 系统可观测能力欠缺问题诊断效率低业务平台以 Java 和 .Net 技术栈居多,尤其是 .Net 应用可观测能力欠缺,出现问题后诊断效率低。
  • 多云管理成本高无统一管理能力业务平台多云容器部署,管理上需要考虑多云情况,日常运维需要多云部署,缺乏多云容器统一管理和灾备能力。

阿里云助力安永云原生架构升级和业务创新

  • 提升业务稳定性将其部署在自建 Kubernetes 集群上的业务应用迁移到阿里云容器服务 ACK Serverless 集群以构建其业务平台。ACK Serverless 经过阿里云大规模场景实践验证和优化,无需花费过多精力进行应用优化适配。通过使用 ACK Serverless,业务系统不仅提升了稳定性和极致弹性效率,还节省了大量运维人力成本。
  • 快速弹性应对突发流量ACK Serverless 可以快速极致弹性地应对突发流量,秒级扩容成百上千 Pod 实例,节点无需运维,实现了节点资源 Serverless 化管理。
  • 简化用云体验ACK Serverless 整合了阿里云云原生的多种能力,例如可观测监控 Prometheus 版监控服务,可以帮助快速定位性能问题,更好地保证业务的连续性。这些功能的集成简化了云计算体验,提高了企业运行云端 Kubernetes 容器化应用的效率。
  • 无缝应用可观测接入应用实时监控 ARMS 支持无缝接入 Java 应用,同时与 ACK Serverless 深度集成,三步即可接入 APM 监控,接入后无需业务埋点即可快速查看应用调用拓扑、应用监控(QPS、RT、JVM 等)、异常信息、调用链路、慢 SQL 等信息;针对 .Net 应用,通过 OpenTelemetry+Prometheus+Grafana 即可无缝接入 .Net 应用监控,快速帮助运维和开发人员进行问题的分析、定位和解决。
  • 分布式容器云多云管理分布式云容器平台 ACK One 面向混合云、多集群、分布式计算、容灾等场景可以连接并管理任何地域、任何基础设施上的 Kubernetes 集群,并提供一致的管理和社区兼容的 API,支持对计算、网络、存储、安全、监控、日志、作业、应用、流量等进行统一运维管控。

业务结果

  • 资源利用率提升: 服务器资源利用率提升了 30%。
  • 支撑业务快速发展: 出现问题后可快速隔离,当面对急剧增长的业务量,可以在短时间内完成扩容,原本自建集群需要 15 分钟扩容一个节点,通过使用 ACK Serverless 集群后,应用资源扩容效率每秒可扩容上百到上千个 Pod。
  • 迭代效率提升: 版本迭代期间,服务的更新速度有了明显的改善,缩短了近 40% 的版本发布时间。
  • 可观测覆盖提升: 无缝接入 Java 和 .Net 应用,可观测覆盖所有业务场景。
  • 多云管理效率提升: 实现了统一多云容器资源统一管理,提升运维日常管理效率。
  • 0 集群故障: 集群的稳定性也给系统提供了充分的保障,截至目前,各业务平台上的集群故障次数为 0。**

持续的创新力,是企业竞争力的核心

“云原生是条‘不归路’, 我们必将随着技术发展持续成长”,王祺表达了安永对于云原生坚定拥抱的态度。

图片

“持续的创新力是构建企业竞争力的核心。通过 2 年的云原生化历程,我们清晰了云原生构建的挑战,也通过与阿里云的合作总结出了一套行之有效的、更加本土化的最佳实践。通过利用阿里云的各种云原生服务和工具来构建和部署创新的应用程序,我们可以更好地利用云计算的弹性和可扩展性,根据实际需求灵活地调整资源,减少停机时间和数据丢失的风险,并且更好地保护我们的数据和应用程序免受潜在的安全威胁。云原生技术融合优势为我们注入了持续的创新能力,驱动我们更快地推出新产品和功能,以满足市场需求并保持竞争优势。”