罗振宇跨年演讲之夜 阿里云护航得到App

时间:2022-09-08 17:18:44

2017年12月31日,罗振宇在上海举办了《时间的朋友》跨年演讲。

这场四个小时的跨年演讲吸引了近万的现场观众和超过百万的直播观众。

今天想和大家分享的是,在这场知识晚会的背后,得到App、电商平台技术人员和阿里云团队保驾护航的故事。

罗辑思维&阿里云

罗辑思维是著名的知识服务商和运营商,有微信公众号、知识类音视频节目、知识服务得到App等产品。随着品牌日积月累的沉淀,其跨年演讲和其相关业务需求不断增大。

罗辑思维大量核心业务运行在阿里云,目前团队使用了ECS、CDN、OSS、多款云数据库、负载均衡、容器服务、全链路压测PTS、Web应用防火墙、媒体转码、数据可视化等20多款产品。

对于此次阿里云护航,罗辑思维的技术负责人沈仁奎表示:“非常感谢阿里倾囊相授双11成功经验,作为产品的用户很感动,你们服务非常贴切,彻底融入到我们团队了解我们的业务形态,给出很多有价值、切实际的建议,对我们帮助很大。”

全链路压测

技术大考前的必备演习

全链路压测是应战业务大促不可缺少的关键技术,这是阿里历年备战双11的利器,在此次罗辑思维备战中它同样被应用得淋漓尽致。

通过全链路压测规划跨年期间的系统容量,确定基准吞吐量和扩容缩容策略,找到特定场景下集群服务器配比和集群的短板,对于压测中发现的问题及时调整。

相比于经验判断和一般意义上的线上压测,全链路压测与业务场景更紧密相连,找到不同业务场景下的临界峰值,计算出每个业务应用的数量值,由点及线、由线及面从而获得整体情况;通过性能测试服务PTS(Performance TestingService)编排全局业务场景和构造真实业务流量,达到让业务和技术架构提前经历业务洪峰的检验,确保跨年活动和日常核心服务的稳定性和健壮性。

罗辑思维的全链路压测接口愈200个,整体覆盖率超过50%,囊括了其得到APP和其独立电商平台的所有核心业务。

在不到三个月的时间内,罗辑思维和阿里云PTS团队一共进行了大大小小愈七百次的单链路压测、十六轮完整形态全链路压测,压测所耗费的资源相当于一百多万用户一同测试两个多小时。

为了不影响到罗辑思维用户的体验,其中一些全链路压测都是在半夜和凌晨进行的。

由于压测范围广,其发现问题能力和提升效果也相当显著。压测先后总计发现数百问题,经过逐一排查,压测目标的几乎所有主要后端服务的业务系统都被优化改造。

举例说明,在压测中发现node侧应用CPU飙升的瓶颈,通过接入阿里Node.js性能平台,定位、分析异常并解决应用核心错误。经过技术人员们的不懈努力,系统吞吐能力提升上百倍。

ECS在手

资源呼风唤雨

在传统的基于IDC搭建业务情况下,必不可少的担心就是业务发展受制于固定且有限的资源。

如果资源储备过多,那么在日常平峰或流量低谷时,就会造成巨大的资源浪费;可是如果资源准备不充分,在流量高峰时,又影响到用户体验。

云计算时代,弹性计算是首要优势。罗辑思维选用了阿里云ECS,该产品具备海量资源的弹性交付能力,可以保证在一分钟内创建出近1000台云服务器。

罗辑思维日常情况下按照一定比例选用包年月和按量的两种服务器付费方式,在此次跨年演讲中增大了按量计费的服务器用量,峰值时该种服务器达1000+台,大大降低了计算资源成本和前期筹划准备成本。

除去成本之外,更重要的是使用效果和体验。从计算性能稳定性而言,通常情况下,整体的ECS业务可靠性比线下物理机可靠性有大幅提升(99.95%业务可用性保证);若搭配高性能SSD云盘,则相当于数据可靠性和业务可用性双重保险,这也是罗辑思维此次的选择。

另外,ECS提供丰富的企业级实例,罗辑思维选用了最新一代基于skylake处理器、25G网络的企业级实例、大数据分析的D1型实例、高性能数据库I2型实例等,在性能和成本上都很出色地满足了需求。



阅读原文