过去九年,数千名阿里云的工程师,基于飞天操作系统,不断优化和提升计算、存储、网络,也驱动了上层技术、产品、应用,给企业带来极致体验。
——蒋江伟
阿里云技术研发总经理蒋江伟(花名:小邪)
2018年的杭州·云栖大会上,阿里云技术研发总经理蒋江伟介绍了全新一代的飞天2.0云计算操作系统,拥有更强健的技术设施,包括从秒级启动ECI到云上超算集群的全场景覆盖,云边端一体的协同计算和AI能力,全球可达的网络和对IPv6的全面支持,可让万物能随时随地被连接、计算、智能化。
大会期间,云技术社区北极熊对蒋江伟进行了独家专访,探讨阿里云的开源、中台战略以及飞天操作系统。本次专访揭秘了阿里云技术方面诸多细节,本文是对专访精华部分文字版的整理,值得仔细品读。
北极熊:现在开源是主流,请问飞天采用了那些开源技术,有回馈开源社区的计划吗?
蒋江伟:飞天的核心组件是自研的,例如存储的盘古、调度的伏羲等。当然也用了部分开源组件,阿里云在使用开源,也在促进开源。
阿里云本身就是一个开放的生态,需要很多很多第三方的企业参与,这么多企业参与就需要一个标准,开源就是一个默认的标准,我们的出发点就是让大家使用阿里云的时候非常简单,跟原来的标准是一样的。
从全球来看,阿里云,包括整个阿里巴巴集团的开源贡献度也是比较靠前的。Github上有个统计,阿里是国内唯一一家入选Github TOP10贡献榜的中国企业。
2017年度Github贡献排行榜
我认为要选择有价值的项目来开源,不要去做一些没有意义的事情,不要为了开源而开源,这对客户是不负责的,对自己也是不负责的。你要开的是什么?要开的是从整个生态、从客户的角度来说,是需要的。所以,阿里云后面还有更大规模的开源计划和社区计划。
北极熊:阿里云现在中台发展的不错,请问在中台如何整合企业里不同的平台系统?(企业里的平台大多也是分散的,比如有监控、存储统一管理、容器、大数据等不同的平台)
蒋江伟:中台最重要的一件事情就是决心,决心来自于有没有成功的样板,我们现在推进中台,都源自于阿里巴巴自身的成功经验。
那阿里的中台模式是什么样子的?首先是建设基础服务,比如我们非常标准的一个服务—会员,不能每个系统都有一个自己的会员。全球的客户,在阿里都是一个会员体系,不管是天猫、飞猪,还是什么新业务,都可以接入会员服务。并且会员体系在迭代的过程中越来越完善,从技术上也越来越完善,比如分布式概念,越来越强大的吞吐量,稳定性,性能,能效比,都是越来越好的。所以是不断发展,越来越精专,越来越追求极致。从服务上也是,业务逻辑的不断沉淀,可以不断地被复用。
我这里举了一个会员的例子,其实交易也是,支付也是,甚至云计算也是。会形成一个中台,不仅仅是内部的中台,同时也可以是整个社会的中台。比如支付的时候,大众和商家的使用方式都很简单,只需要和支付宝的API绑定就可以了。
阿里云双中台+ET解决方案
从阿里内部来讲,会员、交易、商品、营销、店铺,甚至地理位置,都能形成一套中台服务体系。甚至连做页面设计都是通过中台输出的,要为整个活动做一个设计,一个页面,这都是服务,输入你要的东西,点一下按钮,就生成你要的东西,非常自动化。
过去,很多企业的技术路径是一个采购型的发展路径,买来的ERP和CRM,升级都是各自管各自的。有一天突然推出一个新概念,落伍了,又去采购另外一家企业的ERP,整个替换掉了,整个模式是烟囱的迭代演进模式。
而中台一是技术不断地往前迭代,二是沉淀出来的业务功能不断地往前迭代。上百个业务单元,都来使用中台的服务,只要有一个业务单元是创新的,不断沉淀出来的创新就可以支持到其他的业务单元,不需要重复建设。这跟烟囱模式有天然的区别,烟囱模式就是不断重复建设的过程,而中台模式就是天然的不断沉淀。
中台的背后有很多技术,比如像Aliware,elastic这些在阿里云上都有,企业可以很容易获得。这次杭州云栖大会,我们很多产品都有大幅度降价,包括中台,我个人的想法是像这样的东西,未来达到一定的规模和体系,应该都免费。
中台是一种业务逻辑的收敛,保证一个逻辑肯定从一个地方出去,当我要修改这个逻辑的时候,肯定是从一个地方修改的,不会出现错乱,不会出现每个地方都要去改,这是从技术架构上讲。
其实很多游戏公司用的也是中台理念,开发用的平台都是通用的,最关键的测试和设置也是只需要一个很小的团队。有了中台这样的机制,可以沉淀创新,然后在孵化出新的业务,从技术到业务上得到一个非常好的协同。
所以我认为大的企业都可以做中台建设,不是非得用什么技术,而是先要学会这个理念,再去建设,不管是生产还是制造业,还是运营商,都应该用这个理念去做业务。
北极熊:外界传说飞天系统很重,很庞大,请问如何应对用户对于这方面的顾虑?
蒋江伟:这是个伪命题,公共云上不存在这个问题的。就像淘宝的商家开店,是不用关心淘宝背后的系统是否复杂庞大,他只需要关心这个服务够不够好。公共云用户只关心你的计算够不够,你的存储够不够好,你够不够安全,你的价格是否合适,是否能适配我未来发展的需要,他是从服务角度来关心的。
飞天的定位是满足大规模计算服务,庞大是必然的,就像阿里巴巴的整个平台,淘宝、天猫非常庞大一样,但庞大并不意味着繁杂,我们有大量的工程师在对飞天做系统优化。如果一个系统很轻,那我相信他一定是没有遇到足够多的问题。
另外,飞天可以通过专有云输出给企业用户,同时我们的专有云是有敏捷版本的,支持企业自建,满足一些小企业的需求,同时与公共云的版本是互通的,拥有公共云同样的稳定性。
北极熊:新技术不断涌现,飞天在新技术使用的原则是什么,如何在最新技术和稳定可靠之间取得平衡?
蒋江伟:我们有一个架构小组,会不断的研究各种新技术,对各种新技术一览无遗,但前提是要能够保持阿里云的稳定性。其实阿里云稳定性,我们做过研究对比,各个云厂商里面,阿里云表现是非常稳定的。性能和场景不一样,我们对稳定性的要求就是做到极致。
阿里是产品和技术双驱动的公司,不会纯粹做一个自己用不到的东西。阿里本身就有各种业务场景,比如说边缘计算,最早就用到盒马鲜生上面。盒马鲜生是通过视频的方式来管理到店人流的,但是视频量很大,要做就近分析,需要很多距离门店很近的计算能力,这就是边缘计算。这些应用在阿里系用得非常好,我们沉淀下来以后,可以让更多企业享受同样的技术红利。又比如视频新技术,会现在优酷、淘宝直播、应用,用户反馈好了再对外服务。
北极熊:飞天的团队如何管理,是外界传说的996吗?对于人员的个人发展和健康,您如何看?
蒋江伟:阿里有句名言,客户第一,员工第二,股东第三。阿里老员工非常非常多,为什么呢?
主流的互联网公司其实都差不多,第一个是对员工,对人非常非常的重视,一般主管都会对你讲,先别急着完成业务,先看看你的组织,先关心你的人。阿里和其他公司的不同或许是:说到了,也做到了。
一般一个新的leader上任,收到的第一句话就是,如果你的团队的人成长,你就成功了,如果你带了一年,你的团队的这些人,觉得和去年的不一样,你就成功了。所以主管和员工之间是一种天然的伙伴关系,在这样的机制下,催生出来的组织,管理者都非常关心他的团队成长问题,
所以阿里就是这种学习的文化,培养的文化,加上一个比较宽松的管理的文化,就是这个几个机制在联合地运作。所以只要觉得自己是有才的,有能力的,都会被留下来。
北极熊:我看到有个办公室是以你的名字命名的,有什么故事?
蒋江伟:有些会议室,是以飞天奖获得者的名字命名的,我是2017年飞天奖的获得者,很荣幸能以我的名字命名。
获奖的主要原因是当时我在电商团队,把阿里技术沉淀下来的技术产品化,通过阿里云对外提供服务,帮助大的企业客户,让他们按照中台的方式去建设体系,是阿里云的三大解决方案之一。中台架构,以及后来引入的双中台架构,也成为企业数字化转型的潮流,很多事情不仅仅是阿里云在做,整个社会都在朝这个方向演进,这个奖更多的是对中台的认可吧。
(阿里云技术研发总经理蒋江伟和云技术社区联合创始人北极熊合影)
北极熊:感谢蒋江伟先生的深度分享,很高兴今天能有机会做这样的交流,把这么多好东西分享给云技术社区的朋友,期待明年再交流,带给云技术社区朋友一年中新的感受。
附:一图看懂飞天2.0