DTCC 2022,与近日落地,作为年度的数据库领域大会,有很多来自厂商、客户及行业内的专家带来了对数据库的最新解读。作为一名资深从业者,也持续关注大会13年。今年受到疫情影响,将形式改为线上,我也与近日拿到分享材料,抽空学习下。本文从上百位老师分享中摘出印象较深的,特分享给各位。会议材料可从https://z.itpub.net/stack/detail/10027下载。
专场1.4-PolarDB-X:云原生时代数据库的新可能性-黄贵
兼容性,是国产数据库发展中需考虑的要点之一。通过对已有产品的兼容,可以充分利用其生态效应,助力自己的发展。作为作为流行的开源数据库,MySQL是非常多数据库首选兼容对象。本雷达图给我印象较深,通过将MySQL的能力标准化(圆形边界),并将自有能力与MySQL的兼容情况(包括突出之处)汇于其中,整体情况一目了然。可以说,一张图就可以快速了解产品的能力边界与优劣势功能。
将一个分布式数据库使用得更好,最简单方式就是消除分布式。这句话听起来有些歧义,但细想起来又不无道理。分布式架构会带来更为突出能力同时,也必然对某些功能有所削弱。通过在架构设计层面,将数据可在“局部”完成操作,就可以在充分享受分布式收益的同时,又规避了分布式的弊端。下图中的方法通过表组功能设定,可有效消除由于分布式带来的开销等问题。这一特点也是很多分库分表类产品的强点所在,可以做很灵活的分布策略。
较原生分布式而言,分库分表架构产品在存储粒度及均衡性上有所不足,容易形成数据热点。PolarDB-X通过表组变更、二级分区功能,将更为灵活地处理数据分布,消除数据热点。
大家对分布式数据库的数据一致性,是非常关注的。基于原生开源单机产品(如MySQL)去构建的分布式数据库产品,无法做到强一致。PolarDB-X通过共识算法、优化2PC及基于InnDB引擎的增强实现了强一致。
作为云厂商的优势点,可充分利用云基础设施提供更为丰富的能力。如与对象的互通,可以实现数据全生命周期管理,实现冷热分离并提供统一开放访问,提供给客户更具性价比的方案。
专场1.1-事务一致性-李海翔
海翔老师,一直在分布式领域,特别是事务和优化器方面积累很多。此次带来以事务一致性为要点的,分布式数据库发展对比及代差划分,值得一读。
专场4.5-基于MySQL的分布式数据库高可用实践-王斌
在解决分布式事务问题上,一般各厂商都会采用两阶段提交协议方式。2PC原生方式存在诸多不足,很多产品都会做增强和优化。下图正是来自这方面的一些思考,特别是引入了MySQL MGR,解决分布式下的诸多难点。很有意思的一点是在存算分离下的计算节点上,也引入了MGR。
专场7.4-中国银联分布式数据库在金融场景下的技术探索与实践-赵智慧
分布式数据库的扩缩容问题,特别是分库分表类产品一直是较为头疼的问题。银联采用维护逻辑组与数据分片关系方式解决扩缩容方面维护使用上的若干问题。
专场9.1-多region分布式数据库方案与实践-赵飞翔
此文重点介绍YugabyteDB的架构,特别是在多地域分布情况下的特有设计,还是很有特色的。
专场13.4-分布式事务数据库性能优化实践-黄小慧
文中将国内主流的交易性分布式数据库做了架构划分,从计算、存储与管理三个核心模块的耦合情况做了比较。针对在分布式数据库中大家比较关心的网络开销问题,进行着重说明。这一点也是暴露出现有分布式架构的一个共性问题,即分布式下网络开销过重,一方面很容易受到网络抖动的影响,一方面在低延时场景也面临很大挑战。这也是很多在应用侧解决分布式问题方案的一个优势。
金融行业作为数据库应用的重点行业,一直以来也非常重视并持续跟进新技术的发展。本次大会也有多个金融业用户带来自己实践的一些体会。
专场2.1-分布式数据库选型与实战-林春
分布式数据库不是银弹,企业需根据自身业务特点有所选择。如下图做好企业选型的技术画像,帮助业务部分快速制定技术选型。
作为新技术,分布式数据库的引入需考量因素较多,如下图总结的已非常全面。
数据库通常是信创改造中的核心环节,其失败与否对整个项目起到重要作用,需遵循一定规律整体推进。下文总结此工作的推进思路,按照从设计研发、体系建设、人才培养、服务支持等多角度进行工作规划。
在引入新技术栈过程中,不同人群在不同阶段关注点有所差异。在实际操作中,应本着充分调研、提前规划、小步快跑、逐步积累、完善验证、稳定保障的工作原则。我个人也曾经写过一篇做好信创最后一公里的文章,也是这一思考的阐述。
专场2.3-中国工商银行开放平台传统集中式数据库转型实践经验分享-董勇明
作为对分布式数据库较早实践的企业,工行有着特有的一些实践经验。特别是从传统数据库迁移方面,形成了产品化、平台化、标准化的一整套全流程的解决方案,覆盖从设计、研发、迁移、验证、保障等全链路。从行业发展角度来讲,上述这些实践内容对同行业乃至全行业都具有很好的借鉴甚至推广意义。其非常期待如工行类的头部用户可以将自己的实践产品化、商业化,助力全行业发展。
专场2.4-科技有国界,数据库自主可控迁移改造实践-孔再华
来自民生的孔老师,着重从大家最为头疼的应用改造入手,谈到应用代码、SQL及存储过程类的评估,到数据对象迁移改造等多方面内容,都是来自一线实践的干活,值得一读。
专场8.1-斗鱼云原生数据库建设实践-赵闪
将数据库与云原生技术相结合,利用后者所带来资源供给的新思路,给数据库带来新的使用体验。文中通过扩展K8S Operator实现数据库云原生化,解决从有状态的数据库服务到无状态的云原生服务的转变。同时,充分利用云原生的能力,可实现如弹性伸缩、高可用等。
专场3.1-多云环境下的云数据库管理-李邦国
多云、跨云、云与非云的混合,将成为未来的数据底层平台的常态。本次大会也有多位老师谈到此类问题。对于企业来说,这样的基础设施现状,必要会带来一定复杂度,也需要在整体架构层面有所提前规划与布局。在充分利用到云基础设施的优势外,解决不同云厂商、云与私有化部署及跨云之间的若干难点问题。
专场19.2-作业帮数据库多云建设实践-张恒岩
专场3.3-云数据库发展的未来 - 无服务器数据库 Amazon Aurora Serverless解析-马丽丽
作为近年来逐步火热的Serverless理念,正受到越来越多云厂商的关注。作为这一理念的最早实践者,AWS的ServerlessDB 已经完成从v1到v2的跨代。此次大会,他们也带来了针对这一话题的分享。首先就是为什么需要ServerlessDB,文中谈到了若干观点,重点谈到了“可变、不可预测”场景。这里补充下个人感受,ServerlessDB确实可以满足某些场景的需求,但其不是万能产品,在选型使用上还需关注其长处与短板。
从服务层次来说,Serverless提供了更多的服务能力,解决用户在资源/成本上的痛点。从关注资源采购(CPU、DISK)等变为关注业务数据库访问本身。从自管、托管(从标准RDS到云原生DB)、Serverless,云上使用数据库也经历了几种形态变化。在相当长时间内,这几种方式也将长期共存。
主会场2.4-渤海银行核心系统分布式架构转型实践-王飞鹏
单元化,是金融行业近些来在架构设计上的一个潮流。以互联网银行为代表的一批企业开启了单元化的先河,部分国有大行也完成核心的单元化改造过程,可以说单元化已成为金融架构设计的标配。
单元化,有若干种实现方式,具体也参考北京金融科技产业联盟近期发表的《分布式数据库单元业务应用研究报告》。选择什么样的单元化类型、什么样作为公共单元、采用多大拆分粒度、未来扩展如何实现等。
专场6.1-海量异构数据,在线业务存储架构演进与实践-沈剑
来自沈大师的文章,一如既往的干。
专场8.3-开务数据库自治平台架构解析及应用分享-冯友旭
专场13.2-让数据库会思考—SQL优化技术的挑战与未来-魏可伟
第三方实现的数据自治平台实现。在此次大会上,有多篇来自开务的分享。
专场19.3-数据库智能运维与运维数字化转型-白鳝
白鳝老师,集合自己多年的一线经验,推出的D-Smart平台很多人都很熟悉了。其提出的,构建"运维数字化转型"的提法,个人一直关注。其以数据为前提(收集运行指标),通过数据+模型+算法(人脑智能)的结合,增强数据库在基础监控、性能诊断、预测分析、容量规划、安全合规的方面的整体运行能力。
专场7.3-20000节点数仓集群在大型商业银行的落地实践-陈晓新
MPP DB的超大规模实践,解决在大型企业用户的痛点。一方面可实现替代如TeraData等海外平台,一方面规避常规类Hadoop平台使用痛点。新一代的数仓体系,有其技术特色。
专场10.1-Cloud Bigtable 在广告技术中的使用-郭斌
作为海外的明星产品,BigTable受到很多人关注。
专场10.2-AnalyticDB MySQL高性能存储引擎-张浩然
作为国内在超大规模分析场景的代表,ADB近年发展,长期位居国内前十(墨天轮评估)。其在超大规模、极致性能的特长引人瞩目。个人也曾做过ADB的PD岗,这里也为ADB打个Call。
专场12.1-云原生无服务器数仓最佳实践与实时数仓架构-潘超
Redshift作为AWS的明星产品,在数仓领域举足轻重。其目前主要发展方向也是Serverless,向上通过计算能力弹性满足超大规模、变化负载下的计算问题,向下对接包括S3及其他众多三方存储引擎或格式,满足更高性价比和更大开放性。
专场12.2-融合普惠的云数仓——解析华为云GaussDB(DWS) 3.0-王传廷
最早接触DWS,感觉还是GreenPlum的云化版本,新的3.0版本重点在云原生适配、存储计算弹性、湖仓一体化及数据智能计算领域的增强。
专场12.4-阿里云数据湖与湖仓架构设计与实践-范佚伦
阿里云数据湖产品,较之以往更为强调开放与统一。无论是更多计算引擎的接入、更多存储格式的支持,都是想为用户提供更多可能性的选择;而统一在元数据、权限层面,作为治理入口而存在,为用户提供一体化的使用体验。
专场11.1-探究企业级数据存储高可靠与高效的实现方法--数据与存储技术-成思敏
随着数据规模及使用变化,企业对数据存储的要求不断提高。本文可以作为一个很全面的总结,将企业数据存储的历史演进、关键技术、主要平台及产品做了介绍。
专场11.2-可计算存储在数据库应用场景的实践-梅庆
新型硬件不再仅提供简单的数据存储与访问,通过增强计算可在某些场景上解决上层产品不易解决的问题。例如本文产品通过透明压缩、原子写,可有效提升数据存储引擎在读写性能上的表现。
专场14.3-加码数据安全,微盟数据安全落地方案-余成真
数据安全正在受到企业更多的关注,如何做好安全工作,是每个企业上层需考虑的问题。近些年来国家出台一系列相关政策法规,如何解读这些内容指导企业内部数据安全工作。本文给出微盟的一些做法。顺便插个广告,后续将在个人公众号推出对数据安全法规解读分析。
专场14.4-快手大数据安全平台建设与实践-马玲玲
从简单角色划分单一平台支持,到多粒度、全平台、多功能支持,数据安全体系有一个建设过程。如何避免将数据安全仅做到PPT、Word里,而是在企业内部触手可及又无感支持,是需要有整套架构来支撑。从统一采集、统一存储,到统一计算、统一接入,再到统一服务、统一治理,其将覆盖数据生命周期的整个过程。
专场8.5-程序员必须掌握的数据库原理-叶正盛
佛爷出品,带来了从数据库原理本质如何去看待现有数据库发展及对程序员意味着什么。多年功力,可见一般。
专场15.3-CnosDB-2.0构建高性能时序数据库实践-郑博
作为新的一种数据库,时序数据库随着物联网等场景而变得活跃起来。本文从场景、发展出发,以某产品为示例讲述时序数据库的最新发展。
其他-数据库各存储架构方案对比
数据库从最初的单机到共享、从主备到多活、从集中到分布,存在不同的存储架构,下图对主流的一些存储方案从可用性、扩展性和经济性上做个对比。