MariaDB 新版本实力逆袭不仅仅是 MySQL 替代品

时间:2022-09-14 14:12:22

MySQL分支——MariaDB

MariaDB是MySQL源代码的一个分支,主要由开源社区在维护,采用GPL授权许可。开发这个分支的原因之一是:甲骨文公司收购了MySQL后,有将MySQL闭源的潜在风险,因此社区采用分支的方式来避开这个风险。MariaDB是完全兼容MySQL,包括API和命令行,使之能轻松成为MySQL的代替品。在存储引擎方面,使用XtraDB来代替MySQL的InnoDB,XtraDB完全兼容InnoDB,创建一个InnoDB表内部默认会转换成XtraDB。

Percona XtraDB 是 InnoDB 存储引擎的增强版,用来更好地发挥最新的计算机硬件系统性能,同时还包含一些在高性能环境下的新特性。XtraDB 存储引擎是完全的向下兼容,在 MariaDB 中,XtraDB 存储引擎被标识为"ENGINE=InnoDB",这与 InnoDB 是一样的,所以可以直接用XtraDB 替换掉 InnoDB,而不会产生任何问题。XtraDB 在 InnoDB 的基础上构建,使 XtraDB 具有更多的特性,更多的参数指标和更多的扩展。从实践的角度来看,XtraDB 在CPU多核的条件下更有效的使用内存,并且性能更高。从 MariaDB 5.1 开始就默认使用 XtraDB 存储引擎。

MariaDB由MySQL的创始人Michael (Monty) Widenius主导开发,他早前曾以10亿美元的价格,将自己创建的公司MySQL AB卖给了SUN,此后,随着SUN被甲骨文收购,MySQL的所有权也落入Oracle的手中。MariaDB名称来自Michael (Monty) Widenius的女儿Maria的名字。

一、MariaDB 10.0和MySQL 5.6的不同之处

MySQL 5.6 的代码库的文件结构已经被改动了。比如单个代码文件已经被分成多个,又或者是某些代码已经被重新归类到了不同的文件内。所以要把MariaDB 去配合现在这个文件结构一定是一个非常消耗时间的过程。

MairaDB 5.5 已经有大量的代码不同于MySQL 5.5 的版本,而且也有很多的新的特征被整合到MariaDB 5.5 中,而这些特征直到 5.6 版本才出现在MySQL中。所以在比较同样功能的MySQL和MariaDB的版本,同时在完成设计和QA方面的审核后,一个很明显的结论是MariaDB会是一个更好的产品。在大多数情况下,在选择 MariaDB的时候,人们会更多地考虑到功能方面的偏好。

MariaDB不仅仅是MySQL的一个替代品。它的主要目的是创新和提高MySQL的技术,MySQL5.6不是一个合适的创新基础平台,所以MariaDB团队就做了下面的事情:

引入了一些新功能(像Multi-source Replication多源复制,基于表的并行复制,Galera Cluster集群,Spider水平分片存储引擎,TokuDB存储引擎等),所以需要搞个新版本。

下个版本称作“MariaDB5.6”是不准确的,因为它不是基于MySQL5.6的,取而代之,MariaDB团队决定版本号调为10.0。

MariaDB和Percona有什么不同呢?

Percona是仅仅针对InnoDB引擎上做了性能上的改善(称为XtraDB),而MariaDB在集成了XtraDB存储引擎之外,还集成了更多的存储引擎,包括Aria、SphinxSE、TokuDB、Cassandra、CONNECT、SEQUENCE及Spider存储引擎等,并且在服务器层上做了大量改进,增加了多源复制和基于表的并行复制等。

二、MariaDB和MySQL的兼容性

MariaDB跟MySQL在绝大多数方面是兼容的,对于前端应用(比如PHP、Perl、Python、Java、.NET、MyODBC、Ruby、MySQL C connector)来说,几乎感觉不到任何不同。目前MariaDB是发展最快的MySQL分支版本,新版本的发布速度已经超过了Oracle官方的MySQL版本。

注:MariaDB10.0/10.1的GTID复制跟MySQL5.6不兼容。

在Oracle控制下的MySQL开发,有两个主要问题:

MySQL核心开发团队是封闭的,完全没有Oracle之外的成员参加。很多高手即使有心做贡献,也没办法做到。

MySQL新版本的发布速度,在Oracle收购Sun之后大为减缓。

Michael (Monty) Widenius有一个PPT,用数据比较了收购之前和之后新版本的发布速度,并表示有很多bugfix和新的feature,都没有及时加入到发布版本之中。

以上这两个问题,导致了各个大公司,都开发了自己定制的MySQL版本,包括Yahoo!、Facebook、Google、阿里巴巴和淘宝网等。MySQL是开源社区的资产,任何个人/组织都无权据为己有。为了更快速地发展MySQL,另外开分支是必须的。

三、MariaDB 10.0新增的功能

更多的存储引擎

除了包含标准的MyISAM、BLACKHOLE、CSV、MEMORY、ARCHIVE和MERGE等存储引擎外,MariaDB的源代码包和二进制包还包含以下额外的存储引擎:

Aria(增强版的MyISAM)
XtraDB(增强版的InnoDB)
FederatedX
OQGRAPH
SphinxSE[1]
IBMDB2I
TokuDB[2]
Cassandra
CONNECT
SEQUENCE
Spider[3]
PBXT

速度提升

在MariaDB5.3版本里,就已经对子查询进行了优化,并采用semi join半连接方式将SQL改写为了表关联join,从而提高了查询速度。

在MariaDB5.3版本里,引入了Group commit for the binary log组提交技术,简单的说,多个并发提交的事务加入一个队列里,对这个队列里的事务,利用一次I/O合并提交,从而解决了写日志频繁刷磁盘的问题。

在MariaDB10.0版本里,引入了基于表的多线程并行复制技术,如果主库上1秒内有10个事务,那么合并一个I/O提交一次,并在binlog里增加一个cid = XX 标记,当cid的值是一样时,Slave就可以进行并行复制,通过设置多个sql_thread线程实现。在MySQL5.5版本里是单进程串行复制,通过sql_thread线程来恢复主库推送过来的binlog,这样会产生一个问题,主库上大量的写操作,从库就有可能会出现延迟。在MySQL5.6是基于库级别的并行复制,MySQL5.7是基于表级别的并行复制。

在MariaDB5.5版本里,引入了线程池thread pool技术,线程池的连接复用,减少了建立连接的开销,减少了CPU上下文切换,非常适合高并发php短连接应用场景(例如使用开源电商平台ECSHOP秒杀业务场景)。

在处理内部的临时表,MariaDB用Aria引擎代替了MyISAM引擎,这将使某些GROUP BY和DISTINCT请求速度更快,因为Aria有比MyISAM更好的缓存机制。

扩展和新功能

时间精确到微秒级别

提供了虚拟列(函数索引)

在MariaDB5.2版本里,就已经提供了虚拟列(函数索引),但直到MySQL5.7版本才支持。

kill命令扩展

在MariaDB5.3版本里,又对kill命令进行了扩展,可以指定某个user用户,杀死所有查询

修改表结构可显示执行进度

提供了动态列(可以存储JSON格式)

在MariaDB5.3版本里,就已经提供了动态列(可以存储JSON格式),但直到MySQL5.7版本才支持。

提供了多源复制,但直到MySQL5.7版本才支持。

支持GTID同步复制。

创建了用户支持创建角色role权限。

通过show processlist可以查看内存占用。

执行create or replace table 等于先执行drop操作,再执行create操作。

执行delete from table returning命令可删除前返回删除的记录。

慢查询日志slow log里增加了explain执行计划。

四、总结

MariaDB是甲骨文MySQL的加强版本,因此已有的系统不需要任何修改就可以运行,就像使用Percona Server一样。

MariaDB社区版和企业版的源代码都是开源的,并且所有功能都是免费开放,不用担心功能上有阉割,但甲骨文MySQL企业版延伸套件采取封闭源代码且需要付费。此外,MariaDB相比MySQL拥有更多的功能、更快、更稳定、BUG修复更快。