3月份数据库圈值得关注的事

时间:2021-03-16 01:14:41

3月份,逐渐春暖花开。数据库市场也热闹起来,腾讯云数据库打榜TPC-C破纪录,阿里云瑶池数据库峰会、OceanBase首届开发者大会等纷至沓来,向量数据库在AI热潮的带动下开始受到关注,部分数据库厂商公布新财报。以下是具体到详细内容:

3月份数据库圈值得关注的事

市场动态

腾讯云数据库打榜TPC-C破纪录

3月30日,据权威机构国际事务处理性能委员会(TPC,Transaction Processing Performance Council)官网披露,腾讯云数据库TDSQL成功通过TPC-C基准测试,性能达到每分钟8.14亿笔交易(tpmC),打破世界纪录。

3月份数据库圈值得关注的事

  • 数据库基准测试是对数据库产品能力的抽象,TPC-C基准测试是OLTP数据库性能测试领域的国际权威测试,相当于这个领域的“珠峰”,它通过模拟一个电商交易系统的常见操作来客观衡量数据库的能力,包括数据库的稳定性(8小时压测波动率)、性能(tmpC)以及成本(单tpmC的价格)等核心能力。

  • TDSQL测试的性能达到每分钟8.14亿笔交易(tpmC),打破世界纪录。8小时压测,tpmC的波动率一直处于0.2%以下,远远优于官方要求的2%。稳定保障超过8600亿总事务、期间保证4万亿条订单详细信息不出错。单tpmC的价格1.27亿元,远低于同类产品。

  • 此前,OceanBase曾在2019年和2020年两度打榜TPC,目前,该榜单前三名都是中国数据库产品,让我们看到了国产数据库的进步与突破。

  • 腾讯云数据库技术负责人潘安群指出,打榜不是目的,而是对过去的一个总结。

阿里云瑶池数据库峰会召开,迎接智能时代

3月24日,阿里云举办了推出瑶池品牌后的首次数据库峰会,阿里云数据库产品事业部负责人李飞飞表示,云数据库已经成为数据库行业的事实标准。他阐述了阿里云数据库的发展战略和方向,称其已做好了迎接智能时代的准备。

去年,在2022云栖大会上,阿里云发布了数据库独立品牌“瑶池”。在今年的瑶池数据库峰会上,李飞飞发布了阿里云数据库的最新动态。

  • 李飞飞认为,单一数据库已无法满足客户多元化、差异化的应用场景需求,云原生+一站式才是数据库的未来。他介绍,云原生数据库正在快速向一站式数据管理与服务演进,要不断为客户创造价值,就必须实现“云原生化、平台化、一体化、智能化”。目前瑶池数据库所有核心产品均已全面支持Serverless能力,包括开源托管产品RDS,通过了中国信通院Serverless评估认证,并已经在公共云上提供商业化服务。

  • 阿里云要打造云原生一站式数据管理与服务,未来做深基础、做强核心、做精场景以及做好体验。

  • 阿里云瑶池数据库核心战略产品包括AnalyticDB(适用于OLAP场景)、PolarDB(适用于OLTP场景)、Lindorm(适用于NoSQL场景)三款。

  • 会上,首次将云原生数据库PolarDB和云原生数据仓库AnalyticDB打通融合,形成“云原生一体化”的HTAP解决方案。

  • 阿里云还推出了全新多模数据库Lindorm AI引擎,在数据库内集成AI能力,对非结构化数据进行智能分析和处理,打造AIGC应用的数据基础设施。

  • 峰会上阿里云还与开源分析型数据库ClickHouse正式签订战略合作协议,成为ClickHouse在中国独家的云服务提供商,并提供具备独有企业能力的ClickHouse版本。此外,与国内数仓初创公司SelectDB战略签约。

OceanBase首届开发者大会对开发者表“诚意”

3月25日,企业级分布式数据库OceanBase举办了首届开发者大会,向开发者释放友好、善意和诚意。大会发布了四项〝开发者友好〞实践,强调“面向未来的单机分布式一体化”,第二届OceanBase数据库大赛圆满收官。同时,还发布OceanBase4.1版本,发布全新的OceanBase Logo,寓意“流动的数据”。

  • 开发者是数据库的最终用户,比较关注数据库的易用性。OceanBase在2021年对外开源,开源以后OceanBase除了做好内核核心竞争力,在提升易用性、提升用户体验、降低门槛和复杂性方面做了很多工作。比如去年推出单机分布式一体化架构的OceanBase4.0版,降低了分布式数据库的使用门槛,

  • OceanBaseCTO杨传辉认为开发者选择一个数据库时,首先会关注数据库的能力,而稳定可靠是很多0前面的那个1。其次,会考虑是不是未来数据库发展趋势,比如,是否是分布式,是否支持HTAP以及支持云等,三是开源数据库的社区活跃度,生态完善度。四是服务体验易用性等,要降低使用门槛。

  • OceanBase首次公布了四项“开发者友好”实践。一是,发布了OceanBase 4.1版本,4.1版本的内核能力及小规格综合读写性能得到提升。二是,推出向导式的安装部署。可实现2分钟部署demo环境,10分钟完成标准部署集群。同时,把开发工具(OCP Express)集成到社区版,降低运维成本。三是,推出场景化文档,解决文档“不好找、不好用”的问题。四是,宣布将整体研发流程迁移至外部,统一企业版和社区版代码分支,让每一位开发者看到代码进展。同时,宣布即将开源三大开发者工具(ODC、OCP Express和MySQL binlog service)。

  • 杨传辉指出,公有云、多云、混合云一定是未来数据库领域最大的技术趋势,OceanBase 符合技术趋势,不仅是云原生的,还是多云原生,能够部署在多云平台,甚至是一些混合云平台,对用户提供完全一致的使用体验。他认为开放的存储计算分离是多云原生的必然路径。

AI浪潮下向量数据库受到关注

ChatGPT爆发引发的新一轮AI热潮对算力有了更广泛的需求,Nvidia成了赢家。而一种的新的NoSQL数据库-向量数据库或将受益于本轮AI浪潮受到更多关注,进一步发展。

  • Nvidia首席执行官黄仁勋在其GTC主题演讲中谈到了向量数据库的重要性,他说向量数据库对于建立专有大型语言模型的组织来说将是至关重要的。

  • 在Nvidia的GPU技术大会上,向量数据库初创公司Zilliz宣布了最新版本Milvus 2.3。该公司说,当与Nvidia GPU适配时,Milvus 2.3的运行速度比Milvus 2.0快10倍。向量数据库还可以在GPU和CPU的混合体上运行,据说这还是第一次。

  • 天云数据CEO雷涛认为,深度学习被认为是最有效的非结构数据处理方式之一。非结构数据经过深度学习模型的处理,会被向量化。海量非结构数据的分析处理被转化为对海量向量的近似搜索。虽然处理图片、视频、语音和文字的深度学习模型各不相同,但最终的向量处理需求却是相同的,所以向量库对AI有很好的支撑。数据库的发展从关系型数据库到NoSQL再到NewSQL,所追求的是数据库操作的便捷性。向量数据库并不支持SQL操作,在使用上会成为一个门槛。

阿里巴巴组织变革设立六大业务集团,具备条件的业务可独立上市

3月28日,阿里巴巴集团董事会主席兼首席执行官张勇发布全员信《唯有自我变革,才能开创未来》,启动新一轮公司治理变革。构建“1+6+N”的组织结构,即在阿里巴巴集团之下,设立阿里云智能、淘宝天猫商业、本地生活、菜鸟、国际数字商业、大文娱等六大业务集团和多家业务公司,并分别建立各业务集团和业务公司的董事会,实行各业务集团和业务公司董事会领导下的CEO负责制,对各自经营结果负总责。未来,具备条件的业务集团和公司,都将有独立融资和上市的可能性。

国务院机构改革组建国家数据局

**、国务院近日印发了《*机构改革方案》,其中明确了组建国家数据局。根据该方案,国家数据局将负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等,由国家发展和改革委员会管理。省级*数据管理机构结合实际组建。

财报和融资

Snowflake 2023 财年 Q4 营收 5.89 亿美元,净亏损同比扩大

3 月 2 日,美国云数据仓库公司 Snowflake 公布了该公司 2023 财年第四季度及全年财报。报告显示,Snowflake 第四季度总营收为 5.890 亿美元,与上年同期的 3.838 亿美元相比增长 53%;净亏损为 2.075 亿美元,与上年同期的净亏损 1.322 亿美元相比有所扩大。

MongoDB公司公布2023财年业绩,同比增长 47%

MongoDB2023财年全年总收入为12.84 亿美元,同比增长 47%。其中订阅收入为12.351 亿美元,同比增长 47%;服务收入为4890 万美元,同比增长 54%。全年毛利润为9.347 亿美元,毛利率为 73%,而去年同期为 70%。其中 Atlas 收入同比增长 50%,占第四季度总收入的 65%。截至2023 年 1 月 31 日,拥有超过 40800 名客户。

内存数据库厂商 DragonflyDB 获得2100万美元融资

2023年3月21日,内存数据库初创公司 DragonflyDB Inc 宣布获得 2100万美元融资,同时推出其数据库的最新版本 Dragonfly 1.0,兼容 Redis 和 Memcached API,该版本增加了几个新的可靠性和数据管理功能,据称其性能是 Redis 的25倍。

产品与解决方案

Pigsty v2 发布

3月4日,Pigsty v2 发布,从开箱即用的数据库发行版变为本地优先的RDS PG开源上位替代。

据悉,PIGSTY 的缩写全称,是 PG in GREAT STYLE,意思就是 :让 PG 进入全盛状态。

蚂蚁集团云原生时序数据库 CeresDB 1.0 正式发布

3月7日消息,蚂蚁集团的云原生时序数据库 CeresDB 1.0 正式发布,达到生产可用标准。

CeresDB 1.0 核心特性如下:

  • 存储引擎:支持列式混合存储、高效 XOR 过滤器

  • 云原生分布式实现了计算存储分离(支持 OSS 作为数据存储,WAL 实现支持 OBKV、Kafka);支持 HASH 分区表

  • 部署与运维:支持单机部署、支持分布式集群部署、支持 Prometheus + Grafana 搭建自监控

  • 读写协议:支持 SQL 查询与写入;实现了 CeresDB 内置高性能读写协议,提供多语言 SDK;支持 Prometheus,可以作为 Prometheus 的 remote storage 进行使用

  • 多语言读写 SDK:实现了Java、Python、Go、Rust四种语言的客户端SDK

拓数派发布PieCloudDB「云上云」版,向公有云迈出第一步

3月14日,数据库初创公司拓数派发布了基于新一代云原生数仓虚拟化打造的全新PieCloudDB「云上云」版,向公有云迈出第一步,当天基于阿里云构建公有云数据仓库服务正式上线。

拓数派创始人兼CEO冯雷(Ray Von)介绍,新一代云原生数仓虚拟化,可将多个数仓统一整合到一个高可用的云虚拟数仓,打通多云的数据管道,数据计算资源按需扩缩容,提升数仓的敏捷性和弹性,助力企业降低数仓管理复杂度,实现数量级增加可计算数据空间的同时,数量级降低数仓成本,打开无限数据计算空间,推进AI/BI到下一个精度。未来拓数派将围PieCloudDB,打造产品生态、社区生态及商业生态,构建共创共赢的生态体系。

云原生数据库 Amazon Aurora Serverless v2在中国区域上线

3月15日消息,亚马逊云科技宣布无服务器数据库服务 Amazon Aurora Serverless v2 在由光环新网运营的亚马逊云科技中国(北京)区域和由西云数据运营的亚马逊云科技中国(宁夏)区域正式可用。新一代 Amazon Aurora Serverless v2 可在几分之一秒内自动扩展到数十万个事务。

据悉,Amazon Aurora Serverless v2 同时兼备 Amazon Aurora 的高可用性、性能和弹性,以及低延迟和快速查询等功能。使用 Amazon Aurora Serverless v2 无需预付费用,客户只需为使用的数据库容量付费。

Apache Doris 1.2.3 Release 版本正式发布

3月20日,Apache Doris 1.2.3 Release 版本正式发布,在新版本中包含超过 200 项功能优化和问题修复。同时,1.2.3 版本作为 1.2 LTS 的迭代版本,更加稳定易用,社区建议用户升级到这个版本。

功能更新包括JDBC Catalog、Elasticsearch Catalog、Hive Catalog、动态分区优化、优化 BE 的线程模型,如JDBC Catalog支持通过 JDBC Catalog 连接到另一个 Doris 数据库,支持通过参数 only_specified_database 来同步指定的数据库,优化 JDBC Catalog 的读取性能。

新版本修复了部分 Unique Key 模型 Merge-On-Write 表的问题;修复了部分 Compaction 相关问题;修复了部分 Delete 语句导致的数据等问题。

StoneDB-5.7-v1.0.3版本正式发布

3月20日,StoneDB-5.7-v1.0.3 版本正式发布,新版本对 StoneDB 的主备能力进行了优化,进行了新一轮的生态适配,提高了主从同步性能,同时修复了一批已知 Bug。

The Others

openGauss加入 CNCF Landscape

3月5日,openGauss加入CNCF Landscape,从属于Database类。截至2023年3月5日,CNCF Landscape 汇集了 1174 个项目,3,645,319个stars,市值 20.7万亿 美金,资金669亿美金,表明广大开发者和使用者对该项目的关注和重视。

为了更好的管理和推广云原生生态, CNCF 在2016年成立 Landscape 项目,旨在为原生应用这提供一个资源地图,帮助企业和开发人员快速了解云原生体系的全貌。

校企联手,港科大(广州)创邻图数据联合实验室正式成立

3月30日,香港科技大学(广州)与浙江创邻科技有限公司(简称“创邻科技”)合作共建的“图数据联合实验室”在香港科技大学(广州)校园内正式揭牌成立。未来,双方将围绕万亿级大图神经网络计算框架、海量数据的时序图处理、分布式原生图数据库事务及性能优化等前沿图技术领域研究展开深入合作,发挥校企双方优势,提升国内技术研究水平,推动产学研协同创新发展。