论big data 3.0取代SAP HANA的可行性
一、big data 3.0简介
简言之,big data 3.0就是要实现SQL on big data,而且要兼顾性能、易用性和可扩展性。目前是“搜索引擎+大数据+SQL“这样一个融合为一体的趋势。
大家可以先看下我的另几篇博文:
1、基于FacebookPresto+Cassandra的敏捷式大数据
http://blog.csdn.net/china_world/article/details/39966699
2、中小企业的大数据技术路线选择(二)-Cassandra+Presto方案
http://blog.csdn.net/china_world/article/details/44304609
3、融合了大数据、搜索引擎及SQL的敏捷大数据方案bigdata 3.0:Presto+Elasticsearch
http://blog.csdn.net/china_world/article/details/50651824
二、SAP HANA简介
HANA是SAP研发和销售的分布式内存列数据库,兼有分布式,内存,列和关系数据库的有点。其作用是来替换SAP R3中的Oracle等其他数据库。HANA最早是BW的加速技术,后来发展而来,首先用于替换BW,用于支撑数据集市场景,满足企业的报表统计、查询及集市分析需求。
三、big data 3.0替换HANA的可行性
HANA的推出是SAP企图彻底摆脱对Oracle的依赖,并重磅出击数据库战场的利器。当然,其产品、实施和运维成本也是很高的,每Unit(64GB内存)公开报价100~200万,最大折扣也要40万左右。HANA实施顾问身价也要3000~5000/天。这些对实施了SAP ERP的企业来说,再上HANA,等于继续交赎金,不上,就要被撕票。那么,有没有HANA的替代方案呢?近来蓬勃发展的大数据技术让我们看到了希望,我近两年来一直在跟踪和研究替换HANA的相关技术。我在2014年11月份正式提出用Cassandra+Prest方案来替换HANA,并和BW/HANA的实施顾问专门讨论过可行性,结论:技术上可行。
截至到发稿时,Cassandra 3.x已经支持物化视图等数据仓库的概念,Presto 0.147已经增加了对Cassandra 3.X的支持。
四、总结
本人参加过HANA培训,了解过SAP HANA实施项目,目睹了企业所经历的一个个坑,也很不认同SAP惟利是图的商业模式。但HANA的确是个好东西,就易用性来说就需要开源的大数据好好学习。HANA虽好,但太贵,开放性不好,扩展性是个大问题,不适合处理大数据;开源大数据,覆盖了80%HANA功能,但易用性较差。打个形象的比喻,大数据如果是个巨大的矿藏,HANA是宝马,高大上,但不能挖矿;Presto+Cassandra是挖掘机,虽然模样简陋,但效率惊人。
亲爱的朋友们,如果你不是很有钱,有一个巨大的数据仓库,想要从中挖出金子来,你会选择HANA,还是Presto + Cassandra呢?我希望你会选择Presto + Cassandra,而我们已经做了两年的研发,实际案例即将落地。朋友们,Presto + Cassandra上见!!