<> 书评

时间:2022-08-31 17:33:02

《SAP内存计算——HANA》又是一本在地铁里读完的书,最近阅读量大增,都是托了地铁的福了。

一年多以前就在ITPUB里发过帖子问“SAP HANA归根揭底到底是什么?”,那时通过一些网络上的文章对SAP HANA有了简单认识,但都了解的比较肤浅,通过这本书算是对SAP HANA有了通盘的认识,这里写一些我对SAP HANA的认识吧。

<<SAP内存计算——HANA>> 书评

SAP HANA是用来干什么的?

简单的讲SAP HANA就是用来提升大数据(TB级以上的数据量)量查询性能的一个数据管理平台,也就是主要为了提升OLTP(联机分析处理)任务的性能。

传统的关系型数据库主要是为了交易型业务系统(OTLP)设计的,对于大数据分析性业务往往力不从心,比如当数据库查询语句涉及的已不仅是查询或操纵一张关系表中的一条或几条记录,而且要对多张表中千万条记录的数据进行数据分析和信息综合,关系数据库系统已不能全部满足这一要求。你可以购买BI类的分析型软件来只做数据分析,但这就将企业的系统明确的划分为了OLTP和OLAP两个系统,这种做法虽然解决了分析性能问题,但是由于大量数据在系统间频繁复制和转换,更多的时间消耗在数据聚集过程,用户要得到精准的报表数据仍需要等待漫长的数据预处理过程。

SAP HANA是如何做到的

SAP HANA是硬件和和软件组合一体解决方案,使得客户分析海量数据,而且是以接近实时的方式来同步数据,不需要花费太多时间在数据传输上。SAP HANA与数据源无关,这表示你并不一定非得使用SAP的商务套间才能上HANA,任何数据库都可以与HANA对接。SAP HANA认证硬件厂商包含HP, IBM, 思科, 富士通,戴尔等(反正没有SUN,你懂的),注意这里的服务器是x86服务器,并不是性能更优的小型机或大型机。操作系统方面,SAP HANA目前只支持SUSE Linux,看起来像是对SUSE做了深度的订制。

SAP HANA通过其架构充分发挥了多CPU配合多大内存硬件架构所潜在的大性能。这个平台主要包含两个部分:1.内存数据库;2.内存计算引擎;通过这个平台,企业可以在业务运作期间基于海量、实时的详细信息分析业务运营情况,还可以探索和分析源于所有数据源的额全部交易数据和分析数据。

<<SAP内存计算——HANA>> 书评

关于这本书

这本书的作者是农夫山泉的CIO胡建,读书的过程中,始终感觉作者不像是以一个甲方的口吻在写书,更像是SAP官方的人来宣传。

书中有的文字是值得商榷的,比如书中提到,SAP HANA是基于Intel x86架构,目前x86服务器的运算能力已经远超过很多小型机。这句话就很不认同,是有一部分高配的x86服务器性能超过小型机,但是综合而言,小型机的性能还是要比x86服务器好很多的。另外书中大量的配图,实在对不住68元的标价,拿到书的第一感觉是这书是联机文档吗。不管如何,感觉这样的图书相信对HANA实施人员还是比较有用的,能够比较快速的了解HANA的体系。