商业智能的复兴
在Web 2.0的光环下,商业智能(Business Intelligence,BI)2.0可能相形见拙,但却是不可忽视的。现
在,让我们从务实的角度了解一下BI最近的一些进展,看看这些新变化是如何使BI更易用、更经济、以及更贴近商
业需求的。在过去的两到三年中,BI最显著的变化是供应商前景。供应商巨头(如:微软、SAP、IBM和甲骨文)
凌驾于独立供应商(如:Business Objects和Cognos)之上。IBM收购了Cognos;甲骨文并购了Hyperion;
SAP则收购了Business Objects;软件巨无霸微软的BI路线对面向中小企业市场的供应商构成很大的威胁。除了
这些BI市场的复杂变化,一些重大的BI技术革新也正在酝酿之中。
在本文中,我们就集中讨论一下其中的三个突破:搜索技术;软件即服务(SaaS);和操作型BI。
为了更好地理解这些技术是如何被实施以及企业用户以何种方式接触到这些技术的,我们必须先了解提供这些技术
的供应商。对这个技术领域的所有供应商进行全面的调研几乎是不可能的;
在本文中,我们要讨论的是BI领域的革新。
传统的BI解决方案以一个数据仓库或数据市场(用于生成报告和分析的单一业务领域数据库)为基础。数据仓库
专为高性能的查询处理而设计;通常包含基于业务需求的摘要。提取,转换和加载(ETL)过程可定期把数据从运
营数据源转到数据仓库;传输频率取决于等待时间需求。从数据提取到把它们加载到目标数据源,ETL过程还包括
数据清理和整合。联机分析处理(OLAP)通过创建立方体(cubes)提供高效的数据访问;数据立方体是汇总多个
维度数据的数据结构,它为商务用户提供了分析环境。报告和查询环境支持对数据仓库/数据市场历史数据进行预
定义的或即期查询。
经过多年的发展,BI已是一个成熟的技术领域。但是,随着世界范围内的商业模式的演变和发展,新的想法和
方法也在不断推陈出新。
追寻真理或者说“真理的一个版本”。虽然有点啰嗦,但也许是对BI的最好诠释。说到这个版本,它是基于搜
索和查询操作的。BI是一个数据密集型的环境,不论是一个简单的报告还是复杂的多维度分析,每个操作都需要过
滤数以万计的数据,以找到业务问题的最佳解决方案。
在传统的BI环境中,搜索会涉及创建结构化的数据源(数据仓库,数据市场,OLAP立方体)和应用适合这个数
据结构的查询机制。例如,结构查询语言(SQL)和多维度表达式(MDX)是查询存储在数据库或OLAP立方体中数
据的常用方法。
搜索空间的创新包括在非结构化和不同的数据源之间的高效搜索,新的存储机制,新的用户体验方式,以及多语
种高级搜索功能。很多企业都面临结构化和非结构化内容以及数据仓库和ETL过程的高维护成本等问题。因此,在
搜索不同种类数据方面的推陈出新就变得非常重要了。
Endeca 的MDEX TM技术平台使跨关系型数据库、数据仓库和非结构化内容的数据搜索成为可能。该技术以自描述
记录为基础。每个自描述记录都是一个属性值对(attribute-value pair)。基于这种灵活性,存储在文档中的
事实数据可被立即应用于分析。 导引式基于概要的搜索假设用户最初不知道将使用何种查询。这种方法扩大了企
业中的BI受众群,因为用户无需对内在的元数据或数据模型有很深入的了解。
FAST是搜索领域的又一个创新者。FAST的Contextual Insight使用实体来定义搜索范围。搜索把多个实体(如姓
名、地点等)整合在一起,以便为用户的问题找到解决方案。FAST还支持自然语言处理内容和高级语言功能。对
于需要处理大型文档(出版物、新闻稿、传媒文件等)的企业来说,FAST的高级语言功能对他们十分有帮助。
Information Builders 把Google Appliance的搜索技术和它自己的BI数据集成技术结合在一起。WebFOCUS
Magnify允许用户使用通用的关键词搜索把企业的Web内容和企业数据结合在一起。这可帮助用户结合基于企业历
史数据的BI信息进一步了解在线商务活动。
SaaS: 托管式BI
大多数中小企业都无法承受BI项目的高实施成本和长实施期。为了帮助企业用户解决在BI实施中遇到的困难,
SaaS不再需要用户去搭建数据仓库和OLAP立方体。针对已实施了BI解决方案的企业,SaaS可保证以最少的实施时
间和成本为其提供新的BI功能。为了实施包含SaaS模型的BI解决方案,不同来源的数据被发送给托管服务系统。
这个ETL式的过程可把数据结构化。当完成企业数据的初始加载后,托管服务的客户可逐渐更新数据。
SAS Solutions OnDemand 专为高等教育机构、金融服务机构和市场营销部门提供分析服务。OnDemand Business
Intelligence 软件包可根据关系型数据和OLAP立方体提供多方面的报告和分析功能。SAS还提供租用选项以便于
用户在企业内使用SAS的软件。
Business Objects OnDemand 包含一个数据仓库和ETL过程。知道Business Objects的人一定不会对universe感到
陌生。它是数据仓库的商务界面。作为客户界面,Crystalreports.com 可支持多种报告类型和仪表板。
用户可从Oco的 On-Demand Business Intelligence 及其两项专利技术中获得收益:一个是适用于ETL的Connect
,另一个是适用于商业实体和数据仓库的匹配过程的Intelligent Data Schema 。SaaS模型还包括适用于零售业
的解决方案。
Host Analytics可提供业务绩效管理服务。用户还可通过认证的方式购买这些服务。这些个性化服务特别适合希
望升级现有BI解决方案的企业用户。
操作型BI
数据集成等待时间可根据商业需求的不同而变化。对于基于历史数据的传统BI报告和分析系统而言,等待数天或
数周都是很常见的。而对于需要实时数据的操作型报告和分析应用系统来说,以小时、分钟、甚至是秒来计算的
等待时间更合适。例如,对于一个根据销售和需求情况预测商品再定购的预测系统来说,它所需要的销售数据应
该越新越好(至多应该是数小时前的)。折扣等营销活动可导致某些商品销售量的骤然增长。这些变化可引发采
购订单系统中的自动再定购活动,或者向负责再定购的部门发出警报通知。历史信息可用于预测需求模式。然而
,操作型数据是用于识别实时状态(或接近实时状态)的异常活动,以便及时解决低可利用性的问题。操作型BI
还与实时报告有关。这需要从操作系统中导出数据,以较少应用系统的查询负担。
现在,要求把操作活动与BI内容相结合的呼声越来越多。但是,我们必须了解的是:不是数据仓库中的所有数据
都必须是最新的;实时和分析数据集成相结合是服务企业需求的最佳手段。在进行实时数据集成时,数据清洗须
被控制在最小程度(或不存在)。当然,在数据被导入到应用系统中时,其质量必须得到保证。
IBM Cognos Now! 包含一个已配置好的服务器和操作型BI所需的所有组件。它还可通过SaaS支持托管服务。串流
服务器可支持交易信息和历史数据的连续数据集成。业务规则执行引擎使基于操作活动生成警报通知成为可能。
分析服务器包括查询和分析引擎;汇总数据被保存在服务器中以省去更新数据仓库的麻烦。
Informatica的 PowerCenter 8.5 特别为满足实时数据需求而设计。PowerCenter实时版把批量处理和新的实时功
能结合在一起,并运用平行处理技术来解决性能限制问题。数据高效并行功能把PowerCenter和数据库的分区功能
匹配在一起,这使硬件资源的性能最佳化。 增量数据抽取(CDC)提供了一种连续的数据集成方法。这种方法可
用于识别数据源的变化,以触发数据库中的数据传输。
总结
综上所述,利用最新的硬件和软件技术,BI正站在革新的前沿。Google所带来的变革已触及多个软件行业领域—
—BI也不例外。高级搜索技术为访问复杂的企业数据提供了更直观的方法。以服务为导向的业务模式使企业可以
更低的成本和更短的时间实施BI解决方案。通过操作型BI的新技术,BI的潜力正在被不断转化为行动。