Pentaho开源BI组件详解

时间:2024-02-29 22:25:55
  • BI平台
    • Business Intelligence Server:商业智能服务器,它是整个Pentaho BI产品策略的重要基础件,也是Pentaho各类产品的重要门户,借助它集成BI产品线的其他产品集合
    • Pentaho Admin Console:内置在BI平台中的Pentaho Admin Console(管理控制台)是管理整个平台的重要后端软件
  • Pentaho Metadata元数据管理:基于CWM规范实施元数据管理,借助内置的Pentaho Metadata Editor能够快速实施元数据管理,并将metadata.xmi部署到BI平台中
    • Pentaho Metadata Editor(PME):对于大规模报表制作而言,报表模型是不可或缺的。Pentaho Metadata Editor,这是专门用来制作报表模型的工具,简称PME
  • Kettle ETL解决方案:Data Integration,用于各种场景的ETL工作,包括数据质量管理(Data Quality Management,DQM)
  • Pentaho Data Integration(PDI):为配合ETL工作的顺利实施,Kettle内置了大量的实用工具,比如用于设计转换和作业的Spoon IDE、执行转换的Pan、执行作业的Kitchen、添加新ETL执行引擎的Carte等
    • Spoon:设计转换及作业的集成开发环境
    • Pan:执行转换
    • Kitchen:执行作业
    • Carte:添加新的ETL执行引擎
    • Encr加密工具
    • ...
  • Mondrian OLAP引擎:针对多维分析而提供的既灵活又高性能的OLAP引擎,它能够部署到各种环境,而且支持的数据类型多种多样,比如关系数据库、Teradata等
    • Pentaho Aggregation Designer(PAD):为充分改善性能及降低聚合技术的采纳门槛,Pentaho提供了Aggregation Designer
    • Pentaho Schema Workbench(PSW):为简化OLAP Cube的定义和维护,Pentaho提供了Schema Workbench工具
  • Weka数据挖掘:内置了各种数据挖掘算法支持
    • Pentaho Data Mining(PDM)
  • Pentaho Reporting工具:支持各种类型报表的设计、开发工作,并直接将它们部署到Business Intelligence Server中。另外,报表的输出结果多种多样,比如PDF、Excel、HTML、RTF、文本文件等
    • Pentaho Report Designer(PRD)
  • Pentaho Dashboard:Pentaho Dashboard工具基于CDF(Community Dashboard Framework)项目架构而成,而且默认时,CDF内置在Pentaho BI服务器中
  • Pentaho Design Studio(PDS):开发工具,目前支持Action Sequence的图形化开发工作
  • Solution:
  • Spring Batch:一个轻量级的,完全面向Spring的批处理框架,可以应用于企业级大量的数据处理系统。Spring Batch以POJO和大家熟知的Spring框架为基础,使开发者更容易的访问和利用企业级服务。Spring Batch可以提供大量的,可重复的数据处理功能,包括日志记录/跟踪,事务管理,作业处理统计工作重新启动、跳过,和资源管理等重要功能。