文件名称:TPC-H:benchmark sql database ( 大数据平台测评)
文件大小:2.22MB
文件格式:ZIP
更新时间:2024-05-28 08:51:23
XSLT
大数据系统上的TPC-H 1. TPC- H 主要目的是评价特定查询的决策支持能力,强调服务器在数据挖掘、分析处理方面的能力。 TPC- H 测试围绕22 个SELECT 语句展开,每个SELECT严格定义,遵守SQL- 92语法,并且不允许用户修改。标准中从4 个方面定义每个SELECT 语句,即商业问题、SELECT 的语法、参数和查询确认。这些SELECT 语句的复杂程度超过大多数实际的OLTP 应用,一个SELECT 执行时间少则几十秒,多则达15 小时以上,22 个查询语句执行一遍需数个小时。(附:) 2.步骤 (0)搭建环境,安装四种软件:Spark,Hive,Cassandra,GreenPlum (1)产生数据(有工具dbgen,可在Linux下编译) (2)建表,将数据导入 (3)执行查询(Q1-Q22,有现成的案例,如在上的,spark上的),这里可以使用脚本,将日志保