spark-tpcds-datagen:关于Apache Spark中TPC-DS的所有信息

时间:2021-04-09 06:30:03
【文件属性】:
文件名称:spark-tpcds-datagen:关于Apache Spark中TPC-DS的所有信息
文件大小:14.99MB
文件格式:ZIP
更新时间:2021-04-09 06:30:03
Scala 这是用于Apache Spark的TPCDS数据生成器,它与并包括用于Mac / Linux x86_64平台的预构建 。 为了检查TPCDS性能回归,每天在Google Spreadsheet( )中跟踪当前Spark主数据的基准结果(sf = 20)。 请注意,当前的master分支打算在Scala 2.12.x上支持 。 如果要在Spark 3.0.x中生成TPCDS数据,请使用 。 如何生成TPCDS数据 您可以在/tmp/spark-tpcds-data生成TPCDS /tmp/spark-tpcds-data : # You need to set `SPARK_HOME` to your Spark v3.0.1 path before running a command below $ ./bin/dsdgen --output-location /tmp/spark-

网友评论