文件名称:spark-solr:使用SolrJ从Solr作为Spark RDD读取数据并将对象从Spark索引到Solr的工具
文件大小:4.33MB
文件格式:ZIP
更新时间:2024-05-19 07:27:59
spark solr Scala
Lucidworks Spark / Solr集成 该项目包括用于从Solr作为Spark DataFrame / RDD读取数据以及使用SolrJ将对象从Spark索引到Solr的工具。 索引编制 例子 索引和查询Twitter数据 索引和查询纽约市黄色出租车CSV数据 配置和调优 查询参数 询问 领域 过滤器 行数 max_rows request_handler 使用分片内拆分提高读取并行度 分裂 split_field splits_per_shard flatten_multivalued dv skip_non_dv sample_seed sample_pct solr.params 指标参数 soft_commit_secs commit_within batch_size gen_uniq_key solr_field_types 查询时间