spark-solr:使用SolrJ从Solr作为Spark RDD读取数据并将对象从Spark索引到Solr的工具

时间:2024-05-19 07:27:59
【文件属性】:

文件名称:spark-solr:使用SolrJ从Solr作为Spark RDD读取数据并将对象从Spark索引到Solr的工具

文件大小:4.33MB

文件格式:ZIP

更新时间:2024-05-19 07:27:59

spark solr Scala

Lucidworks Spark / Solr集成 该项目包括用于从Solr作为Spark DataFrame / RDD读取数据以及使用SolrJ将对象从Spark索引到Solr的工具。 索引编制 例子 索引和查询Twitter数据 索引和查询纽约市黄色出租车CSV数据 配置和调优 查询参数 询问 领域 过滤器 行数 max_rows request_handler 使用分片内拆分提高读取并行度 分裂 split_field splits_per_shard flatten_multivalued dv skip_non_dv sample_seed sample_pct solr.params 指标参数 soft_commit_secs commit_within batch_size gen_uniq_key solr_field_types 查询时间


网友评论