spark-xml:Spark SQL和DataFrames的XML数据源

时间:2024-06-01 04:15:58
【文件属性】:

文件名称:spark-xml:Spark SQL和DataFrames的XML数据源

文件大小:167KB

文件格式:ZIP

更新时间:2024-06-01 04:15:58

Scala

Apache Spark的XML数据源 一个用于使用解析和查询XML数据的库,用于Spark SQL和DataFrames。 结构和测试工具大部分是从复制的。 该软件包支持以分布式方式处理无格式的XML文件,这与Spark中的JSON数据源限制嵌入式JSON格式不同。 从0.6.x开始,还支持Spark 3.x(需要Scala 2.12) 要求 spark-xml 火花 0.6.x + 2.3.x +,3.x 0.5.x 2.2.x-2.4.x 0.4.x 2.0.x-2.1.x 0.3.x 1.x 连结中 您可以在程序中的以下坐标处链接到该库: Scala2.11 groupId: com.databricks artifactId: spark-xml_2.11 version: 0.12.0 Scala2.12 groupId: com.databricks


网友评论