文件名称:paxquery:基于 Apache Flink 的 XQuery 处理器
文件大小:3.58MB
文件格式:ZIP
更新时间:2024-06-20 14:18:44
Java
PAX查询 PAXQuery 是一个 XQuery 处理器,它构建在平台(以前称为之上。 它通过将 XQuery 转换为 Apache Flink 使用的 PACT 模型,自动并行化对大量 XML 文档的查询。 在用户输入 XQuery 查询之后,引擎会构建一个等效的代数运算符树,该树适用于嵌套元组。 运算符集包括导航、分组依据、聚合、选择、投影等。 构建并优化树后,引擎会将其编译为由隐式并行运算符(例如 Map、Reduce、Match、CoGroup 或 Cross)组成的 PACT 计划。 结果提供给 Apache Flink 平台,该平台负责 PACT 计划优化及其并行执行,例如通过 HDFS 或本地文件系统。 ##当前状态 目前 PAXQuery 处于 pre-alpha 状态。 我们支持可以在以下 ANTLR 4.2 文件中找到的 XQuery 子集: 、 和 。 虽然