文件名称:trck:TrailDB的查询引擎
文件大小:2.39MB
文件格式:ZIP
更新时间:2024-02-21 07:47:20
c big-data compiler state-machine event-data
trck : trck查询引擎 trck是一种根据个人用户行为向TrailDB查询聚合指标的工具。 典型用例: 计算基于行为的KPI(如跳出率) 归因 从离散时间序列数据中提取特征以进行机器学习 查询示例: 查找在click类型事件后5秒钟内没有page view类型事件的情况数 查找为广告系列X反弹的所有用户会话 查找在网站上花费超过5分钟的用户会话数 目录 总览 trck是一种领域特定的语言,它定义了一个有限状态机1来查找数据中的模式。 这些程序被编译为高度优化的并行本机代码。 trck还包括许多更高级别的数据感知优化,以使处理尽可能高效,例如,通过提前查看数据并跳过没有机会完全匹配条件的部分。 资料模型 trck程序处理的数据类型是一系列带有时间戳的事件:日志文件或浏览历史记录是一个常见示例。 trck使用作为存储引擎,该存储引擎经过优化,可轻松存储大量此类历史记录,从而可以轻松地逐一处理它们。 当然,始终可以直接使用TrailDB API来分析该数据。 但是,当您需要匹配路径中的复杂模式时,这通常很麻烦且容易出错。 尤其是当您需要同时跟踪许多路径的当前匹配状态时,数