*:Clojure数据分析Shell-使用Clojure从输入流进行交互式数据分析

时间:2024-06-11 13:27:09
【文件属性】:

文件名称:*:Clojure数据分析Shell-使用Clojure从输入流进行交互式数据分析

文件大小:103KB

文件格式:ZIP

更新时间:2024-06-11 13:27:09

Clojure

冲突 一个clojure项目,用于在REPL中快速交互分析结构化文本文件(例如:日志,csv等)。 定义一个具有匹配文本正则表达式的代表性结构,然后将文件加载到内存中。 在开始耗时的Hadoop或Spark作业之前,这对于识别趋势并从较小的数据集(约数百万行)中获得洞察力很有用。 数据透视,频率和计数/收集功能具有用于单线程/多线程执行的标志。 通过*,可以轻松快捷地确定特定值存在多少次,或者可以识别数百万行数据中的公共数据字段。 这包括性能宏,用于大致确定JVM将何时优化目标方法(sweetspot)的执行。 立即尝试将[*“ 1.5.2”]添加到您的项目中 简单用法 将来自文本/ csv / json / etc流或文件的数百万行转换为内存,如下所示: 05042013-13:24:13.005|sample-server|1.0.0|info|Search,Z


网友评论