文件名称:Frames:表格数据的数据框
文件大小:1.62MB
文件格式:ZIP
更新时间:2024-05-21 10:48:28
Haskell
镜框 Haskell的数据帧 用户友好,类型安全,运行时高效的工具,用于处理从逗号分隔值(CSV)文件反序列化的表格数据。 数据的每一行的类型都是从数据推断出来的,然后可以从磁盘流式传输或在内存中使用。 我们提供流和内存中的接口,以有效地使用可以通过数据文件本身中的列名安全地建立索引的数据集。 在编译时检查这种列访问和操作的安全性。 用例 对于运行示例,我们将使用数据集的变体。 每行包括7列,但我们只想计算income与prestige的平均比率。 清理数据 如果您有一个CSV数据,其中每一列的值可以按一种类型进行分类,并且理想情况下您有一个标题行为每一列命名,那么您可能只是想避免写出与每一行相对应的Haskell类型。 Frames提供了TemplateHaskell机制,可以为数据集的每一行推断Haskell类型,从而避免了代码与数据悄然偏离的情况。 我们生成了一个定义集合,这些定