文件名称:featran:一个用于数据科学和机器学习的Scala功能转换库
文件大小:228KB
文件格式:ZIP
更新时间:2024-02-26 08:44:00
data scala spark tensorflow ml
菲特兰 Featran,也称为Featran77或F77(明白吗?),是一个用于功能转换的Scala库。 它旨在简化在数据科学和机器学习过程中进行要素工程的耗时任务。 它支持用于特征提取的各种集合类型以及用于特征表示的输出格式。 介绍 大多数功能转换逻辑需要两个步骤,一个是全局汇总以汇总数据,然后是一个逐元素映射以对其进行转换。 例如: 最小最大缩放器 汇总:全局最小值和最大值 映射:将每个值缩放为[min, max] 一站式编码器 汇总:不同的标签 映射:将每个标签转换为二进制向量 我们可以使用reduce和map以幼稚的方式实现它。 case class Point ( score