文件名称:systemds:用于端到端数据科学生命周期的开源ML系统
文件大小:7.32MB
文件格式:ZIP
更新时间:2024-03-31 10:59:55
系统开源
注意: SystemDS已合并回Apache SystemML,成为 (2020年3月27日)。 系统DS 概述: SystemDS是用于端到端数据科学生命周期的通用系统,从数据集成,清理和功能工程到有效的本地和分布式ML模型培训,再到部署和服务,都可从其实现。 为此,我们旨在为(1)数据科学生命周期的不同任务以及(2)具有不同专业知识的用户提供具有R形语法的声明性语言堆栈。 这些高级脚本被编译为本地,内存CPU和GPU操作以及Apache Spark上的分布式操作的混合执行计划。 与提供均质张量或2D数据集的现有系统相反,并且为了服务于整个数据科学生命周期,基础数据模型是DataTensor,即张量(多维数组),其第一维可能具有异类且嵌套架构。 文档: 状态和构建: SystemDS仍处于pre-alpha状态。 原始代码库是于2018年9月从 1.2派生的。我们将继续支持基于矩阵