文件名称:forml:数据科学项目的生命周期管理框架
文件大小:679KB
文件格式:ZIP
更新时间:2024-04-09 19:14:52
Python
格式 ForML是研究,实施和运营数据科学项目的框架。 使用ForML正式将数据科学问题描述为高级运算符的组成部分。 ForML将您的项目扩展为特定于给定生命周期阶段的任务依赖关系图,并使用其任何受支持的运行器执行它。 基于ForML构建的解决方案自然易于重用,扩展,重现或共享和协作。 不只是另一个DAG 尽管DAG (有向无环图)是ForML操作的核心,但由于以下原因,它在众多其他任务依赖项处理系统中脱颖而出: 它专门研究机器学习问题,即直接连接到流拓扑中。 高级运算符组合的概念,有助于将复杂的ML技术包装到简单的可重用单元中。 运行时依赖项的抽象,允许使用不同的技术运行相同的项目。 历史 ForML最初是一个开源项目,旨在应对数据科学研究向生产的不断痛苦的过渡。尽管有其他项目试图解决此问题,但它们通常要么是通用数据处理系统,但是其级别太低而无法提供现成的ML生命周期例程;另一方面,它