java笔试题算法-oryx:简单的实时大规模机器学习基础设施

时间:2024-06-22 19:42:20
【文件属性】:

文件名称:java笔试题算法-oryx:简单的实时大规模机器学习基础设施

文件大小:11.15MB

文件格式:ZIP

更新时间:2024-06-22 19:42:20

系统开源

java笔试题算法概括 Oryx 开源项目提供了简单、实时的大规模机器学习基础设施。 它实现了商业应用中常用的几类算法:协同过滤/推荐、分类/回归和聚类。 它可以使用 . 它还通过 HTTP API 实时提供对这些模型的查询,并且可以近似地更新模型以响应新数据。 模型以格式交换。 它不是库、可视化工具、探索性分析工具或环境。 Oryx 代表了 和 项目的统一延续。 Oryx 应该被认为是 alpha 软件; 它可能有错误,并且会以不兼容的方式改变。 建筑学 Oryx 主要做两件事:构建模型和服务模型。 这些是两个独立组件的职责,分别是计算层和服务层。 计算层 计算层是一个离线的批处理过程,它根据输入数据构建机器学习模型。 它的操作在“世代”中进行,其中模型是根据某个时间点的输入快照构建的。 结果是随着时间的推移,模​​型输出的连续性,由输入的累积连续性构建而成。 计算层是一个长时间运行的基于 Java 的服务器进程。 它可以独立于服务层用于构建模型,甚至可以离线“评分”模型(例如为离线用户生成推荐)。 输入到达 HDFS,模型作为 PMML 文件写入 HDFS。 输入数据可以由服务层收


网友评论