文件名称:skale:高性能分布式数据处理引擎
文件大小:1000KB
文件格式:ZIP
更新时间:2024-05-12 12:14:13
nodejs machine-learning cluster aws-s3 parquet
高性能的分布式数据处理和机器学习。 Skale在Java脚本中提供了高级API,并在NodeJS之上提供了优化的并行执行引擎。 特征 Spark类引擎的纯JavaScript实现 多个数据源:文件系统,数据库,云(S3,Azure) 多种数据格式:CSV,JSON,列(Parquet)... 50名高级操作员构建并行应用程序 机器学习:可扩展的分类,回归,聚类 在nodeJS REPL Shell中交互运行 Docker,简单本地模式或完全分布式模式 非常快,请参阅 快速开始 npm install skale 字数示例: var sc = require ( 'skale' ) . context ( ) ; sc . textFile ( '/my/path/*.txt' ) . flatMap ( line => line . split ( ' ' ) ) . m