文件名称:node-hadoop-streaming-utils:NodeJS 的 Hadoop 流工具
文件大小:13KB
文件格式:ZIP
更新时间:2024-06-22 04:09:19
JavaScript
NodeJS 的 Hadoop 流工具 一组函数,可让您轻松编写 hadoop 作业。 新思科技 // mapper.js (count word example) var hadoopUtils = require('hadoop-streaming-utils'); hadoopUtils.iterateJsonLines(function(line) { var words = line.split(/\s+/); words.forEach(function(word) { // using emitJson instead of emit allows to preserve variable type hadoopUtils.emitJson(word, 1); }); }); // reducer.js var ha
【文件预览】:
node-hadoop-streaming-utils-master
----.travis.yml(48B)
----package.json(772B)
----tests()
--------run-examples.js(2KB)
----examples()
--------build-inverted-index()
--------count-words-in-json()
--------count-words-in-text-async()
--------count-words-in-text()
----.gitignore(12B)
----lib()
--------hadoop-streaming-utils.js(4KB)
----README.md(4KB)