NodeJs中的非阻塞方法

首先我们利用NodeJs先构建一个基本的服务器。

index.js

var requestHandler = require("./requestHandler");  
var server = require("./server");  
  
var route = {  
    "/hello": requestHandler.hello,  
    "/upload": requestHandler.upload  
};  
  
server.start(route);

server.js

var http = require("http");  
var url = require("url");  
  
exports.start = function(route) {  
    var server = http.createServer(function(req, res) {  
          
        var pathName = url.parse(req.url).pathname;  
          
        var handler = route[pathName];  
          
        if (handler) {  
              
            console.log("Through path:" + pathName + ":" + new Date().getTime());  
              
            handler(res);  
              
        } else {  
            res.writeHead(404, {"Content-Type": "text/plain"});  
            res.end();  
        }  
    });  
  
    server.listen(8088);  
};

requestHandler.js

exports.hello = function(res) {  
  
    res.writeHead(200, {"Content-Type": "text/plain"});  
          
    res.write("say hello.");  
          
    res.end();  
};  
  
exports.upload = function(res) {  
    res.writeHead(200, {"Content-Type": "text/plain"});  
      
    res.write("upload");  
      
    res.end();  
};

在cmd中，键入node index.js即可启动。

但是，上面的代码是阻塞的。如果在createServer的回调函数中，有花费长时间的计算。那么会阻塞node.js的事件轮询。

NodeJS中，他的高效，关键在于快速的返回事件循环。

我们将requestHandler.js改造如下，在这个例子中，由于事件循环一直被sleep函数阻塞着，导致createServer的callback无法及时返回。

function sleep(milliSecond) {  
      
    var startTime = new Date().getTime();  
      
    console.log(startTime);  
      
    while(new Date().getTime() <= milliSecond + startTime) {  
          
    }  
      
    console.log(new Date().getTime());  
}  
exports.hello = function(res) {  
        sleep(20000);  
    res.writeHead(200, {"Content-Type": "text/plain"});  
          
    res.write("say hello.");  
          
    res.end();  
};  
  
exports.upload = function(res) {  
    res.writeHead(200, {"Content-Type": "text/plain"});  
      
    res.write("upload");  
      
    res.end();  
};

那么先键入http://localhost:8088/hello，后键入http://localhost:8088/upload。你会发现，upload虽然不需要花费太多时间，但是却要等到hello完成。

我们试图找寻异步调用的方法。比如formidable中的上传，经测试是非阻塞的。查看formidable的源码，发现最关键的是下面的代码：

IncomingForm.prototype.parse = function(req, cb) {  
  this.pause = function() {  
    try {  
      req.pause();  
    } catch (err) {  
      // the stream was destroyed  
      if (!this.ended) {  
        // before it was completed, crash & burn  
        this._error(err);  
      }  
      return false;  
    }  
    return true;  
  };  
  
  this.resume = function() {  
    try {  
      req.resume();  
    } catch (err) {  
      // the stream was destroyed  
      if (!this.ended) {  
        // before it was completed, crash & burn  
        this._error(err);  
      }  
      return false;  
    }  
  
    return true;  
  };  
  
  this.writeHeaders(req.headers);  
  
  var self = this;  
  req  
    .on('error', function(err) {  
      self._error(err);  
    })  
    .on('aborted', function() {  
      self.emit('aborted');  
    })  
    .on('data', function(buffer) {  
      self.write(buffer);  
    })  
    .on('end', function() {  
      if (self.error) {  
        return;  
      }  
  
      var err = self._parser.end();  
      if (err) {  
        self._error(err);  
      }  
    });  
  
  if (cb) {  
    var fields = {}, files = {};  
    this  
      .on('field', function(name, value) {  
        fields[name] = value;  
      })  
      .on('file', function(name, file) {  
        files[name] = file;  
      })  
      .on('error', function(err) {  
        cb(err, fields, files);  
      })  
      .on('end', function() {  
        cb(null, fields, files);  
      });  
  }  
  
  return this;  
};

在parse中，将head信息解析出来这段是阻塞的。但是真正上传文件却是在req.on(data)中，是利用了事件驱动，是非阻塞的。也就是说，他的非阻塞模型依赖整个nodeJS事件分派架构。

那么像sleep那样消耗大量计算，但是又不能依赖nodeJS分派架构的时候怎么办？

现在介绍一种，类似于html5 WebWorker的方法。

将requestHandler.js改造如下：

var childProcess = require("child_process");  
  
exports.hello = function(res) {  
      
    var n = childProcess.fork(__dirname + "/subProcess.js");  
      
    n.on('message', function() {  
          
        res.writeHead(200, {"Content-Type": "text/plain"});  
          
        res.write("say hello.");  
          
        res.end();    
    });  
      
    n.send({});  
};  
  
exports.upload = function(res) {  
    res.writeHead(200, {"Content-Type": "text/plain"});  
      
    res.write("upload");  
      
    res.end();  
};

并加入subProcess.js

function sleep(milliSecond) {
	
	var startTime = new Date().getTime();
	
	console.log(startTime);
	
	while(new Date().getTime() <= milliSecond + startTime) {
		
	}
	
	console.log(new Date().getTime());
}

process.on('message', function() {
	sleep(20000);
	process.send({});
});

测试，当hello还在等待时，upload已经返回。

结语：

大概在最近，我看了博客园上的很多NodeJs文章，大家都认为NodeJS是异步的。但是是何种程度的异步，这个概念就没有几篇文章讲对了。

其实NodeJS，他是一个双层的架构。C++，和javascript。并且是单线程的。这点尤其重要。Node其实是C++利用v8调用js命令，为了实现调用顺序维护了一个Event序列。因此，在一个js function内部，他的调用绝对会对其他的function产生阻塞。所以，网上所说的process.nextTick和setTimeout等，都不能够产生新的线程，以保证不被阻塞。他所实现的，不过是Event序列的元素顺序问题。相对于setTimeout，process.nextTick的实现要简单的多，直接加入Event序列的最顶层(有个啥啥事件)。而setTimeout是增加了一个c++线程，在指定的时间将callback加入Event序列

以Node的file io为例。他的readFile等函数，第二个参数是一个callback。那么node中第一件事就是记录下callback，然后调用底层c++，调用c++开始的过程，你可以看成是异步的。因为那已经到了c++，而不是js这块。所以，exec到callback为止是异步的，http.createServer到触发callback为止是异步的。还有很多，比如mysql的调用方法，不知道大家有没有看过源码，他就是socket发送命令，相信这个过程速度非常快。然后等待回调的过程Node用c++隐藏了，他也是异步的。

而我这篇文章想说明的是，如果再js端有花费大量时间的运算怎么办。就用我上面所说的方法，用js打开c++的线程，这个subprocess.js，不在node的event序列内部维护。是新的线程，因此不会阻塞其他的js function

秒客网

NodeJs中的非阻塞方法

相关文章