Node.js学习笔记（4）——除了HTTP（服务器和客户端）部分

很多node入门的书里面都会在介绍node特性的时候说：单线程，异步式I/O,事件驱动。

Node不是一门语言，它是运行在服务器端的开发平台，官方指定语言为javascript。

阻塞和线程:

线程在执行中如果遇到磁盘读写或网络通信（统称为 I/O 操作），通常要耗费较长的时间，这时操作系统会剥夺这个线程的 CPU 控制权，使其暂停执行，全力执行这个I/O操作，同时将资源让给其他的工作线程，这种线程调度方式称为阻塞。当其他完成之后，系统再恢复它对cpu的控制权，继续执行，这就是同步I/O或者阻塞式I/O。

所以这个模式之下，一个线程只能处理一个任务，要么是计算操作，要么是I/O操作等等。每当有多的请求发过来的时候，必须多加线程用来响应。

同样的，在异步式或者非阻塞式，系统对所有的I/O操作部阻塞，而是将这个耗费时间和资源的操作报告给OS，就继续执行下一条语句。当OS执行完毕这个I/O操作之后，以事件的形式通知原来请求挂载I/O操作的线程，线程会在特定的时间处理这个事情。所以，必线程必须有事件循环，不断检查有没有未处理的事件。

所以这个模式下，cpu的核心利用率永远是100%，I/O以事件形式通知。

总结：多线程同步式I/O阻塞模式通过加开线程响应更多的请求，好处是在多核cpu的情况下利用更多的核。

单线程模式异步式I/O非阻塞式一个线程永远在执行计算操作，这个线程使得cpu的核心利用率为100%。通过功能划分利用多核CPU。

这不是殊途同归吗？node采用后者的原因是什么呢？

单线程的牛逼之处在于不用创建更多的线程，也就是可以节省掉创建线程所浪费的资源。理论依据是加开一个新线程是非常耗费资源的。

关于异步式I/O（磁盘读写或网络通信）和事件驱动：

Node维护一个事件队列。

普通方式查询数据库操作：

res=db.query(‘select * from *’);

res.output();

node解决方案：

db.query(‘select * from *’, function (res){

res.output();

});

上面用到回调函数。实现非阻塞的方式请求。

弊端：一个完整的逻辑拆分为一个个事件，增加开发调试的难度；解决方案在后面提及。

两个通过node读取文件的例子fs.readFile api（异步式（回调函数来实现）和同步式）：

var fs = require('fs');

fs.readFile('file.txt', 'utf-8', function(err, data) {

if (err) {

console.error(err);

} else {

console.log(data);

}

});

console.log('end.');

var fs = require('fs');

var data = fs.readFileSync('file.txt', 'utf-8');

console.log(data);

console.log('end.');

两者输出数据的顺序不同。但是功能上没有什么区别。

关于模块：

node提供了exports和require两个对象。exports是模块公开的接口，require是用于获取这个模块的接口。

实例：

创建两个文件，一个当做外面的模块进行加载module.js，另一个是程序的入口文件getmodule.js.

module.js：

var name;

exports.setname=function(name){

name=name;

};

exports.sayhello(){

console.log(‘hello’+name);

};

getmodule.js:

var test=require(‘./module.js’);

test.setname(‘zhou’);

test.sayhello();

node getmodule.js

hellozhou

这就实现了接口的封装。module.js通过exports对象吧两个函数作为间接接口，在getmodule.js中通过require加载一个模块，之后就可以直接访问module中的exports对象的成员函数。

创建包：

包是模块基础上更深一步的抽象。

下面，可以将一个文件夹somepckage封装成一个模块。这个文件里里面要有一个index.js的文件，像module.js一样。然后在getmodule.js的文件里面，可以直接用var a=require(./package);

之后就可以通过a.xxxx来访问index.js里面的函数了。亲测可行。

题外话：关于全局安装依赖包和选择目录安装依赖包的优缺点。

全局的好处是可以提高程序重复利用的程度。避免同样的内容存在于多个副本。坏处是难以处理不同的版本依赖。

本地的好处是不会有不同程序依赖不同版本包的问题。同时减轻了包作者的API兼容性压力，但是缺陷是要一个个安装，非常繁琐。

node有全局和本地两种方式选择。

我们选择全局安装的理由有：本地安装不会注册path环境变量。例如在一个工程下安装的supervisor不会再另一个工程中发挥作用。

但是，使用全局安装下的包不可以通过require访问，这是一个悲伤的事。本地安装的可以通过require访问，但是不注册path环境变量；全局安装的不可以通过require访问，但是注册path环境变量。

总而言之，当我们要把某个包作为工程运行时的一部分时，通过本地模式获取，如果要

在命令行下使用，则使用全局模式安装。

还有就是怎样发布自己的npm包供全世界的人使用。

下面介绍node的核心模块。（全局变量，常用工具，事件机制，文件系统，http服务器和客户端）

全局变量

全局对象：可以在程序的任何部分访问的对象就是全局变量，类似于上面所说的全局安装。增加了path环境变量。

全局对象及其所有的属性就是全局变量，可以任意访问。

在浏览器javascript中，window就是全局变量，我们可以在任何地方使用window.open……

node中，全局对象是global。所有全局变量，都是global的属性。包括console，process等。

process：（全局变量，global的一个属性）

作用：用于描述当前node进程的对象，提供了一个与操作系统的简单接口。

process.argv：命令行参数数组，可以返回命令行的参数为一个数组，数组第一个元素为node，第二个为文件目录，以后为运行参数；

process.stdout：标准输出流，process.stdout.write()比console.log();更加接近底层；

process.stdin：标准输入流；

process.nextTick(callback)：为事件循环设置一项任务，node会在下次事件循环相应的时候调用callback。比setTimeout(fn,0)更加高效。

console：用于提供控制台标准输出

console.log():

console.log ('Hello world');

console.log('byvoid%diovyb');

console.log('byvoid%diovyb', 1991);

输出：

Hello world

byvoid%diovyb

byvoid1991iovyb

console.error():向标准的错误流输出

console.trace()：向标准错误流输出当前的调用栈。

常用工具

var util = require('util');

util.inherits

util.inherits(constructor, superConstructor)是一个实现对象间原型继承的函数。

util.inherits(Sub, Base);

sub继承自base;

util.inspect

util.inspect(object,[showHidden],[depth],[colors])是一个将任意对象转换为字符串的方法，通常用于调试和错误输出。它至少接受一个参数 object，即要转换的对象。

depth:最大递归层数，默认两层，null不限次数直到遍历完成。

事件驱动模块events

events是node最重要的模块。被几乎所有的模块依赖。

事件发射器

events模块只提供了一个对象：events.EventEmitter。核心就是事件发射与事件监听器的封装。

var events = require('events');

var emitter = new events.EventEmitter();