NodeJS 单线程 和java 多线程

时间:2021-05-15 03:59:20

看了许多关于node.js介绍,关于node.js的事件驱动模型,都没有说清楚。下面是个人的一些见解

先看一下Node.js的架构图,重点留意下线程池,每一个阻塞(每一个callback)会启动一个线程来处理它(这里的线程池类似点餐的厨房)

NodeJS 单线程 和java 多线程

Node.js应用程序在一个单线程的事件驱动模型中运行,在传统的网络模型中,请求进入一个web服务器,并被分配一个可用的线程。对于该请求的处理工作继续在该线程上进行,直到请求完成后并发出相应。

下面我来介绍一下node.js的事件模型。Node.js不是用多个线程为每个请求执行工作的,相反而是它把所有工作添加到一个事件队列中,然后有一个单独线程,来循环提取队列中的事件。事件循环线程抓取事件队列中最上面的条目,执行它,然后抓取下一个条目。当执行长期运行或有阻塞I/O的代码时,注意这里:它不会被阻塞,会继续提取下一个事件,而对于被阻塞的事件Node.js会从线程池中取出一个线程来运行这个被阻塞的代码,同时把当前事件本身和它的回调事件一同添加到事件队列。

当Node.js事件队列中的所有事件都被执行完成时,Node.js应用程序终止。


NodeJS宣称其目标是“ 旨在提供一种简单的构建可伸缩网络程序的方法 ”,那么它的出现是为了解决什么问题呢,它有什么优缺点以及它适用于什么场景呢?

本文就个人使用经验对这些问题进行探讨。


NodeJS带来的对系统瓶颈的解决方案

它的出现确实能为我们解决现实当中系统瓶颈提供了新的思路和方案,下面我们看看它能解决什么问题

1. 并发连接

举个例子,想象一个场景,我们在银行排队办理业务,我们看看下面两个模型

(1)系统线程模型:


NodeJS 单线程 和java 多线程


这种模型的问题显而易见,服务端只有一个线程,并发请求(用户)到达只能处理一个,其余的要先等待,这就是阻塞,正在享受服务的请求阻塞后面的请求了

(2)多线程、线程池模型:


NodeJS 单线程 和java 多线程


这个模型已经比上一个有所进步,它调节服务端线程的数量来提高对并发请求的接收和响应,但并发量高的时候,请求仍然需要等待,它有个更严重的问题:

回到代码层面上来讲,我们看看客户端请求与服务端通讯的过程:

NodeJS 单线程 和java 多线程


服务端与客户端每建立一个连接,都要为这个连接分配一套配套的资源,主要体现为系统内存资源,以PHP为例,维护一个连接可能需要20M的内存

这就是为什么一般并发量一大,就需要多开服务器

那么NodeJS是怎么解决这个问题的呢?

我们来看另外一个模型,想象一下我们在快餐店点餐吃饭的场景

(3)异步、事件驱动模型

NodeJS 单线程 和java 多线程


我们同样是要发起请求,等待服务器端响应;但是与银行例子不同的是,这次我们点完餐后拿到了一个号码,

拿到号码,我们往往会在位置上等待,而在我们后面的请求会继续得到处理,同样是拿了一个号码然后到一旁等待,接待员能一直进行处理。

等到饭菜做号了,会喊号码,我们拿到了自己的饭菜,进行后续的处理(吃饭)

这个喊号码的动作在NodeJS中叫做回调(Callback),厨房就相当于一个线程池,可以同时,烧菜和I/O,处理完成后继续执行后面的逻辑(吃饭),

这体现了NodeJS的显著特点,异步机制、事件驱动

整个过程没有阻塞新用户的连接(点餐),也不需要维护已经点餐的用户与厨师的连接

基于这样的机制,理论上陆续有用户请求连接,NodeJS都可以进行响应,因此NodeJS能支持比Java、PHP程序更高的并发量

虽然维护事件队列也需要成本,再由于NodeJS是单线程,事件队列越长,得到响应的时间就越长,并发量上去还是会力不从心

总结一下NodeJS是怎么解决并发连接这个问题的:

更改连接到服务器的方式,每个连接发射(emit)一个在NodeJS引擎进程中运行的事件(Event),放进事件队列当中,

而不是为每个连接生成一个新的OS线程(并为其分配一些配套内存)

2. I/O阻塞

NodeJS解决的另外一个问题是I/O阻塞,看看这样的业务场景:需要从多个数据源拉取数据,然后进行处理

(1)串行获取数据,这是我们一般的解决方案,以PHP为例

NodeJS 单线程 和java 多线程

假如获取profile和timeline操作各需要1S,那么串行获取就需要2S

(2)NodeJS非阻塞I/O,发射/监听事件来控制执行过程


NodeJS 单线程 和java 多线程


NodeJS遇到I/O事件会创建一个线程去执行,然后主线程会继续往下执行的,

因此,拿profile的动作触发一个I/O事件,马上就会执行拿timeline的动作,

两个动作并行执行,假如各需要1S,那么总的时间也就是1S

它们的I/O操作执行完成后,发射一个事件,profile和timeline,

事件代理接收后继续往下执行后面的逻辑,这就是NodeJS非阻塞I/O的特点

总结一下:

Java、PHP也有办法实现并行请求(子线程),但NodeJS通过回调函数(Callback)和异步机制会做得很自然

三. NodeJS的优缺点

优点:

1. 高并发(最重要的优点)

   缺点:

1. 不适合CPU密集型应用;因为此时CPU会被长时间占用,被阻塞的线程会全部无法处理。将会导致CPU时间片不能释放,使得后续I/O无法发起;

解决方案: 分解 大型运算任务为多个小任务(例如mapreduce、分布式的思想),使得运算能够适时释放,不阻塞I/O调用的发起;

2.  支持单核 CPU ,不能充分利用 CPU

3.  可靠性低,一旦代码某个环节崩溃,整个系统都崩溃

解决方案:(1) Nnigx 反向代理,负载均衡,开多个进程,绑定多个端口

(2) 开多个进程监听同一个 端口,使用cluster模块;

4.  开源组件库质量参差不齐,更新快,向下不兼容

5.  Debug 不方便,错误没有 stack trace

四. 适合NodeJS的场景

1. WESTful API

这是NodeJS最理想的应用场景,可以处理数万条连接,本身没有太多的逻辑,只需要请求API,组织数据进行返回即可。

它本质上只是从某个数据库中查找一些值并将它们组成一个响应。

由于响应是少量文本,入站请求也是少量的文本,因此流量不高,一台机器甚至也可以处理最繁忙的公司的 API 需求。

2. 统一Web应用的UI层

目前MVC的架构,在某种意义上来说,Web开发有两个UI层,一个是在浏览器里面我们最终看到的,另一个在server端,负责生成和拼接页面。


不讨论这种架构是好是坏,但是有另外一种实践,面向服务的架构,更好的做前后端的依赖分离。

如果所有的关键业务逻辑都封装成REST调用,就意味着在上层只需要考虑如何用这些REST接口构建具体的应用。

那些后端程序员们根本不操心具体数据是如何从一个页面传递到另一个页面的,他们也不用管用户数据更新是通过Ajax异步获取的还是通过刷新页面


例如个性化应用,每个用户看到的页面都不一样,缓存失效,需要在页面加载的时候发起Ajax请求,

NodeJS能响应大量的并发请求

总而言之,NodeJS适合运用在高并发、I/O密集、少量业务逻辑的场景

五. 结尾

其实NodeJS能实现几乎一切的应用

我们考虑的点只是适不适合用它来做


最后啰嗦一下 :node中不能阻塞,并不代表node外不能阻塞。于是 async eventproxy应运而生