NodeJs系列一:神奇的nodejs

时间:2021-10-24 18:51:50
  1. nodejs是什么
  2. nodejs能解决什么问题
  3. 非阻塞型I/O及事件环机制
  4. 什么时候使用nodejs
  • nodejs是什么

  Node.js是让Javascript脱离浏览器运行在服务器的一个平台(或者叫框架),不是语言;运行在浏览器外不用考虑头疼的Javascript兼容性问题采用单线程、异步IO与事件驱动的设计来实现高并发(异步事件也在一定程度上增加了开发和调试的难度);Node.js内建一个HTTP服务器,所以对于网站开发来说是一个好消息;

  事实上,在实现 Node.js 之初,作者 Ryan Dahl 并没有选择 JavaScript,他尝试过 C、Lua,皆因其欠缺一些高级语言的特性,如闭包、函数式编程,致使程序复杂,难以维护。而 JavaScript 则是支持函数式编程范型的语言,很好地契合了 Node.js 基于事件驱动的编程模型。加之 Google 提供的 V8 引擎,使 JavaScript 语言的执行速度大大提高。最终呈现在我们面前的就成了 Node.js,而不是 Node.c,Node.lua 或其他语言的实现。

  nodejs不是一个Javascript应用,而是一个用c++语言编写的一个JavaScript运行环境,Node.js采用的Google Chrome浏览器V8引擎,性能很好;同时还提供了许多系统级的API,比如像文件操作,网络编程等。浏览器端的Javascript代码在运行时会受到各种安全性的限制,对客户系统的操作有限。相比之下,Node.js则是一个全面的后台运行时,为Javascript提供了其他语言能够实现的许多功能。

Node.js在设计上也是比较创新,它以单进程,单线程模式运行(这和Javascript的运行方式是一致的),事件驱动机制是Node.js通过内部单线程高效率地维护事件循环队列来实现的,没有多线程的资源占用和上下文切换,这意味着面对大规模的http请求,Node.js凭借事件驱动搞定一切,习惯了传统语言的网络服务开发人员可能对多线程并发和协作非常熟悉,但是面对Node.js,我们需要接受和理解它的特点。

  • nodejs能解决什么问题

  Node.js的首要目标是提供一种简单的、用于创建高性能服务器的开发工具,并且在该服务器中科院运行各种应用程序。

  现在让我们来看一下现在流行的服务器端语言中存在着什么问题。在Java、PHP、ASP.NET等语言中,都会为一个客户端连接创建一个新的线程,而每个线程大约要消耗2MB的内存,也就是说理论上,拥有8G内存的服务器能够同时支持的连接数为4000个左右。要让Web应用程序支持更多的用户,就需要相应增加服务器数量,这直接导致了Web应用程序的硬件成本上升。
  Node.js改变了客户端到服务器端的连接方法,从而解决了上述的问题。Node.js并不为每个客户端连接创建新的线程,而是为每个客户端连接触发一个在Node.js内部进行处理的事件(这就是node.js为什么叫做事件驱动的原因)。所以,node.js可以通过这一特性,同时处理多达几万个用户的客户端连接。

  • 非阻塞型I/O及事件环机制(又叫事件轮询)

  首先要弄明白是什么阻塞型I/O和非阻塞型I/O,才能继续我们的话题:

  阻塞I/O

  程序执行过程中必然要进行很多I/O操作,读写文件、输入输出、请求响应等等。I/O操作时最费时的,至少相对于代码来说,在传统的编程模式中,举个例子,你要读一个文件,整个线程都暂停下来,等待文件读完后继续执行。换言之,I/O操作阻塞了代码的执行,极大地降低了程序的效率。

  非阻塞I/O

  理解了阻塞I/O,非阻塞I/O就好理解。非阻塞I/O是程序执行过程中,I/O操作不会阻塞程序的执行,也就是在I/O操作的同时,继续执行其他代码(这得益于Node的事件循环机制)。在I/O设备效率还远远低于CPU效率的时代,这种I/O模型(非阻塞I/O)为程序带来的性能上的提高是非常可观的。

  我们可以这样理解,在Node中,除了代码,一切都是并行的!

  接下来我们来看看什么是事件环机制或者叫事件轮询(event loop)。

  Event Loop 是一个很重要的概念,指的是计算机系统的一种运行机制。

  想要理解Event Loop,就要从程序的运行模式讲起。运行以后的程序叫做进程(Process),一般情况下,一个进程一次只能执行一个任务。

  如果有很多任务需要执行,不外乎三种解决方法。

  (1),排队。因为一个进程一次只能执行一个任务,只好等前面的任务执行完了,再执行后面的任务。

  (2),新建进程。使用fork命令,为每个任务新建一个进程。

  (3),新建线程。因为进程太耗费资源,所以如今的程序往往允许一个进程包含多个线程,由线程去完成任务。

  以JavaScript语言为例,它是一种单线程语言,所有任务都在一个线程上完成,即采用上面的第一种方法。一旦遇到大量任务或者遇到一个耗时的任务,网页就会出现"假死",因为JavaScript停不下来,也就无法响应用户的行为。

  你也许会问,JavaScript为什么是单线程,难道不能实现为多线程吗?

  这跟历史有关系:

  JavaScript语言的一大特点就是单线程,也就是说,同一个时间只能做一件事。那么,为什么JavaScript不能有多个线程呢?这样能提高效率啊。

  JavaScript的单线程,与它的用途有关。作为浏览器脚本语言,JavaScript的主要用途是与用户互动,以及操作DOM。这决定了它只能是单线程,否则会带来很复杂的同步问题。

  比如,假定JavaScript同时有两个线程,一个线程在某个DOM节点上添加内容,另一个线程删除了这个节点,这时浏览器应该以哪个线程为准?

  所以,为了避免复杂性,从一诞生,JavaScript就是单线程,这已经成了这门语言的核心特征,将来也不会改变。

  为了利用多核CPU的计算能力,HTML5提出Web Worker标准,允许JavaScript脚本创建多个线程,但是子线程完全受主线程控制,且不得操作DOM。

所以,这个新标准并没有改变JavaScript单线程的本质。

  回到EventLoop:

  单线程就意味着,所有任务需要排队,前一个任务结束,才会执行后一个任务。如果前一个任务耗时很长,后一个任务就不得不一直等着。

  如果排队是因为计算量大,CPU忙不过来,倒也算了,但是很多时候CPU是闲着的,因为IO设备(输入输出设备)很慢(比如Ajax操作从网络读取数据),不得不等着结果出来,再往下执行。

  JavaScript语言的设计者意识到,这时主线程完全可以不管IO设备,挂起处于等待中的任务,先运行排在后面的任务。等到IO设备返回了结果,再回过头,把挂起的任务继续执行下去。

  于是,所有任务可以分成两种,一种是同步任务(synchronous),另一种是异步任务(asynchronous)。同步任务指的是,在主线程上排队执行的任务,只有前一个任务执行完毕,

  才能执行后一个任务;异步任务指的是,不进入主线程、而进入"任务队列"(task queue)的任务,只有"任务队列"通知主线程,某个异步任务可以执行了,该任务才会进入主线程执行。

  只要主线程空了,就会去读取"任务队列",这就是JavaScript的运行机制。这个过程会不断重复。

  如图:

  NodeJs系列一:神奇的nodejs

  • 什么时候使用nodejs

  经过上面对node.js的了解,那么node.js适合用户开发哪种应用呢?

  答案是:当应用需要处理大量并发的输入/输出(I/O),而在向客户端发出响应之前,服务器端并不需要进行非常复杂的处理,这个时候,我们应该考虑使用node.js来开发我们的应用。

  例如:
  聊天服务器
  综合服务类网站
  电子商务网站等