在B/S架构中,B端的主要载体是浏览器,浏览器的主要功能是向服务器请求资源,并把请求得到的内容展现出来,在本文中,我们主要讨论请求资源为html时,浏览器的工作原理。
要想了解浏览器的工作流程,必须先知道浏览器的组成,组成如下图:
由图可知,组成包含这几部分:
1.用户界面(user interface):包括地址栏,前进/后退按钮,书签目录等,即我们平常看到的浏览器界面(除了请求得到的内容页面);
2.浏览器引擎(browser engine):用来查询和操作渲染引擎的借口;
3.渲染引擎(rendering engine):用来显示请求的内容,例如,如果请求的是html,它负责解析html和css,并将解析结果显示出来。也被称为“浏览器内核”,不同浏览器主要的区别就在于渲染引擎的不同;
4.网络(networking):用来完成网络调用,例如http请求,平台无关;
5.UI后端(UI backend):用来绘制组合选择框等基本组件,具有不特定与某个平台的通用接口,底层使用操作系统的用户接口;
6.js解释器(javascript interpreter):用来解释执行js代码;
7.数据存储(data persistence):属于持久层,浏览器需要在硬盘中保存类似cookie的各种数据,html5定义了web database技术,这是一种轻量级完整的客户端存储技术;
工作流程:
渲染引擎首先通过网络获得请求文档内容(html)(通常以8k分块的方式完成)------》解析html以构建dom树-----》构建渲染树(rendering 树)-----》布局渲染树-----》绘制渲染树。
具体细节如下:
渲染引擎开始解析html,并将标签转化为dom树中的dom节点。然后,它解析外部的css文件及style标签中的样式信息。这些样式信息以及html中标签的可见性指令将用来构建渲染树。渲染树是由一些包含颜色大小等样式信息的矩形组成,它们将被按照正确的顺序显示到屏幕上。渲染树建好后,执行布局过程,它将确定每个节点在屏幕上的确切坐标。然后是绘制,即遍历渲染树,并使用ui后端层绘制每个节点。
这个过程是逐步完成的,渲染引擎会尽可能早的把内容显示出来,即解析一部分内容,就显示出来,其他内容可能还在网络下载。
至于浏览器如何解析html,如何构建dom树,渲染树,我们不做深究,下面我们举个例子来说明上述过程:
1. 用户输入网址(假设是个html页面,并且是第一次访问),浏览器向服务器发出请求,服务器返回html文件。
2. 浏览器开始载入html代码,发现<head>标签内有一个<link>标签引用外部CSS文件。
3. 浏览器又发出CSS文件的请求,服务器返回这个CSS文件。
4. 浏览器继续载入html中<body>部分的代码,并且CSS文件已经拿到手了,可以开始渲染页面了。
5. 浏览器在代码中发现一个<img>标签引用了一张图片,向服务器发出请求。此时浏览器不会等到图片下载完,而是继续渲染后面的代码。
6. 服务器返回图片文件,由于图片占用了一定面积,影响了后面段落的排布,因此浏览器需要回过头来重新渲染(reflow)这部分代码。
7. 浏览器发现了一个包含一行Javascript代码的<script>标签,赶快运行它。
8. Javascript脚本执行了这条语句,它命令浏览器隐藏掉代码中的某个<style>(style.display=”none”)。突然就少了这么一个元
素,浏览器不得不重新渲染这部分代码。
9. 终于等到了</html>的到来,浏览器泪流满面……
10. 等等,还没完,用户点了一下界面中的“换肤”按钮,Javascript让浏览器换了一下<link>标签的CSS路径。
11. 浏览器召集了在座的各位<div><span><ul><li>们,“大伙儿收拾收拾行李,咱得重新来过……”,浏览器向服务器请求了新的CSS文件,重新渲染页面。
需要注意的是:
1.IE下载的顺序是从上到下,渲染的顺序也是从上到下,下载和渲染是同时进行的。
2. 在渲染到页面的某一部分时,其上面的所有部分都已经下载完成(并不是说所有相关联的元素都已经下载完)。
3. 如果遇到语义解释性的标签嵌入文件(JS脚本,CSS样式),那么此时IE的下载过程会启用单独连接进行下载。
4. 样式表在下载完成后,将和以前下载的所有样式表一起进行解析,解析完成后,将对此前所有元素(含以前已经渲染的)重新进行渲染。
5. JS、CSS中如有重定义,后定义函数将覆盖前定义函数。
JS的加载
1. 不能并行下载和解析(阻塞下载)。
2. 当引用了JS的时候,浏览器发送1个js request就会一直等待该request的返回。因为浏览器需要1个稳定的DOM树结构,而JS中很有可能有
代码直接改变了DOM树结构,比如使用 document.write 或 appendChild,甚至是直接使用的location.href进行跳转,浏览器为了防止出现JS修
改DOM树,需要重新构建DOM树的情况,所以 就会阻塞其他的下载和呈现.
如何加快HTML页面加载速度
1. 页面减肥:
a. 页面的肥瘦是影响加载速度最重要的因素。
b. 删除不必要的空格、注释。
c. 将inline的script和css移到外部文件。
d. 可以使用HTML Tidy来给HTML减肥,还可以使用一些压缩工具来给JavaScript减肥。
2. 减少文件数量:
a. 减少页面上引用的文件数量可以减少HTTP连接数。
b. 许多JavaScript、CSS文件可以合并最好合并,人家财帮子都把自己的JavaScript. functions和Prototype.js合并到一个base.js文件里去了。
3. 减少域名查询:
a. DNS查询和解析域名也是消耗时间的,所以要减少对外部JavaScript、CSS、图片等资源的引用,不同域名的使用越少越好。
4. 缓存重用数据:
a. 对重复使用的数据进行缓存。
5. 优化页面元素加载顺序:
a. 首先加载页面最初显示的内容和与之相关的JavaScript和CSS,然后加载HTML相关的东西,像什么不是最初显示相关的图片、flash、视频
等很肥的资源就最后加载。
6. 减少inline JavaScript的数量:
a. 浏览器parser会假设inline JavaScript会改变页面结构,所以使用inline JavaScript开销较大。
b. 不要使用document.write()这种输出内容的方法,使用现代W3C DOM方法来为现代浏览器处理页面内容。
7. 使用现代CSS和合法的标签:
a. 使用现代CSS来减少标签和图像,例如使用现代CSS+文字完全可以替代一些只有文字的图片。
b. 使用合法的标签避免浏览器解析HTML时做“error correction”等操作,还可以被HTML Tidy来给HTML减肥。
8. Chunk your content:
a. 不要使用嵌套table,而使用非嵌套table或者div。将基于大块嵌套的table的layout分解成多个小table,这样就不需要等到整个页面(或
大table)内容全部加载完才显示。
9. 指定图像和table的大小:
a. 如果浏览器可以立即决定图像或table的大小,那么它就可以马上显示页面而不要重新做一些布局安排的工作。
b. 这不仅加快了页面的显示,也预防了页面完成加载后布局的一些不当的改变。
c. image使用height和width。