02第一个HTML剖析(声明字符集,utf8乱码问题)

时间:2022-12-22 22:46:13

<span style="font-size:18px;"><html>
<head>
	<title>
		标题 - title
	</title>
</head>
<body>
	内容 - content
</body>
</html></span>
在记事本中编写以上代码然后保存为ANSI字符集 .html后缀即可运行。

一般还要在文件头加上<!DOCTYPE HTML>,在head中加上<meta charset="UTF-8">

<!DOCTYPE HTML>
<html>
<head>
	<meta charset="UTF-8">
	<title>
		标题 - title
	</title>
</head>
<body>
	内容 - content
</body>
</html>

<!DOCTYPE HTML> 

!表示声明

DOC 表示文件document的缩写

TYPE 表示类型

意义是:声明文件类型是HTML

<meta charset="UTF-8">

meta 是head区的辅助标签可以理解为声明

charset 表示字符集

UTF-8 是一种针对Unicode可变字节编码

对文件和字符集声明之后将文件保存时候

注意:

1.如果不声明字符集charset,浏览器会检测页面的编码方式,也就是保存的编码方式,这时候一般不出现乱码

2.如果声明字符集在保存,选择文件保存编码方式必须与声明的编码方式一致,即如果声明为utf-8,保存时候依然选择utf-8,否则会出现乱码问题

原因:举例当编辑中文时候 以“我”字为例,编辑器按照保存的编码方式解析,此时会有一个唯一编码对应“我” 比如001,

而浏览器解析时会按照声明charset的编码方式解析,这种编码方式字符对应的编码号和保存时的编码号并不一致,这时候解析的001是其它字符,而非“我”,这样就出现

我——001——他      

保存“我”时候解析的001码,浏览器解析时候对应的却是他


最后,为了避免这一问题就需要保存和声明一致