JS中URL中的特殊字符问题:escape,encodeURI,encodeURIComponent

时间:2021-06-14 18:28:21

URI 编码方法

Global 对象的 encodeURI() encodeURIComponent() 方法可以对 URI Uniform ResourceIdentifiers ,通用资源标识符)进行编码,以便发送给浏览器。有效的 URI 中不能包含某些字符,例如空格。而这两个 URI 编码方法就可以对 URI 进行编码,它们用特殊的 UTF-8 编码替换所有无效的字符,从而让浏览器能够接受和理解。 其中, encodeURI() 主要用于整个 URI (例如, http://www.wrox.com/illegal value.htm ),而 encodeURIComponent() 主要用于对 URI 中的某一段(例如前面 URI 中的 illegal value.htm )进行编码。


它们的主要区别在于, encodeURI()不会对本身属于URI的特殊字符进行编码,例如冒号、正斜杠、
问号和井字号;而encodeURIComponent()则会对它发现的任何非标准字符进行编码。来看下面的例子。

var uri = "http://www.wrox.com/illegal value.htm#start";
//"http://www.wrox.com/illegal%20value.htm#start"
alert(encodeURI(uri));
//"http%3A%2F%2Fwww.wrox.com%2Fillegal%20value.htm%23start"
alert(encodeURIComponent(uri));

使用 encodeURI() 编码后的结果是除了空格之外的其他字符都原封不动,只有空格被替换成了 %20 。而 encodeURIComponent() 方法则会使用对应的编码替换所有非字母数字字符。这也正是可以对整个 URI 使用 encodeURI() ,而只能对附加在现有 URI 后面的字符串使用 encodeURIComponent() 的原因所在。 一 般 来 说 , 我 们 使 用 encodeURIComponent() 方 法 的 时 候 要 比 使 用 encodeURI() 更多,因为在实践中更常见的是对查询字符串参数而不是对基础 URI 进行编码。 encodeURI() encodeURIComponent() 方法对应的两个方法分别是 decodeURI() decodeURIComponent() 。其中, decodeURI() 只能对使用 encodeURI() 替换的字符进行解码。

例如,它可将%20替换成一个空格,但不会对%23作任何处理,因为%23表示井字号(#),而井字号不是使用encodeURI()替换的。同样地,decodeURIComponent()能够解码使用encodeURIComponent()编码的所有字符,即它可以解码任何特殊字符的编码。来看下面的例子:

var uri = "http%3A%2F%2Fwww.wrox.com%2Fillegal%20value.htm%23start";
//http%3A%2F%2Fwww.wrox.com%2Fillegal value.htm%23start
alert(decodeURI(uri));
//http://www.wrox.com/illegal value.htm#start
alert(decodeURIComponent(uri));

这里,变量 uri包含着一个由encodeURIComponent()编码的字符串。在第一次调用decodeURI()输出的结果中,只有%20被替换成了空格。而在第二次调用decodeURIComponent()输出的结果中,所有特殊字符的编码都被替换成了原来的字符,得到了一个未经转义的字符串(但这个字符串并不是一个有效的URI)。
URI 方法 encodeURI()encodeURIComponent()decodeURI()decodeURIComponent()用于替代已经被ECMA-2623版废弃的escape()unescape()
方法。 URI 方法能够编码所有Unicode字符,而原来的方法只能正确地编码ASCII字符。


因此在开发实践中,特别是在产品级的代码中,一定要使用
URI 方法,不要使用escape()unescape()方法