js和java中URI的编码和解码

时间:2023-12-27 13:17:19

js中对文字进行编码主要有三个函数:escape,encodeURI,encodeURIComponent;

对应解码为:unescape,decodeURI,decodeURIComponent

这里不在说基本概念(基本概念可以参考w3cohool,里面叙述的已经很详细了),而是侧重于使用和区别去说明:

一、js编码

  1. escape():该种方式对于汉字的编码和上面两个方法的编码结果不一样; 

  注释:ECMAScript v3 反对使用该方法,应用使用 decodeURI() 和 decodeURIComponent() 替代它。

  2. encodeURI() 函数:主要对整个url进行编码,和encodeURIComponent编码中文的返回结果是一样的。

  3. encodeURICompent()函数:主要对参数值进行编码处理

总结:

通过对三个函数的分析,我们可以知道:escape()除了 ASCII 字母、数字和特定的符号外,对传进来的字符串全部进行转义编码,因此如果想对URL编码,最好不要使用此方法。而encodeURI() 用于编码整个URI,因为URI中的合法字符都不会被编码转换。encodeURIComponent方法在编码单个URIComponent(指请求参数)应当是最常用的,它可以将参数中的中文、特殊字符进行转义,而不会影响整个URL。(并且这三个编码方式,如encodeURI无关中文编码,只是按照一定规则去编码 ???)

  5. 使用场景:

(1)传递参数时需要使用encodeURIComponent,这样组合的url才不会被#等特殊字符截断。

  例如:<script language="javascript">document.write('<a href="http://passport.baidu.com/?logout&aid=7&u='+encodeURIComponent("http://cang.baidu.com/bruce42")+'">退出</a&gt;');</script>

(2)进行url跳转时可以整体使用encodeURI

  例如:Location.href=encodeURI("http://cang.baidu.com/do/s?word=百度&ct=21");

(3)js使用数据时可以使用escape

  例如:搜藏中history纪录。

(4)escape对0-255以外的unicode值进行编码时输出%u****格式,其它情况下escape,encodeURI,encodeURIComponent编码结果相同。
  最多使用的应为encodeURIComponent,它是将中文、韩文等特殊字符转换成utf-8格式的url编码,

  所以如果给后台传递参数需要使用encodeURIComponent时需要后台解码对utf-8支持(form中的编码方式和当前页面编码方式相同)
  escape不编码字符有69个:*,+,-,.,/,@,_,0-9,a-z,A-Z
  encodeURI不编码字符有82个:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,A-Z

  encodeURIComponent不编码字符有71个:!, ',(,),*,-,.,_,~,0-9,a-z,A-Z

二、java编码

  1. java.net.URLDecoder.decode(request.getParameter("userName"),"utf-8");

  2. java.net.URLEncoder.encode(request.getParameter("userName"),"utf-8");

三、总结