java中的URLEncoder.encode对应JS中用decodeURIComponent,js和java编码,解码

时间:2022-12-28 22:00:23

用get请求传中文,经常搞到乱码,这几天搞搞这个东西,总结一下,以方便以后处理这类的问题。

Java代码中的URLEncoder.encode方法和JS的encodeURIComponent功能差不多,它会将处字母和数字,以及*字符外的都编码成%xx形式。

JS的unescape和decodeURI都不能用来解码JAVA中URLEncoder.encode编码的字符串。

在JAVA代码中的URLEncoder.encode的字符串可以在JS中用decodeURIComponent还原成字符串。

在JAVA代码中可以用URLDecoder.decode(request.getParameter("param"),"UTF-8")来将在JS中用encodeURIComponent的参数还原成字符串。

========================================================

1、decodeURI()定义和用法

decodeURI() 函数可对 encodeURI() 函数编码过的URI 进行解码。

语法:decodeURI(URIstring)

参数 描述:URIstring 必需。一个字符串,含有要解码的 URI 或其他要解码的文本。

返回值:URIstring 的副本,其中的十六进制转义序列将被它们表示的字符替换。

2、encodeURI 方法

将文本字符串编码为一个有效的统一资源标识符 (URI)。

encodeURI(URIString)
必选的 URIString 参数代表一个已编码的 URI。

说明
encodeURI 方法返回一个编码的 URI。如果您将编码结果传递给 decodeURI,那么将返回初始的字符串。encodeURI 方法不会对下列字符进行编码:":"、

"/"、";" 和 "?"。请使用 encodeURIComponent 方法对这些字符进行编码。

-----------------------------------------------------------------------------------------------------------

3、decodeURIComponent()定义和用法:decodeURIComponent() 函数可对 encodeURIComponent() 函数编码的 URI 进行解码。

语法:decodeURIComponent(URIstring)

参数 描述:URIstring 必需。一个字符串,含有编码 URI 组件或其他要解码的文本。

返回值:URIstring 的副本,其中的十六进制转义序列将被它们表示的字符替换。

4、encodeURIComponent() 方法:
把URI字符串采用UTF-8编码格式转化成escape格式的字符串。与encodeURI()相比,这个方法将对更多的字符进行编码,比如 / 等字符。所以如果字符串里面包含了URI的几个部分的话,不能用这个方法来进行编码,否则 / 字符被编码之后URL将显示错误。不会被此方法编码的字符:! * ( )。

因此,对于中文字符串来说,如果不希望把字符串编码格式转化成UTF-8格式的(比如原页面和目标页面的charset是一致的时候),只需要使用escape。如果你的页面是GB2312或者其他的编码,而接受参数的页面是UTF-8编码的,就要采用encodeURI或者encodeURIComponent。

========================================================

示例代码如下:

JavaScript代码encode

functionfindNE(){
varnd = document.getElementById("NE").value;
nd = encodeURIComponent(encodeURIComponent(nd));
alert(nd);
$.fn.zTree.destroy("netree");
setting.async.url="common/getNeList.action?seachName="+nd; $.fn.zTree.init($("#netree"), setting); }

java代码decode

String serchName = request.getParameter("seachName");
System.out.println("serchName1::::::::::::::::::::::"+serchName);
if(StringUtils.isNotBlank(serchName)){
try{
serchName = java.net.URLDecoder.decode(serchName,"UTF-8");
}catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
}
System.out.println("serchName2::::::::::::::::::::::"+serchName);
在线转码工具http://tool.oschina.net/encode?type=4

escape encodeURI encodeURIComponent的使用和区别

escape(unescape),encodeURI(decodeURI)和encodeURIComponent(decodeURIComponent)都是用来编(解)码字符以利于在网络上传输和解析。

1. escape

把特殊字符(不包括 + - * / . _ @)转化成相应的ASCII表示法(%XX)或者Unicode表示法(%uXXXX)

  1. document.write(escape("+-*/._@ '()阳春三月"));

输出结果:
  +-*/._@%20%27%28%29%u9633%u6625%u4E09%u6708

从结果中可以看出,+-*/._@不会被编码,空格转成%20,单引号转成%27,圆括号转成%28和%29,四个汉字用Unicode编码成四个%uXXXX序列。

如果我们对escape的字符序列再次调用escape:

  1. document.write(escape(escape("+-*/._@ '()阳春三月")));

输出结果:
  +-*/._@%2520%2527%2528%2529%25u9633%25u6625%25u4E09%25u6708

可以看出,escape会编码已经escape过的字符%为%25

调用unescape进行解码:

  1. document.write(unescape(escape(escape("+-*/._@ '()阳春三月"))));

输出结果:
  +-*/._@%20%27%28%29%u9633%u6625%u4E09%u6708

再次调用escape进行解码:

  1. document.write(unescape(unescape(escape(escape("+-*/._@ '()阳春三月")))));

输出结果:
  +-*/._@ '()阳春三月

所以在编写代码时,要注意被操作字符序列是否已经escape或unescape过。

2. encodeURI和encodeURIComponent

和escape类似,不同的是
  a. 它们不会对(' tilde(加在西班牙语n字上的发音符号) ())编码:

  1. document.write(encodeURI("+-*/._@ '()"));

输出结果:
  +-*/._@%20'()

b. 它们编码Unicode字符也不同,输出为:%XX%XX or %XX%XX%XX

  1. document.write(encodeURI("阳春三月"));

输出结果:
  %E9%98%B3%E6%98%A5%E4%B8%89%E6%9C%88

encodeURI把每个中文字符都转成了%XX%XX%XX格式

3. encodeURI和encodeURIComponent区别:

encodeURIComponent会编码encodeURI不管的(, / ? : @ & = + $ #),其中,(+ / @)escape也不闻不问

  1. document.write(encodeURI(",/?:@&=+$#"));
  2. document.write(encodeURIComponent(",/?:@&=+$#"));

输出结果:
  ,/?:@&=+$#
  %2C%2F%3F%3A%40%26%3D%2B%24%23

总结:
  escape是元老级的方法,很多浏览器表示都支持,适用于html字符编码
  encodeURI和encodeURIComponent出道较晚,适用于uri字符编码,并且后者对很多URI中可能出现的特殊字符都进行编码