关于 web中 使用 java.net.URLEncoder.encode 要编码两次呢 , js的encodeURIComponent 同理

时间:2023-12-13 19:23:14

因为在jsp中对中文进行了编码的时候用的是UTF-8的编码方式,而在servlet中调用request.getParameter();方法的时候使用服务器指定的原始编码格式(ISO-8859-1自动解码一次,所以前台编码一次后台解码一次而解码和编码的方式不用所以造成了乱码的出现,

这就类似于以下代码:
  1. String name=java.net.URLEncoder.encode("测试", "UTF-8");
  2. System.out.println(name);
  3. System.out.println(java.net.URLDecoder.decode(name, "ISO-8859-1"));

编码后的是%E6%B5%8B%E8%AF%95;
而用ISO-8859-1解码后的是???è?;
但是如果调用的是

  1. System.out.println(java.net.URLDecoder.decode(name, "UTF-8"));

则结果是打印“测试”;因为没有经过request.getParameter();方法,所以不会乱码
这就印证了 之前为什么我在servlet中调用java.net.URLDecoder.decode(request.getParameter("name"), "UTF-8")方法和调用java.net.URLDecoder.decode(request.getQueryString(), "UTF-8")所得到的结果是不一样的,就是由于在request.getParameter("name")之前会自动做一次解码的工作,而且是默认的ISO-8859-1。
所以,在使用java.net.URLEncoder.decode()和java.net.URLDecoder.decode(),的时候需要在前端页面中使用两次java.net.URLDecoder.decode()方法。
使用两次编码的过程相当于如下代码:
  1. String name=java.net.URLEncoder.encode("测试", "UTF-8");
  2. System.out.println(name);
  3. name=java.net.URLEncoder.encode(name,"UTF-8");
  4. System.out.println(name);
  5. name=java.net.URLDecoder.decode(name, "UTF-8");
  6. System.out.println(name);
  7. System.out.println(java.net.URLDecoder.decode(name, "UTF-8"));

输出为:
            %E6%B5%8B%E8%AF%95
            %25E6%25B5%258B%25E8%25AF%2595
            %E6%B5%8B%E8%AF%95
            测试
第一次编码后将汉字编码为%和字母数字的格式,而第二次编码的时候是对%字母数字进行编码,虽然解码的时候使用的是ISO-8859-1,但是对于%和字母数字而言用ISO-8859-1和UTF-8解码出来的是一样的,此时就回到了汉字被编码过一次的字符串了,当再次进行解码的时候使用UTF-8就回将它转会汉字;

 js的encodeURIComponent 的同理

ps:request.getParameter();方法会自动按照默认ISO-8859-1解码一次,所以要连续UTF-8编码两次,因为第二次UTF-8编码的%和数字与ISO-8859-1解码的结果都是一样的,所以第二次编码是关键