一.概述
在做javaWeb项目的过程中,前端提交的数据到后台,难免会遇到乱码问题,那么乱码问题是如何产生的呢?
由于浏览器和服务器都是国外人最早开发,规范也是国外定的,无论是浏览器还是服务器的默认编码都是拉丁ISO-8859-1,在欧美国家都支持,因此浏览器在把前端数据编码后,通过二进制流传输到后台,服务器(tomcat)接收,以ISO-8859-1的方式进行解码,就没有任何问题,当中文出现后,一个中文汉子可能是三个字节或者两个字节,那么用ISO-8859-1编码就会把一个汉子切割成1/2或者1/3,出现乱码问题。
为了解决这个问题,开始出现了GBK编码解码方式,专门应对中文。问题就解决了。但是假如出现韩文,日文,中东等其他各种文字,怎么办呢,国际相关组织就一起制定了UTF-8,支持世界上所有的文字编码和解码的问题,俗称万维码。
二.解决方式1(若乱码参数多,就比较低效)
浏览器默认编码为ISO-8859-1,后端Servlet接收请求参数,按照ISO-8859-1进行解码,得到二进制流,然后再用UTF-8编码。
示例代码:
// 获得请求参数
String queryString = request.getQueryString();
// 按照ISO-8859-1方式解码
byte[] bytes = queryString.getBytes("ISO-8859-1");
// 按照UTF-8编码
String param = new String(bytes,"UTF-8");
三.解决方式2(此种方式只支持get方式请求)
修改服务器(tomcat)配置:在server.xml中,默认为ISO-8859-1(没有显示出来),我们可以添加上UTF-8
四.解决方式3(此种方式只支持post方式请求)
在servlet直接设置请求参数编码--推荐
//设置请求参数编码
request.setCharacterEncoding("UTF-8");
五.如果post和get同时出现乱码,结合方式2和方式三使用
六.响应乱码--响应
// 设置MIME类型
response.setContentType("text/html");
// 设置编码
response.setCharacterEncoding("UTF-8");
//设置编码(简写)
response.setContentType("text/html;charset=utf-8");