http请求和响应中,有时候我们接收到http请求做处理时发现从request获取的中午数据是乱码,还有的时候通过response输出中文数据到浏览器时也是中文乱码,这里网上整合了一些资料,都是比较好的
一、request接收的参数中文乱码:
乱码原因:Http请求传输时将url以ISO-8859-1编码,服务器收到字节流后默认会以ISO-8859-1编码来解码成字符流(造成中文乱码)
post请求:
假设提交请求的jsp页面是UTF-8编码
<%@ page language="Java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%>
解决方法1:在服务端获取参数前,先设置解码方式。
- //设置解码方式,对于简体中文,使用UTF-8解码
- request.setCharacterEncoding("UTF-8");
- request.getParameter("参数名");
解决方法2:Tomcat默认编码ISO8859-1,设置成其他的编码
- <Connector port="8080" protocol="HTTP/1.1"
- connectionTimeout="20000"
- redirectPort="8444"
- useBodyEncodingForURI="true" URIEncoding="UTF-8"/>
重点在 userBodyEncodingForURI 和 URIEncoding 这两个属性
下面来解释一下这两个属性的意义
useBodyEncodingForURI参数表示是否用request.setCharacterEncoding参数对URL提交的数据和表单中GET方式提交的数据进行重新编码,在默认情况下,该参数为false。
URIEncoding参数指定对所有GET方式请求进行统一的重新编码(解码)的编码。
URIEncoding和useBodyEncodingForURI区别是,
解决方法3:通过字符串和字节流转换时使用正确的编码获取中文参数URIEncoding是对所有GET方式的请求的数据进行统一的重新编码,
而useBodyEncodingForURI则是根据响应该请求的页面的request.setCharacterEncoding参数对数据进行的重新编码,不同的页面可以有不同的重新编码的编码
- String str = new String(request.getParameter("参数名").getBytes("iso-8859-1"), "utf-8");
get请求:
对于get请求,上面针对于post的请求的三种解决方法,只有第三种可以用,第一种和第二种并没有效果,这和tomcat的内部机制有关。
对于get请求,还有一个很笨拙的方法,不推荐使用,贴出来,以供了解:
- /获取请求里包含的查询字符串
- String rawQueryStr = request.getQueryString();
- out.println("原始查询字符串为:" + rawQueryStr + "<hr/>");
- //使用URLDecoder解码字符串
- String queryStr = java.net.URLDecoder.decode(
- rawQueryStr , "gbk");
- out.println("解码后的查询字符串为:" + queryStr + "<hr/>");
- //以&符号分解查询字符串
- String[] paramPairs = queryStr.split("&");
- for(String paramPair : paramPairs)
- {
- out.println("每个请求参数名、值对为:" + paramPair + "<br/>");
- //以=来分解请求参数名和值
- String[] nameValue = paramPair.split("=");
- out.println(nameValue[0] + "参数的值是:" +
- nameValue[1]+ "<hr/>");
- }
- </pre><p></p><p><span style="color:rgb(56,56,56); font-family:"Trebuchet MS",Helvetica,"Microsoft YaHei",Georgia,sans-serif; font-size:13px; line-height:23px">乱码原因:Http请求传输时将url以ISO-8859-1编码,服务器收到字节流后默认会以ISO-8859-1编码来解码成字符流(造成中文乱码)</span></p><p><span style="font-family:Trebuchet MS,Helvetica,Microsoft YaHei,Georgia,sans-serif; color:#383838"><span style="font-size:13px; line-height:23px">post请求:</span></span></p><p><span style="font-family:Trebuchet MS,Helvetica,Microsoft YaHei,Georgia,sans-serif; color:#383838"><span style="font-size:13px; line-height:23px">假设提交请求的jsp页面是UTF-8编码</span></span></p><p><span style="font-family:Trebuchet MS,Helvetica,Microsoft YaHei,Georgia,sans-serif; color:#383838"><span style="font-size:13px; line-height:23px"><%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%></span></span></p><p><span style="font-family:Trebuchet MS,Helvetica,Microsoft YaHei,Georgia,sans-serif; color:#383838"><span style="font-size:13px; line-height:23px">解决方法1:在服务端获取参数前,先设置解码方式。</span></span></p><p><span style="font-family:Trebuchet MS,Helvetica,Microsoft YaHei,Georgia,sans-serif; color:#383838"><span style="font-size:13px; line-height:23px"></span></span></p><pre name="code" class="java" style="color: rgb(56, 56, 56); font-size: 13px; line-height: 23px;">//设置解码方式,对于简体中文,使用UTF-8解码
- request.setCharacterEncoding("UTF-8");
- request.getParameter("参数名");
二、response返回的数据中文乱码:
首先,response返回有两种,一种是字节流outputstream,一种是字符流printwrite。
申明:这里为了方便起见,所有输出都统一用UTF-8编码。
先说字节流,要输出“中国",给输出流的必须是转换为utf-8的“中国”,还要告诉浏览器,用utf8来解析数据
- //这句话的意思,是让浏览器用utf8来解析返回的数据
- response.setHeader("Content-type", "text/html;charset=UTF-8");
- String data = "中国";
- OutputStream ps = response.getOutputStream();
- //这句话的意思,使得放入流的数据是utf8格式
- ps.write(data.getBytes("UTF-8"));
再说字符流,要输出中国,需要设置response.setCharacterEncoding("UTF-8");
- //这句话的意思,是让浏览器用utf8来解析返回的数据
- response.setHeader("Content-type", "text/html;charset=UTF-8");
- //这句话的意思,是告诉servlet用UTF-8转码,而不是用默认的ISO8859
- response.setCharacterEncoding("UTF-8");
- String data = "中国";
- PrintWriter pw = response.getWriter();
- pw.write(data);