URL参数中有中文的处理

时间：2024-11-17 21:41:43

URL传递中文参数时的几种处理方式，总结如下：

1.将字符串转码：newString(“xxxxx”.getBytes(“iso-8859-1”),”utf-8”)

这种转码方式有很大的弊端，因为它是使用指定的字符集将此String编码为byte 序列，并将结果存储到一个新的byte 数组中，然后通过使用指定的字符编码将生成的byte 数组解码，构造一个新的String字符串。这种情况就有可能遇到的情况是，不能将一个汉字全部解码完。这样，前边的都能正常显示，但是最后一个字可能是乱码。所以不建议使用这种方式。

2.在传参前转码，接收参数后再转码回来。

这种方式有两种：

第一种：

传参前：使用(“xxxx”,“utf-8”)，将中文转为16进制字符。

接收参数后：使用(“xxxx”,“utf-8”)将16进制字符转为中文。

这种方式需要注意的是，在使用encode转码后，会出现特殊字符，这时候，就需要将特殊字符替换为相应的16进制。因为特殊字符在url路径中做为参数传递时，也是乱码。

第二种：

传参前：encodeURI(“xxxx”) 。

接收参数后：使用(“xxxx”,“utf-8”)将16进制字符转为中文。

这种方式需要注意的是，在使用encodeURI转码后，会出现特殊字符，这时候，就需要将特殊字符也转码,所以使用两次encodeURI，即：

encodeURI（encodeURI（“xxxx”））。

这两种转码方式是很好用的，所以很建议大家使用。

3.修改tomcat配置文件：

在Tomcat的安装目录下conf文件夹中的文件，将配置访问端口的地方加上URIEncoding=“utf8”即可。

 <Connector port="8080" maxThreads="150" minSpareThreads="25" maxSpareThreads="75" URIEncoding="GBK">

js对文字进行编码涉及3个函数：escape,encodeURI,encodeURIComponent，相应3个解码函数：unescape,decodeURI,decodeURIComponent

传递参数时需要使用encodeURIComponent，这样组合的url才不会被#等特殊字符截断。

例如：

<script language="javascript">('<a href="/?logout&aid=7& u='+encodeURIComponent("/bruce42")+'">退出</a& gt;');</script>

进行url跳转时可以整体使用encodeURI

例如：=encodeURI("/do/s?word=百度& ct=21");
js使用数据时可以使用escape

例如：搜藏中history纪录。
escape对0-255以外的unicode值进行编码时输出%u****格式，其它情况下 escape，encodeURI，encodeURIComponent编码结果相同。

最多使用的应为encodeURIComponent，它是将中文、韩文等特殊字符转换成utf-8格式的url编码，所以如果给后台传递参数需要使用encodeURIComponent时需要后台解码对utf-8支持（form中的编码方式和当前页面编码方式相同）

escape不编码字符有69个：*，+，-，.，/，@，_，0-9，a-z，A-Z

encodeURI不编码字符有82个：!，#，$，&，'，(，)，*，+，,，-，.，/，:，;，=，?，@，_，~，0-9，a- z，A-Z

encodeURIComponent不编码字符有71个：!， '，(，)，*，-，.，_，~，0-9，a-z，A-Z

javaScript中URL编码转换,escape() encodeURI() encodeURIComponent

在使用url进行参数传递时，经常会传递一些中文名的参数或URL地址，在后台处理时会发生转换错误。在有些传递页面使用GB2312，而在接收页面使用UTF8，这样接收到的参数就可能会与原来发生不一致。使用服务器端的urlEncode函数编码的URL，与使用客户端javascript的encodeURI函数编码的URL，结果就不一样。

javaScript中的编码方法：

escape()方法：
采用ISO Latin字符集对指定的字符串进行编码。所有的空格符、标点符号、特殊字符以及其他非ASCII字符都将被转化成%xx格式的字符编码（xx等于该字符在字符集表里面的编码的16进制数字）。比如，空格符对应的编码是%20。unescape方法与此相反。不会被此方法编码的字符： @ * / +

encodeURI() 方法：

把URI字符串采用UTF-8编码格式转化成escape格式的字符串。不会被此方法编码的字符：! @ # $& * ( ) = : / ; ? + '

encodeURIComponent()方法：

把URI字符串采用UTF-8编码格式转化成escape格式的字符串。与encodeURI()相比，这个方法将对更多的字符进行编码，比如 / 等字符。所以如果字符串里面包含了URI的几个部分的话，不能用这个方法来进行编码，否则 / 字符被编码之后URL将显示错误。不会被此方法编码的字符：! * ( )

因此，对于中文字符串来说，如果不希望把字符串编码格式转化成UTF-8格式的（比如原页面和目标页面的charset是一致的时候），只需要使用escape。如果你的页面是GB2312或者其他的编码，而接受参数的页面是UTF-8编码的，就要采用 encodeURI或者encodeURIComponent。

另外，encodeURI/encodeURIComponent是在javascript1.5之后引进的，escape则在 javascript1.0版本就有。

相关文章

