关于header跳转之后的乱码问题

时间:2022-12-21 12:47:06
  • 关于header跳转之后的乱码问题

    http://www.360doc.com/content/11/0603/19/7052474_121495648.shtml

    问题:不同网站的跳转出现乱码,不同编码的页面传递参数也出现乱码

    搞清楚两个问题:

    1. URL文字本身的编码, 一般与你网页的编码一致;中文一般才用UTF-8、GBK、GB2312
    2. 什么是URL编码

    URL的编码规则

    • 大小写字母,数字不变
    • “.”, “-”, “*”, “_” 四个字符不变
    • 空格键编码为加号"+"
    • 其它所有字符被视为不安全字符,按所指定的编码方式编码(如果未指定则为默认为平台编码,浏览器或操作系统决定),以每字节十六进制形式表示出来,具体格式为”%xy”.xy为两个十六进制数,用来描述一个8位的字节.
    • RFC1738协议

    OK,无论网站使用什么平台,URL编码规则,都是一致的,所以不同网站进行页面跳转时,出现乱码问题,就是网站使用的编码不一致所引起的。

    URL解码-> 转换字符串的编码->URL编码

    一、PHP的解决方案:

    PHP字符串编码转换函数

    iconv() 函数

    Description string iconv ( string in_charset, string out_charset, string str )

    注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀:

    1. //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符;
    2. //IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。
     eg:$str = iconv("UTF-8","GB2312//TRANSLIT",$str);

    mb_convert_encoding() 函数

    Description string mb_convert_encoding ( string str, string to-encoding [, mixed from-encoding])

    注意:需要enable mbstring 扩展库。

    两者区别:mb_convert_encoding 中根据内容自动识别编码;mb_convert_encoding功能强大,但是执行效率比iconv差太多;

    总结:一般情况下用 iconv,只有当遇到无法确定原编码是何种编码时用 mb_convert_encoding 函数.

    URL编码解码函数

    urlencode函数
    该函数将传入的字符串参数进行URL编码。声明如下:

    string urlencode (string str)

    urlencode函数
    该函数将传入的字符串参数进行URL解码,返回解码后的字符串。声明如下:

    string urldecode (string str)

    其他的
    rawurlencode()
    rawurldecode()

    实例:

    <?PHP
    $url=$_GET['url'];
    $url = htmlspecialchars(urldecode($url));
    $keyword = iconv("UTF-8","GB2312//TRANSLIT",$url);
    $keyword = urlencode($url);
    header("Location: " . $url);
    ?>

    二、JavaScript的解决方案

    在使用url进行参数传递时,经常会传递一些中文名的参数或URL地址,在后台处理时会发生转换错误。在有些传递页面使用GB2312,而在接收页面使用 UTF8,这样接收到的参数就可能会与原来发生不一致。使用服务器端的urlEncode函数编码的URL,与使用客户端javascript的 encodeURI函数编码的URL,结果就不一样。

    javaScript中的编码方法:

    escape() 方法:
    采用ISO Latin字符集对指定的字符串进行编码。所有的空格符、标点符号、特殊字符以及其他非ASCII字符都将被转化成%xx格式的字符编码(xx等于该字符 在字符集表里面的编码的16进制数字)。比如,空格符对应的编码是%20。unescape方法与此相反。不会被此方法编码的字符: @ * / +

    英文解释:MSDN JScript Reference: The escape method returns a string value (in Unicode format) that contains the contents of [the argument]. All spaces, punctuation, accented characters, and any other non-ASCII characters are replaced with %xx encoding, where xx is equivalent to the hexadecimal number representing the character. For example, a space is returned as “%20.”
    Edge Core Javascript Guide: The escape and unescape functions let you encode and decode strings. The escape function returns the hexadecimal encoding of an argument in the ISO Latin character set. The unescape function returns the ASCII string for the specified hexadecimal encoding value.

    encodeURI() 方法:

    把URI字符串采用UTF-8编码格式转化成escape格式的字符串。不会被此方法编码的字符:! @ # $& * ( ) = : / ; ? + ‘

    英文解释:MSDN JScript Reference: The encodeURI method returns an encoded URI. If you pass the result to decodeURI, the original string is returned. The encodeURI method does not encode the following characters: “:”, “/”, “;”, and “?”. Use encodeURIComponent to encode these characters. Edge Core Javascript Guide: Encodes a Uniform Resource Identifier (URI) by replacing each instance of certain characters by one, two, or three escape sequences representing the UTF-8 encoding of the character

    encodeURIComponent() 方法:

    把URI字符串采用UTF-8编码格式转化成escape格式的字符串。与encodeURI()相比,这个方法将对更多的字符进行编码,比如 / 等字符。所以如果字符串里面包含了URI的几个部分的话,不能用这个方法来进行编码,否则 / 字符被编码之后URL将显示错误。不会被此方法编码的字符:! * ( )

    英文解释:MSDN JScript Reference: The encodeURIComponent method returns an encoded URI. If you pass the result to decodeURIComponent, the original string is returned. Because the encodeURIComponent method encodes all characters, be careful if the string represents a path such as /folder1/folder2/default.html. The slash characters will be encoded and will not be valid if sent as a request to a web server. Use the encodeURI method if the string contains more than a single URI component. Mozilla Developer Core Javascript Guide: Encodes a Uniform Resource Identifier (URI) component by replacing each instance of certain characters by one, two, or three escape sequences representing the UTF-8 encoding of the character.
    因 此,对于中文字符串来说,如果不希望把字符串编码格式转化成UTF-8格式的(比如原页面和目标页面的charset是一致的时候),只需要使用 escape。如果你的页面是GB2312或者其他的编码,而接受参数的页面是UTF-8编码的,就要采用encodeURI或者 encodeURIComponent。

    另外,encodeURI/encodeURIComponent是在javascript1.5之后引进的,escape则在javascript1.0版本就有。

    英文注释:The escape() method does not encode the + character which is interpreted as a space on the server side as well as generated by forms with spaces in their fields. Due to this shortcoming, you should avoid use of escape() whenever possible. The best alternative is usually encodeURIComponent().Use of the encodeURI() method is a bit more specialized than escape() in that it encodes for URIs [REF] as opposed to the querystring, which is part of a URL. Use this method when you need to encode a string to be used for any resource that uses URIs and needs certain characters to remain un-encoded. Note that this method  does not encode the ‘ character, as it is a valid character within URIs.Lastly, the encodeURIComponent() method should be used in most cases when encoding a single component of a URI. This method will encode certain chars that would normally be recognized as special chars for URIs so that many components may be included. Note that this method does not encode the ‘ character, as it is a valid character within URIs.

    三、jsp、servlet的解决方案
     
    在Servlet中,一般有参数传递的话,会设置页面接收参数和传递参数的编码。即下面两句:
     
    request.setCharacterEncoding("UTF-8");
    response.setCharacterEncoding("utf-8");
     
    一般情况下,大部分都会想到使用这个,但是这两句代码的位置有时却容易被忽视。正确的写法是,request.setCharacterEncoding("UTF-8"); response.setCharacterEncoding("utf-8");要放在
     
    PrintWriter out = response.getWriter();的后面。因为out对象初始化之后,再设置编码已经没有任何意义了!所以必须在out对象初始化之前进行编码的设置。

关于header跳转之后的乱码问题的更多相关文章

  1. 关于header跳转之后的乱码

    http://www.360doc.com/content/11/0603/19/7052474_121495648.shtml 问题:不同网站的跳转出现乱码,不同编码的页面传递参数也出现乱码 搞清楚 ...

  2. location跳转和header跳转的区别

    1:header("location:url") 跳转之前不能有任何输出,如果想在header之前有输出,则要修改php.ini文件.具体 output_handler =mb_o ...

  3. php header&lpar;&rpar;跳转

    test1.php <?PHP $g_user = "Jack"; echo $g_user; ?> test3.php <?PHP header('Locati ...

  4. header 跳转时报错误。Header may not contain more than a single header&comma; new line detected

    我在用php的header做跳转时,报错误. Header may not contain more than a single header, new line detected 先贴一下代码: c ...

  5. header&lpar;&rpar;跳转

    if ($toNews == 1) { header('Location:/ucenter/pageMailBox/2'); exit; } PHP跳转页面,用 header() 函数 定义和用法 h ...

  6. thinkPHP5&period;0中使用header跳转没作用

    我在controller中的方法中这样写: header("Location:".$url); 但是一直没动静,不会跳转,最后还是官方文档解决了 https://www.kancl ...

  7. php 两次encodeURI&comma;解决浏览器跳转请求页乱码报错找不到页面的bug

    Not Found The requested URL /index.php/XXX/mid/97329240798095910/bname/3000T/D/sname/水泥粉磨/un ...

  8. 【Azure 应用服务】App Service站点Header头中的中文信息显示乱码?当下载文件时,文件名也是乱码?

    问题描述 在本地开发的站点,响应头中的中文可以正常显示,部署到Azure App Service站点后,响应中文乱码.通过多方面验证,在代码中设置Response的Headers会显示乱码,而直接配置 ...

  9. java开发中中文乱码总结

    1.jsp页面内容显示乱码 这种乱码原因很简单,一般的工具或解码程序对中文字符解析时采用默认的解码方式: <%@ page contentType="text/html; charse ...

随机推荐

  1. TCP&sol;IP基础

    TCP/IP 是用于因特网 (Internet) 的通信协议. 计算机通信协议是对那些计算机必须遵守以便彼此通信的规则的描述. 什么是 TCP/IP? TCP/IP 是供已连接因特网的计算机进行通信的 ...

  2. BZOJ 1096&colon; &lbrack;ZJOI2007&rsqb;仓库建设 &lbrack;斜率优化DP&rsqb;

    1096: [ZJOI2007]仓库建设 Time Limit: 10 Sec  Memory Limit: 162 MBSubmit: 4201  Solved: 1851[Submit][Stat ...

  3. 【XLL 框架库函数】 TempActiveRow&sol;TempActiveRow12

    创建一个包含所有激活工作表行的 XLOPER/XLOPER12 LPXLOPER TempActiveRow(WORD row); LPXLOPER12 TempActiveRow12(ROW row ...

  4. wordpress stratus模板使用 产品显示问题

    产品不显示,只显示展示产品代码. 1.研究原站demo,思考产品展示调用自woocommerce. 2.查看woocommerce文档,更新展示代码. 3.修改后产品出现,但是多余的关联推荐也展示出来 ...

  5. odoo定时任务

    python代码 # -*- encoding: utf-8 -*- from openerp.osv import fields, osv, orm import logging _logger = ...

  6. 循环 wxl

    #include <cstdio> #include <cstring> #include <string> #include <algorithm> ...

  7. Android 4&period;4KitKat AudioRecord 流程分析

    Android是架构分为三层: 底层      Linux Kernel 中间层  主要由C++实现 (Android 60%源码都是C++实现) 应用层  主要由JAVA开发的应用程序 应用程序执行 ...

  8. AMQ学习笔记 - 01&period; 相关背景

    概述 介绍中间件.MOM.JMS.ActiveMQ,及相互的关系. 中间件 由于业务的不同.技术的发展.硬件和软件的选择有所差别,导致了异构组件或应用并存的局面.要使这些异构的组件协同工作,一个有效的 ...

  9. poj 2135 Farm Tour 最小费用最大流建图跑最短路

    题目链接 题意:无向图有N(N <= 1000)个节点,M(M <= 10000)条边:从节点1走到节点N再从N走回来,图中不能走同一条边,且图中可能出现重边,问最短距离之和为多少? 思路 ...

  10. WIN7 Wireshark&colon; There are no interfaces on which a capture can be done

    有的时候我们在Windows7的环境下使用Wireshark的时候,比如点击[Interface List]的时候,出现错误. 错误内容如下: There are no interfaces on w ...