大家都知道,json_encode通常会把json中的汉字转义成unicode,但是这并不一定是我们想要的。有时候,我们需要获得汉字形式的json字符串,比如需要获得gbk编码的json字符串(只要把汉字形式的字符串转码就可以得到了)。有什么好办法么?
php官方听到了这个需求,并提供了一种可靠的解决方案:JSON_UNESCAPED_UNICODE。这个参数可以保证json_encode不再将汉字转为unicode。
似乎这样就解决了?当我们高高兴兴的用这个参数的时候,发现并没有什么卵用。仔细一看,这个参数只有5.4之后的php支持。那更早期的php怎么办呢?
社区提供了一种方案:
1
2
3
4
5
|
function my_json_encode( $arr ){
//convmap since x char codes so it takes all multibyte codes (above ASCII ). So such characters are being "hidden" from normal json_encoding
array_walk_recursive ( $arr , function (& $item , $key ) { if ( is_string ( $item )) $item = mb_encode_numericentity( $item , array (x, xffff, , xffff), 'UTF-' ); });
return mb_decode_numericentity(json_encode( $arr ), array (x, xffff, , xffff), 'UTF-' );
}
|
不过这种方法只有5.3才支持,因为5.2并不支持匿名函数。至于解决办法?把匿名函数定义一下即可。
ps:解决json_encode中文UNICODE转码问题
用PHP的json_encode来处理中文的时候, 中文都会被编码, 变成不可读的, 类似”\u***”的格式,如果想汉字不进行转码,这里提供三种方法
1.升级PHP,在PHP5.4, 这个问题终于得以解决, Json新增了一个选项: JSON_UNESCAPED_UNICODE, 故名思议, 就是说, Json不要编码Unicode.
1
2
3
|
<?php
echo json_encode( "中文" , JSON_UNESCAPED_UNICODE);
//"中文"
|
2.把汉字先urlencode然后再使用json_encode,json_encode之后再次使用urldecode来解码,这样编码出来的json数组中的汉字就不会出现unicode编码了。
1
2
3
4
5
6
|
$array = array (
'test' =>urlencode( "我是测试" )
);
$array = json_encode( $array );
echo urldecode( $array );
//{"test":"我是测试"}
|
3.对unicode码再进行解码,解码函数如下:
1
2
3
4
5
6
7
8
9
|
function decodeUnicode( $str )
{
return preg_replace_callback( '/\\\\u([0-9a-f]{4})/i' ,
create_function(
'$matches' ,
'return mb_convert_encoding(pack("H*", $matches[1]), "UTF-8", "UCS-2BE");'
),
$str );
}
|