python的u'字符串"(字符编码):字符串前有u,表示字符串以unicode格式存储

时间:2023-01-14 19:29:00

举个例子

>>> s = u'\u6ce8\u91ca'
>>> s
u'\u6ce8\u91ca'
>>> print s
注释
>>> print type(s)
<type 'unicode'>
>>> print s.encode('gbk')
注释

字符串前加u表示为unicode编码,而当前文本的unicode编码 可以设定,

比如utf-8编码就是第一行加上:

# -*- coding: utf-8 -*-

而gbk编码为

# -*- coding: gbk -*-

参考

python中文编码

详细的python编码内容

如例子

"我是中文".decode("GBK").encode("GBK")
#输出‘\xce\xd2\xca\xc7\xd6\xd0\xce\xc4′

可以参考

http://www.crifan.com/python_already_got_correct_encoding_string_but_seems_print_messy_code/