Python 中文处理 UTF-8

时间:2022-04-19 20:20:39
#python处理中文三种方式:
#'#coding=utf-8'使用utf-8编码#coding=utf-8
# 假设name为str类型
#print name.decode('utf-8')
#print name.encode('utf-8')
#http://farmdev.com/talks/unicode/

#

在使用Python的过程中经常会出现一些编码问题:

比如:


SyntaxError: Non-ASCII character '\xe5' in file  

解决方法为:在.py代码第一句加上如下内容即可:

#coding=utf-8或者#coding:utf-8或者# -*- coding:utf-8 -*-"

以上表示:这是用来说明你的Python源程序文件用使用的编码。缺省情况下你的程序需要使用ascii码来写,但如果在其中写中文的话,python解释器一般会报错,但如果加上你所用的文件编码,python就会自动处理不再报错。


如果打印的内容出现u'\u54c8\u54c8类型问题  可以试试如下方法:theStr.encode('utf-8')或者heStr.decode('utf-8')或者如下

import sys

reload(sys)

sys.setdefaultencoding('gbk')

当然如果使用IDE的话,别忘了设置UTF-8编码之类的


关于编码问题,还可参考这篇文章,国外牛人写的,而且挺有意思的:http://farmdev.com/talks/unicode/