Python 读写txt文件中文简单处理

本文以txt 文本为例，只是介绍ANSI，Unicode，UTF-8 三种编码的文件的读写过程，对于编码不做深究了

一、用记事本另存为时，可以选择保存文本使用的的几种编码模式，分别为：

Python对于读取的txt文件，最好在读取的时候进行decode成unicode编码，

def read_out(self):
    with codecs.open(self.filename, 'r+') as get:
        return get.read().decode('gbk')

然后再写入的时候进行encode成对应想要的编码类型，这样可以保证源文件的编码方式不会改变，且中文不会乱码

整个代码过程保持使用unicode编码方式利用try…except 来进行编码判别具体使用了那种编码方式

f.write(self.filename.encode('gbk'))

二、对于raw_input 通过键盘输入的文字，通过sys模块中的stdin.encodeing来进行解码

content = raw_input().decode(sys.stdin.encoding)

type(content) 是unicode

暂时这么多

秒客网