python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multib

时间:2024-04-04 13:34:09

python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multib

在python3读取txt文件时,遇到上面问题是因为: txt文件存的是utf8编码,打开文件的时候没有指定编码,文件虽然是utf8编码,但是在计算机里面存储的还是unicode编码数据,即计算机是将文件的内容按照utf8编码成unicode后存到了硬盘上,而现在执行f.read()的时候,因为没有指定编码,f.read()可能是发现文件中有中文,所以按照gbk来试图将unicode解码,但是因为文件本身是utf8的,所以解码失败。

修改方法1:

FILE_OBJECT= open('aaa.txt','r', encoding='UTF-8') 1 修改方法2:

FILE_OBJECT= open('aaa.txt','rb') 1 建议使用第一种,定义数据读取的编码,第二种会以二进制的方法读取数据,会给后面带来麻烦。 --------------------- 作者:CZ626626 来源:CSDN 原文:https://blog.csdn.net/cz626626/article/details/71083309 版权声明:本文为博主原创文章,转载请附上博文链接!