文件的编码格式问题

问题：当利用pandas读取csv文件时，由于文件中含有中文，导致程序发生如下报错：UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xca in position 0: invalid continuation byte，代码如下：（由于read_csv,encoding参数的默认编码方式为utf-8，即英文的方式）
import pandas as pd
data = pd.read_csv(‘C:\Users\binbin.liu\Desktop\ttdata.csv’,encoding=’gbk’)
print(data)
解题：在read_csv后面的参数中增加encoding=’gbk’；
import pandas as pd
data = pd.read_csv(‘C:\Users\binbin.liu\Desktop\ttdata.csv’,encoding=’gbk’)
print(data)

秒客网

文件的编码格式问题

相关文章