文件的编码格式问题

时间:2022-05-31 17:33:46

问题:当利用pandas读取csv文件时,由于文件中含有中文,导致程序发生如下报错:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xca in position 0: invalid continuation byte,代码如下:(由于read_csv,encoding参数的默认编码方式为utf-8,即英文的方式)
import pandas as pd
data = pd.read_csv(‘C:\Users\binbin.liu\Desktop\ttdata.csv’,encoding=’gbk’)
print(data)
解题:在read_csv后面的参数中增加encoding=’gbk’;
import pandas as pd
data = pd.read_csv(‘C:\Users\binbin.liu\Desktop\ttdata.csv’,encoding=’gbk’)
print(data)