Python编码格式导致的csv读取错误(, pandas.csv_read)

时间:2025-02-20 07:21:18

本文记录python小白我今天遇到的这两个问题(和pandas.csv_read):

  • pandas模块“CParserError: Error tokenizing data. C error: Expected 1 fields in line 4, saw 2”错误
  • csv模块“line contains NULL byte”错误

今天处理数据时疏忽了,而且还偷懒把数据复制到xlsx保存后,直接修改文件后缀成.csv准备用来读取。之后运行算法要读数据的时候果然问题来了。

import pandas as pd
path = ''
df=pd.read_csv(path)

注:后两行可写作df=pd.read_csv('')。但由于read_csv本身有好多参数(虽然这里不用), 故写成path习惯好些。
这样会报错CParserError: Error tokenizing data. C error: Expected 1 fields in line 4, saw 2

我在网上查了好多种解决办法,由于read_csv的参数很多,所以各有其词,我这里遇到的应该也只是其中一种,久寻无果。直到我看到这里说看了模块_csv.c的代码后,发现文件里不能有 “\