这篇文章,主要是记录我在使用pandas读取tsv文件时遇到的一个问题。
pandas模块“CParserError: Error tokenizing data. C error: Expected 4 fields in line 1250, saw 5”错误
在网上看了一位大佬的文章,发现他给的解决方案就是修改文件格式。可是根据他的解决方案,并没能解决我的问题。而且这个错误的字面意思,似乎是在tsv文件的1250行只需要4个区域,实际上却有五个。
于是我便使用execl打开了这个tsv文件。
结果发现在1250行,真的有五个区域。似乎是制表符出现了问题。
在经过添加制表符,依旧没有任何变化的情况下。
我选择了最简单的删除大法。
直接将出现的问题的部分删除即可。